1. 패션 MNIST 데이터셋 저장 load_data()는 훈련 데이터와 테스트 데이터를 나누어 반환함 28x28크기인 이미지가 6만개 있고, 타깃은 1차원 배열에 6만개의 원소가 있다 훈련 데이터에서 몇 개의 샘플을 그림으로 출력 처음 10개 샘플의 타깃값을 리스트로 만든 후 출력 패션 MNIST의 타깃은 0~9까지의 숫자 레이블로 구성되어있으며, 앞서 출력한 이미지를 보면 마지막 5,5는 같은 종류의 신발이란 것을 알수있다. 넘파이 unique() 함수로 레이블 당 샘플 개수를 확인 0~9까지 레이블마다 정확히 6,000개의 샘플이 들어 있는 것을 볼 수 있다. 2. 로지스틱 회귀로 패션 아이템 분류 1. reshape() 메서드를 사용해 2차원 배열인 각 샘플을 1차원 배열로 펼친다. (SGDCla..
인공지능 교육/머신러닝
위의 그래프에서 무게가 상승하면 해당무게에 속한 직선의 사이즈만 가져와 상승시킨다. 이를 모든 데이터 하나하나에 적용시키는 방법이 Ridge 회귀 Linear 회귀 : 직선, 즉 일차함수의 개념인 y=ax+b직선을 임의로 그려놓고, 그 직선을 바탕으로 예측 위의 사진에서 초록색직선이 예측을 더 잘한다고 볼 수 있음. Gradient Descent https://nittaku.tistory.com/284
seed는 알고리즘의 번호를 의미하며 해당 알고리즘을 가져온다는 뜻이다. np.random.seed를 고정시키면 해당 알고리즘을 가져와서 뿌려주기 때문에 나오는 값이 같다. 로지컬이 예측이 안되므로 랜덤이라고 하며, 우리가 아는 랜덤과는 다르고 진짜 랜덤이라고 보기 어렵다. Q.그렇다면 이런 알고리즘(설계도)를 가져오는 랜덤을 써야하나? 굳이 그렇지 않고 우리가 흔히 아는 랜덤을 가져오는 알고리즘을 짤수있다. (새로운 수가 추가되는 방식이라던지) 그러나, 대부분의 경우 그럴 필요가 없기 때문에 이 방식을 채택하는 것이다. 이를 pseudo 랜덤, 유사난수라고 한다.