생선 데이터, 렌덤으로 섞기 numpy, KNeighborsClassifier

728x90

KNeighborsClassifier

k-최근접 이웃 모델을 이용하여 머신러닝을 진행해보겠습니다.

fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0,

31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0,

35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0, 9.8,

10.5, 10.6, 11.0, 11.2, 11.3, 11.8, 11.8, 12.0, 12.2, 12.4, 13.0, 14.3, 15.0]

fish_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, 500.0, 390.0, 450.0, 500.0, 475.0, 500.0,

500.0, 340.0, 600.0, 600.0, 700.0, 700.0, 610.0, 650.0, 575.0, 685.0, 620.0, 680.0,

700.0, 725.0, 720.0, 714.0, 850.0, 1000.0, 920.0, 955.0, 925.0, 975.0, 950.0, 6.7,

7.5, 7.0, 9.7, 9.8, 8.7, 10.0, 9.9, 9.8, 12.2, 13.4, 12.2, 19.7, 19.9]

#2차원 리스트로 만들기

fish_data = [[l, w] for l, w in zip(fish_length, fish_weight)]

fish_target = [1]*35 + [0]*14

먼저 학습데이터와 평가를 위한 테스트 데이터로 분류를 해보겠습니다.

#샘플링 편향방지를 위해 데이터를 섞어서 학습 -> 테스트

import numpy as np

input_arr = np.array(fish_data)

target_arr = np.array(fish_target)

print(input_arr.shape)

print(fish_target)

(49, 2) [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

렌덤하게 섞어주어야 편향없이 학습됩니다.

#렌덤 함수만들기

np.random.seed(43) #43번으로 지정하여 동일한 값을 얻을 수 있도록 작성

index = np.arange(49)

np.random.shuffle(index)

print(index)

[ 6 26 33 13 14 38 18 31 22 5 40 44 7 19 36 8 28 20 32 9 43 10 39 15 24 12 41 45 29 48 46 3 42 37 34 1 25 11 35 47 23 30 2 27 17 16 21 0 4]

print(input_arr[[2,6]])

[[ 26.5 340. ] [ 29.7 500. ]]

35개의 훈련데이터 만들기

#train 35개

train_input = input_arr[index[:35]]

train_target = target_arr[index[:35]]

print(input_arr[6],train_input[0])

[ 29.7 500. ] [ 29.7 500. ]

14개의 테스트 데이터 만들

#test 14개

test_input = input_arr[index[35:]]

test_target = target_arr[index[35:]]

print(test_input.shape)

(14, 2)

import matplotlib.pyplot as plt

plt.scatter(train_input[:,0], train_input[:,1])

plt.scatter(test_input[:,0], test_input[:,1])

plt.xlabel('length')

plt.ylabel('weight')

plt.show()

from sklearn.neighbors import KNeighborsClassifier

kn = KNeighborsClassifier()

kn.fit(train_input, train_target)

kn.score(test_input, test_target)

1.0

kn.predict(test_input)

array([1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1])

test_target

array([1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1])

잘 맞추는군요 ㅋㅋ

'파이썬 머신러닝ML' 카테고리의 다른 글

생선분류 k-Nearest Neighbors (k-최근접 이웃) (0)	2023.07.30
Linear regression (0)	2023.07.26
생활데이터 간단하게 가공하기 (0)	2023.07.26
AI란 무엇인가? (0)	2023.07.26
TensorFlow (0)	2023.07.25

기호니블로그

생선 데이터, 렌덤으로 섞기 numpy, KNeighborsClassifier

KNeighborsClassifier

'파이썬 머신러닝ML' 카테고리의 다른 글

댓글

티스토리툴바

생선 데이터, 렌덤으로 섞기 numpy, KNeighborsClassifier

KNeighborsClassifier

'파이썬 머신러닝ML' 카테고리의 다른 글

관련글

댓글

티스토리툴바