728x90
320x100
03 머신러닝의 기초를 다집니다 - 수치예측(1)
03-1 선형 회귀에 대해 알아보고 데이터를 준비합니다
선형 회귀(Linear Regression) : Linear 함수의 기울기와 절편을 찾아준다 > 이는 곧 선형(Linear) 함수 그 자체를 찾아준다는 뜻과 같다.
회귀(Regression) : 두 변수 x와 y의 관계(함수) 추론
따라서 선형 회귀란, 입력(x)-타겟(y)으로 이루어진 데이터셋을 통해 그 관계(함수)를 선형으로 도출하는 것이라고 볼 수 있다.
from sklearn.datasets import load_diabetes
diabetes = load_diabetes()
print(diabetes.data.shape, diabetes.target.shape)
#(442, 10) (442,)
즉, data set은 442*10 크기의 2차원 배열(행렬)이고, target set은 442개의 요소를 갖는 배열이다.
여기서 행은 샘플(sample)이고, 열은 샘플의 특성(feature)이다.
특성은 속성, 독립변수(independent variable), 설명 변수(explanatory variable) 등으로 부르며, ML에서는 일반적으로 특성이라고 부른다.
각 데이터가 무엇을 의미하는지 반드시 알아야하는 것은 아니다. 말그대로 우리는 선형회귀를 통해 관계성만 찾아내면 그만이기 때문이다. 그러나, 실전에서는 그 의미를 아는 것이 중요해질 수도 있으므로 해당 분야의 전문가(domain 전문가)의 도움을 받는 것이 필요할 수도 있다.
import matplotlib.pyplot as plt
plt.scatter(diabetes.data[:, 2], diabetes.target) #data set에서 3열의 값만 추출하여 x에 대응시킴
plt.xlabel('x')
plt.ylabel('y')
plt.show()
728x90
반응형
'Learning-Log > Computer Science' 카테고리의 다른 글
[Youtube] But what is a neural network? | 딥러닝(1) (0) | 2022.02.05 |
---|---|
[Do it ! 정직하게 코딩하며 배우는 딥러닝 입문] 3장 머신러닝의 기초를 다집니다 - 수치예측(2) (0) | 2022.02.04 |
[Do it ! 정직하게 코딩하며 배우는 딥러닝 입문] 2장 최소한의 도구로 딥러닝을 시작합니다 (0) | 2022.02.04 |
[Do it ! 정직하게 코딩하며 배우는 딥러닝 입문] 1장 딥러닝을 소개합니다 (0) | 2022.02.04 |
VSCode 에서 이모지(emoji) 쓰는 법 (0) | 2021.12.28 |