본문 바로가기
공부/<파이썬으로 만드는 인공지능>

Ch 3 기계 학습과 인식

by 푸딩코딩 2023. 10. 7.
728x90
반응형

특징 벡터 각 특징들을 모아서 하나의 vector로 만든 것, 차원으로 표현한다.

x=(x1, x2, x3, .... , xd) -> d차원 특징 벡터를 가짐

 

원-핫 인코딩: 집합의 크기를 벡터의 차원으로 하고, 표현하고 싶은 인덱스에만 1을 부여하고, 나머지는 0으로 하는 것.

 

 

SVM: 유명한 기계 학습 모델

 

fit: 학습

predict : 예측

 

train:모델 학습용

test: 모델 측정용

 

 

규칙기반: 코딩으로 조건을 통해 분류, 비효율적

기계학습: 분류는 직접, 규칙만들기는 자동으로

딥러닝: 신경망 방식, 분류와 규칙만들기 모두 자동화 +데이터 수집도 자동화?

 

 

머신러닝의 과정:

data수집-> feature 추출-> model 생성 -> predict

 

overfit(과잉 적합): 오류를 과하게 허용하는 모델을 생성할 시 실제 테스트에서 성능이 저하된다. 

=> 모델의 일반화 능력도 성능의 중요한 지표이다. 따라서 오류에 대한 적절한 타협 및 조정이 필요하다.

 

혼돈 행렬, confusion matrix 평가 지표 FN, TN, FP, TP 그거.. 

 

data를 train/test/검증용으로 나누는 것

 

교차검증, k-fold cross validation

 

 

C 크게: 오분류 적아지고, 여백 작아짐 -> 일반화 별로

C 작게: 오분류 많아지고, 여백 커짐 -> 일반화 굿

 

 

 

 

 

 

 

 

SVM: 서포트 벡터 머신,

결정트리: 트리구조로 규칙을 통해 데이터 분류, 회귀

랜덤 포레스트: 다수의 결정트리로부터 분류 또는 평균 예측

728x90
반응형