728x90
반응형
특징 벡터 각 특징들을 모아서 하나의 vector로 만든 것, 차원으로 표현한다.
x=(x1, x2, x3, .... , xd) -> d차원 특징 벡터를 가짐
원-핫 인코딩: 집합의 크기를 벡터의 차원으로 하고, 표현하고 싶은 인덱스에만 1을 부여하고, 나머지는 0으로 하는 것.
SVM: 유명한 기계 학습 모델
fit: 학습
predict : 예측
train:모델 학습용
test: 모델 측정용
규칙기반: 코딩으로 조건을 통해 분류, 비효율적
기계학습: 분류는 직접, 규칙만들기는 자동으로
딥러닝: 신경망 방식, 분류와 규칙만들기 모두 자동화 +데이터 수집도 자동화?
머신러닝의 과정:
data수집-> feature 추출-> model 생성 -> predict
overfit(과잉 적합): 오류를 과하게 허용하는 모델을 생성할 시 실제 테스트에서 성능이 저하된다.
=> 모델의 일반화 능력도 성능의 중요한 지표이다. 따라서 오류에 대한 적절한 타협 및 조정이 필요하다.
혼돈 행렬, confusion matrix 평가 지표 FN, TN, FP, TP 그거..
data를 train/test/검증용으로 나누는 것
교차검증, k-fold cross validation
C 크게: 오분류 적아지고, 여백 작아짐 -> 일반화 별로
C 작게: 오분류 많아지고, 여백 커짐 -> 일반화 굿
SVM: 서포트 벡터 머신,
결정트리: 트리구조로 규칙을 통해 데이터 분류, 회귀
랜덤 포레스트: 다수의 결정트리로부터 분류 또는 평균 예측
728x90
반응형
'공부 > <파이썬으로 만드는 인공지능>' 카테고리의 다른 글
Ch5 딥러닝과 텐서플로 (1) | 2023.10.15 |
---|---|
Ch4 신경망 기초 (1) | 2023.10.08 |
Ch2 파이썬으로 시작하는 인공지능 (1) | 2023.10.07 |
머신러닝 visual studio 닷넷 ML.NET (0) | 2023.10.04 |
Ch1 인간 지능을 흉내 내는 인공지능 (0) | 2023.09.05 |