Unsupervised Learning (비지도 학습)
한마디로 자기주도학습. 과외 선생님이 알려준 방식대로 공부하지 않고, 내가 직접 답을 찾는다.
데이터의 특성 (Feature)과 그에 대한 정답값 (Label)을 통해 모델을 훈련하는 지도학습과는 달리, 비지도 학습 (Unsupervised Learning)은 인풋값만 주어진채, 모델이 데이터에서 패턴이나 구조를 스스로 발견하도록 하는 과정을 의미한다.
비지도 학습 모델의 훈련 데이터에 레이블이 없다. 알고리즘은 데이터 안에서 구조 (structure)를 스스로 학습한다. 쫌 멋지다.
Unsupervised Learning Algorithms (비지도 학습 알고리즘)
1) Anomoly Detection (이상치 탐지)
정의
이상치 탐지 알고리즘은 데이터셋에서 이상한 값을 자동으로 발견한다. 학습 알고리즘에 주입하기 전 데이터셋 (dataset)에서 이상한 값을 자동으로 제거하는 것 등이다.
시스템은 훈련하는 동안 대부분 정상 샘플을 만나 이를 인식하도록 훈련되고, 그 다음 새로운 샘플을 보고 정상 데이터인지 혹은 이상치인지 판단한다.
일상속 예시
신용카드 부정거래 방지. 한국인 신용카드 사용자가 갑자기 브라질에서 결제를 할 경우, 이상치로 탐지되어 신용카드사에서 전화가 갈 수 있다 (경험담).
2) Clustering (군집)
군집 알고리즘은 유사한 데이터포인트끼리 묶어 군집을 만드는 알고리즘이다. 보다 구체적으로, 정답이 없는 데이터셋 (dataset) 안에서 숨어있는 패턴 혹은 그룹을 찾아내 묶는 것이라고 할 수 있다.
일상속 예시
- Customer Segmentation - 고객군 묶기. 고객 그룹을 서로 다른 섹터로 분류해 다른 마케팅 전략을 활용한다.
- 구글/네이버 뉴스 - 같은 내용을 다루는 기사끼리 묶어서 사용자에게 제공한다.
3) Dimensionality Reduction (차원 축소)
차원 축소 알고리즘은 데이터를 간소화하는 역할을 한다. 이를 해내는 방법 중 하나는 상관관계가 있는 여러 특성을 하나로 합치는 것이라고 한다.
출처
- Unsupervised Learning Part 1 & 2, Coursera, Andrew Ng
- 핸즈온 머신러닝
'Machine Learning (인공지능) > 기초' 카테고리의 다른 글
| [ML] Neural Network (인공 신경망)이란? (0) | 2026.01.03 |
|---|---|
| [ML] Vectorization (벡터화) (0) | 2025.10.10 |
| [ML] 지도 학습의 데이터셋과 모델 훈련 (Feature, Label, Training) (0) | 2025.10.05 |
| [ML] 지도 학습 (Supervised Learning)의 정의와 종류 (0) | 2025.10.04 |
| [ML] 머신러닝 시스템의 구분 (0) | 2025.10.04 |