본문 바로가기
Machine Learning (인공지능)/기초

[ML] 머신러닝 (Machine Learning)의 정의

by muha0-0 2025. 10. 4.

머신러닝의 정의 (What is Machine Learning)

목적

머신러닝 모델은 기본적으로 문제를 해결하는 도구이다. 문제를 명확하게 이해하고, 모델의 작동 방식 및 성능을 파악해 해결하고자 하는 문제에 적절한 모델을 찾아내는 것이 머신러닝의 핵심이다. 머신러닝이 특별히 많이 활용되고 있는 문제들은 아래와 같은 특징을 갖고 있다.
 

머신러닝이 잘 해결하는 문제

1) 기술적으로 많은 수동 조정과 코딩이 필요한 문제: 코딩의 양을 획기적으로 줄여준다
2) 전통적인 방식으로는 해결 방법이 없는 복잡한 문제
3) 환경 및 변수가 끊임없이 변화하는 유동적인 문제
4) 복잡한 문제와 대량의 데이터가 주어졌을 때 
 
 

머신러닝 접근 방법 vs 전통적인 접근 방식

전통적인 프로그래밍 기법을 사용하면 개발자가 직접 규칙을 발견하고, 발견한 패턴을 감지하는 알고리즘을 작성한다. 그 다음 예외 케이스나 오류가 발생했을 때 이를 분석하고 다시 규칙을 작성한다. 예를 들어 영수증에서 병원 이름을 regex match 한다고 생각해보면, 병원의 이름이 사업자로 등록된 방식이 무척 다양하므로, 이를 개발하는 개발자는 규칙을 하드코딩으로 계속해 수정/보완해야할 것이다. 

규칙이 난해할수록, 데이터의 양이 많을수록 이 과정은 지난하고 복잡하고 더뎌진다 (경험담).
 
이와 달리 머신러닝 기법에 기반을 둔 경우, 모델이 훈련을 통해 패턴을 직접 발견하고, 정확도가 높아질 때 까지 스스로 학습한다. 이 경우 프로그램이 훨씬 짧아지고 유지보수하기 쉬우며, 대부분 정확도가 더 높다. 예외 케이스가 발견했을 때 이를 개발자가 직접 하드코딩하지 않고, 모델이 학습을 통해 이를 분류해낼 수 있다. 
 
 

일상속 머신러닝 예시

- 상품추천: 과거 구매 이력 및 고객의 다양한 정보를 기반으로 다음에 구매할 가능성이 가장 높은 상품을 출력. 
- CRM: 구매 이력을 기반으로 고객을 나누고 각 집합마다 다른 마케팅 전략 계획

 

정의

Machine learning is focused on algorithms that can “learn” the patterns of training data and, subsequently, make accurate inferences about new data. This pattern recognition ability enables machine learning models to make decisions or predictions without explicit, hard-coded instructions.
 
머신러닝은 학습 데이터패턴을 “학습”하고, 이를 바탕으로 새로운 데이터에 대해 정확한 추론을 할 수 있는 알고리즘에 초점을 맞추는 인공지능 하위의 연구 분야이다. 이러한 패턴 인식 능력을 통해 머신러닝 모델은 명시적이고 하드코딩된 지시 없이도 의사결정이나 추론을 수행할 수 있다. 

 

머신러닝 '모델'은 알고리즘이 데이터를 '학습'하여 수학적인 패턴을 발견함으로써 생성된다. 머신 러닝 모델이 없이 연구자들이 매우 복잡한 코드를 작성해야했다면, 머신러닝은 스스로 학습해 복잡한 과제를 직접 수행해내는 역할을 해낸다. 

 
 

머신러닝 모델 vs 머신러닝 알고리즘 (Model vs Algorithm)

알고리즘의 정의 

- 정의: 머신러닝 알고리즘 (Algorithm)은 주어진 데이터에서 수학적인 패턴을 찾는 단계적 절차이다.
- 예시: Gradient Descent, Decision Tree Induction, Supporter Vector Machine/SVM, k-means/clustering
- 역할: 알고리즘은 주어진 데이터로 모델의 매개변수 (parameter, e.g. 함수의 형태를 결정하는 상수)를 조정한다
 

모델의 정의

- 정의: 머신러닝 모델 (Model)은 알고리즘을 데이터에 적용하여 얻은 결과물로, 학습된 표현 (representation)으로서 예측을 수행할 수 있다. 
- 예시: 선형회귀선 (a linear regression line with coefficient) , 의사결정 나무, 학습된 가중치를 가진 신경망 
- 역할: 모델은 학습을 통해 얻은 매개변수를 사용하여 예측을 수행하는 배포 가능한 산출물입니다.

 
모델과 알고리즘 활용 예시

중등 수학 수준의 예시로 머신러닝 모델과 알고리즘의 차이를 비교해보자.

알고리즘
선형 회귀 알고리즘, 주어진 데이터에 가장 잘 맞는 직선을 찾아내는 절차

 
역할
경사하강법(Gradient Descent), 최소제곱법(Ordinary Least Squares) 등을 사용해 매개변수(기울기 a, 절편 b)를 조정

 
과정
1) 기울기와 절편을 임의의 값으로 시작
2) 추론으로 발생한 예측값과 실제값의 오차를 계산
3) 오차가 줄어들도록 매개변수 (기울기, 절편)을 조정
4) 오차가 최소화될 때까지 반복

머신러닝 모델
회귀 직선 모델, 학습을 거쳐 생성된 모델
형태
- y=ax+b 
- 알고리즘을 통해 학습된 매개변수로 이루어진 산출물
- 직접 활용해 새로운 데이터를 사용해 추론 및 예측 가능

 
 

모델 기반 학습

모델 기반 학습 (Model based learning)은 샘플을 통해 일반화된 규칙을 발견하고, 새로운 데이터를 예측하는 것을 의미한다. 모델 기반 학습은 모델 선택 (Model Selection), 선택된 모델에 따른 파라미터 (Model Parameter) 정의, 모델 성능 측정 지표 선택으로 이루어져있다. 
 

모델 성능 측정 지표

모델이 얼마나 좋은지 측정하는 효용함수 (utility function, fitness function), 그리고 얼마나 나쁜지 측정하는 비용 함수 (Cost Function)으로 모델의 성능을 정의해 측정할 수 있다. 선형 회귀에는 보통 선형 모델의 예측과 훈련 데이터 사이의 거리를 재는 비용 함수를 사용한다. 이 때는 이 거리를 최소화하는 것이 목표이다. 거리를 줄이기 위해 알고리즘에 데이터를 공급하며 파라미터를 조정하는 과정을 모델 훈련 (training)이라고 부른다. 

 
 
 

 
출처
https://www.softude.com/blog/difference-between-algorithm-and-model-in-machine-learning-development/

Difference Between Algorithm and Model in ML.

Dive into the essentials of machine learning algorithms and models to enhance your AI solutions.

www.softude.com

https://developers.google.com/machine-learning/intro-to-ml?_gl=1*qbwez0*_up*MQ..*_ga*MjAzNzkxMDY0NS4xNzU5NTY4ODUy*_ga_SM8HXJ53K2*czE3NTk1Njg4NTEkbzEkZzAkdDE3NTk1Njg4NTEkajYwJGwwJGgw

머신러닝 소개  |  Machine Learning  |  Google for Developers

ML의 유형, 지도 ML, ML을 사용한 문제 해결 방식이 기존의 접근 방식과 어떻게 다른지 알아보세요.

developers.google.com

https://www.coursera.org/learn/machine-learning (1~2강) 
<핸즈온 머신러닝> 31쪽 - 33쪽, 48-50쪽