[ML] Logistic Regression

728x90

Simple Classification 문제점
- binary classification 문제에서 임의의 선을 그었을 때 어떤 선도 두 개의 클래스를 분류할 수 없는 경우 error fuction이 계단 함수 모양이 되므로 특정 부분에서 미분이 불가능함
확률 관점에서 계산 필요
- Simple Classification은 1 또는 0 두 개의 값 중 하나만 가지게끔 판단했음
- Linear Classification은 0에서 1 사이의 특정 값을 가지는 형태로 가설 함수를 표현함 → sigmoid 또는 logistic function
  1. data가 positive sample이면 주어진 data에 대해서 확률이 최대화되는 방향으로 w값 결정
  2. data가 negative sample이면 주어진 data에 대해서 확률이 최소화되는 방향으로 w값 결정
sigmoid/logistic function 장점
1. 기존 가설 함수의 경우 miss classification 되었을 때 각각의 값이 동일한 가중치를 가지지만 sigmoid/logistic function의 경우 가중치를 두어 표현할 수 있음
2. 기존 가설 함수의 경우 특정 구간에서 미분이 불가능하지만 sigmoid/logistic function의 경우 모든 점에서 미분이 가능함 → maximum likehood estimation으로 확률을 부여할 때 특정 예외처리 없이 모든 지점에서 미분하여 w값을 구할 수 있음

logistic regression은 closed form이 존재하지 않으므로 numerical solution을 활용해야 함
gradient descent를 이용하여 global optima에 근접해 가는 해를 찾을 수 있음
- gradient descent : 임의의 w값을 지정하여 gradient를 계산하고 최종적으로 0이 되는 지점을 찾는 방법
maximum likehood estimation를 이용해서 w값을 찾을 수 있음
- positive sample인 경우 y=1일 확률로 w값이 최대가 되도록 조정
- negative sample인 경우 y=0일 확률로 w값이 최소가 되도록 조정 → 전체에서 1이 될 확률을 뺌

728x90

[ML] Overfitting Problem (0)	2024.01.31
[ML] Multinomial Logistic Regression (1)	2024.01.04
[ML] Parameter Estimation (0)	2023.11.14
[ML] Classification (0)	2023.11.09
[ML] Numerical Solution (0)	2023.11.09

Home