Yiksan0315's Blog

Bias

# Tag:

  • Source/KU_ML

Bias

Estimation의 Expectation과 실제 Population Parameter(참 값) 간의 차이.

  • : Estimation, : 학습 데이터에 다라 달라지는 추정값.
  • : 참 된 모수(Population Parameter) (모집단 평균, 분산 등)

Unbiased estimator: , 어떠한 추정량에 대해 Bias가 0인 model을 말한다.

For Sample

Bias of Sample Mean

sample mean: 이므로,

Unbiased estimator: , 즉, sample mean에 대한 bias는 항상 unbiased임을 의미한다.

Bias of Sample Variance

sample variance: 이므로,

|589

  • 수정수정

  • Expected value of :

Biased estimator:

Bias of Machine Learning

모델이 학습할 때 단순화 오류, 혹은 모델이 얼마나 편향되어서 패턴을 보는지.

또는 실제 참 값과 얼마나 predict한 값의 거리가 큰 지. 패턴을 단순화한 정도를 나타내며, 너무 단순화하면 데이터의 복잡성을 충분히 반영하지 못한다(underfitting). Sample Variance의 Expecatation식에서 알 수 있듯이, Variance와 Trade-off 관계에 있다.

에 따라, 이 되며, 이는 Train Data이 증가함에 따라 Bias가 줄어듬을 의미한다. 다만, 이에 따라 Variance가 증가하면서 Overfitting문제로 이어지는 것에 주의해야 한다.

toc test

이 페이지는 리디주식회사에서 제공한 리디바탕 글꼴이 사용되어 있습니다. 리디바탕의 저작권은 리디주식회사가 소유하고 있습니다.

This Font Software is licensed under the SIL Open Font License, Version 1.1.

Copyright 2025. yiksan0315 All rights reserved.