이전 포스팅에서는 확률론을 기반으로 기계학습이 해야할 것은 결국 확률 변수간 관계를 찾아내는 것이고 그것이 확률변수의 확률 분포를 알아내는 것으로 가능하다고 했다. 그 다음으로는 기계가 어떻게 확률분포를 알아낼 것인가를 알아야 할것이다. 여기서부터 주로 연속 확률 변수에 대한 확률 분포를 알아보는 일에 대해 얘기한다. 기계가 알 수 있는 정보는 주어진 데이터 뿐이다. 이것이 나타난 원래 확률분포에 대한 정보는 기계가 알 방법이 없다. 이 때 만약 연속 확률 변수에 대해 확률분포를 알아내는 방법은 이전 포스팅에서 했던 것 처럼 단순히 구간별로 빈도수를 측정하고 전체 데이터 수로 나눠서 구간별 확률을 얻어보는 것이다. 이런걸 히스토그램이라고 부른다. 히스토그램 방법의 문제는 구간을 너무 작게 잡으면 구간당 ..