DL,ML Basic 4

기계학습이란 무엇인가?(3) - 최대 가능도 방법

이전 포스팅에서는 확률론을 기반으로 기계학습이 해야할 것은 결국 확률 변수간 관계를 찾아내는 것이고 그것이 확률변수의 확률 분포를 알아내는 것으로 가능하다고 했다. 그 다음으로는 기계가 어떻게 확률분포를 알아낼 것인가를 알아야 할것이다. 여기서부터 주로 연속 확률 변수에 대한 확률 분포를 알아보는 일에 대해 얘기한다. 기계가 알 수 있는 정보는 주어진 데이터 뿐이다. 이것이 나타난 원래 확률분포에 대한 정보는 기계가 알 방법이 없다. 이 때 만약 연속 확률 변수에 대해 확률분포를 알아내는 방법은 이전 포스팅에서 했던 것 처럼 단순히 구간별로 빈도수를 측정하고 전체 데이터 수로 나눠서 구간별 확률을 얻어보는 것이다. 이런걸 히스토그램이라고 부른다. 히스토그램 방법의 문제는 구간을 너무 작게 잡으면 구간당 ..

DL,ML Basic 2024.07.23

기계학습이란 무엇인가?(2) - 확률론

이전 포스팅에서 머신러닝이 어떤 문제에 관심을 갖는지 간단하게 살펴보았다. 요약하자면 관찰대상이 많고 각 대상의 변화의 폭이 매우 넓은 상황에서 각 관찰 대상간의 관계를 조사하는 학습 행위를 기계가 하도록 만드는 방법이 있을지 탐구하는 것이 기계학습이다. 이번에는 기계가 학습한다는 것이 어떤 의미를 갖는지 알아보자.  기계가 학습을 한다는 개념이 상당히 받아들이기 어렵게 느껴질 수 있다. 이에 대해 추상적으로 생각하려고 하면 오히려 답이 잘 나오지 않는다. 목표는 이전 포스팅과 위에서 설명한 대로 관찰 대상(앞으로는 변수 또는 확률 변수라고 부를 것이다.)의 관계를 파악하는 가장 구체적으로 표현가능한 방법을 찾는 것이다. 관찰 대상간의 관계를 파악한다는 것이 무엇을 의미하는 것일까? 그것을 명백히 표현하..

DL,ML Basic 2024.07.23

기계학습이란 무엇인가?(1)

가장 인간 본연의 욕구를 중심으로 기계학습의 정체에 대해 접근해보자.우리는 눈에보이는 것들을 생존과 번영을위해 분류하고 현상들 간의 관계를 파악하는 것들을 많이 해왔다.예를 들면, 신선한 사과와 썩은 사과를 보는 것으로 구분하고 그것을 먹을 수 있는지 아닌지 구분할 수 있다. 적절하게 구분할 수 있는 능력이 없는 학습 수준에 있는 인간은 과거에 생존에 불리하고 도태되었을 것이다.그리고 나이에 따른 평균적인 신체 크기를 고려할 수 있다. 5살이면 100cm가 안되고, 10살쯤에는 130cm, 15살쯤에는 170cm쯤 되는 신장을 가질것으로 보통 기대할 수 있다. 그리고 키와 나이의 관계를 통해서 나이를 가늠해볼 수도 있다.이런 단순한 것 외에도 우리는 다양한 사실들을 끊임없이 경험하면서 미래에 일어날 일을..

DL,ML Basic 2024.07.22