분류 전체보기 14

논리적 추론

최원배 저자 추론이란 무엇인가라는 책을 읽고 배운점들을 적어본다.주로 읽은 부분은 3장의 명제논리 추론이었다.이야기는 아주 단순하게 시작된다. 명제는 어떻게 구분되는가다.명제는 기본적으로 단순명제와 복합명제로 나눠진다.내용은 단순하다. 단순명제는 그 자체로 참 거짓의 논리값을 가질 수 있는 명제다.복합명제는 단순명제가 연결사로 연결된 형태의 명제다.연결사로는 ~아니다, ~이고 ~, ~ 또는 ~, ~이면 ~이다. 가 있다.보통 연결사를 접속사처럼 여길 수 있다는 측면에서 '~아니다'가 연결사에 포함된다는 점이 흥미롭다.책에서는 '~아니다'를 연결사라고 설명하는데 있어 단순명제와 결합되어 새로운 논리값을 가질 수 있는 명제라는 점에서 연결사라고 하면서 설득한다.이제 단순명제에 대한 예를 들어보자. 영희는 3..

기타 2024.07.24

기계학습이란 무엇인가?(3) - 최대 가능도 방법

이전 포스팅에서는 확률론을 기반으로 기계학습이 해야할 것은 결국 확률 변수간 관계를 찾아내는 것이고 그것이 확률변수의 확률 분포를 알아내는 것으로 가능하다고 했다. 그 다음으로는 기계가 어떻게 확률분포를 알아낼 것인가를 알아야 할것이다. 여기서부터 주로 연속 확률 변수에 대한 확률 분포를 알아보는 일에 대해 얘기한다. 기계가 알 수 있는 정보는 주어진 데이터 뿐이다. 이것이 나타난 원래 확률분포에 대한 정보는 기계가 알 방법이 없다. 이 때 만약 연속 확률 변수에 대해 확률분포를 알아내는 방법은 이전 포스팅에서 했던 것 처럼 단순히 구간별로 빈도수를 측정하고 전체 데이터 수로 나눠서 구간별 확률을 얻어보는 것이다. 이런걸 히스토그램이라고 부른다. 히스토그램 방법의 문제는 구간을 너무 작게 잡으면 구간당 ..

DL,ML Basic 2024.07.23

기계학습이란 무엇인가?(2) - 확률론

이전 포스팅에서 머신러닝이 어떤 문제에 관심을 갖는지 간단하게 살펴보았다. 요약하자면 관찰대상이 많고 각 대상의 변화의 폭이 매우 넓은 상황에서 각 관찰 대상간의 관계를 조사하는 학습 행위를 기계가 하도록 만드는 방법이 있을지 탐구하는 것이 기계학습이다. 이번에는 기계가 학습한다는 것이 어떤 의미를 갖는지 알아보자.  기계가 학습을 한다는 개념이 상당히 받아들이기 어렵게 느껴질 수 있다. 이에 대해 추상적으로 생각하려고 하면 오히려 답이 잘 나오지 않는다. 목표는 이전 포스팅과 위에서 설명한 대로 관찰 대상(앞으로는 변수 또는 확률 변수라고 부를 것이다.)의 관계를 파악하는 가장 구체적으로 표현가능한 방법을 찾는 것이다. 관찰 대상간의 관계를 파악한다는 것이 무엇을 의미하는 것일까? 그것을 명백히 표현하..

DL,ML Basic 2024.07.23

기계학습이란 무엇인가?(1)

가장 인간 본연의 욕구를 중심으로 기계학습의 정체에 대해 접근해보자.우리는 눈에보이는 것들을 생존과 번영을위해 분류하고 현상들 간의 관계를 파악하는 것들을 많이 해왔다.예를 들면, 신선한 사과와 썩은 사과를 보는 것으로 구분하고 그것을 먹을 수 있는지 아닌지 구분할 수 있다. 적절하게 구분할 수 있는 능력이 없는 학습 수준에 있는 인간은 과거에 생존에 불리하고 도태되었을 것이다.그리고 나이에 따른 평균적인 신체 크기를 고려할 수 있다. 5살이면 100cm가 안되고, 10살쯤에는 130cm, 15살쯤에는 170cm쯤 되는 신장을 가질것으로 보통 기대할 수 있다. 그리고 키와 나이의 관계를 통해서 나이를 가늠해볼 수도 있다.이런 단순한 것 외에도 우리는 다양한 사실들을 끊임없이 경험하면서 미래에 일어날 일을..

DL,ML Basic 2024.07.22

분석 실습1 : MNIST데이터의 FFN 분류모델

이전의 MNIST데이터 로딩과 다양한 tf.data.Dataset의 사용법에 대해 알아보았다. 이번에는 그렇게 로드된 데이터셋을 keras모델에 어떻게 삽입할지가 중요한 배울점 중에 하나다. 그리고 기본적으로 딥러닝 모델로 뭘 하려는 것인지 정확하게 짚고 넘어가고자 한다. 0. 복습이전 포스팅에서 MNIST 데이터를 로드하는 방법을 알아봤는데 핵심적으로 패키지 임포트, 로드, 반복적 접근, 반복 접근 벤치마킹, 기초적 시각화 방법에 대해 알아봤다. tensorflow_datasets라는 패키지에서 데이터 셋을 로드하는 함수에 접근할 수 있다. 반복적 접근을 위해 로드된 데이터셋 객체를 for loop에 넣어주기만 하면 되었고, 각 example의 형식을 dict로 할 것인지 tuple로 할 것인지 지정할..

Tensorflow datasets package introduction

앞으로 기본적인 데이터 또는 kaggle에서 제공하는 데이터들에 대한 분석을 통해 예측모델을 만들거나 분포모델을 만들거나 여러 시도들을 해볼 것이다. 그전에 텐서플로우에서 제공하는 기본적인 데이터에 접근하는 방법에 대해 알아둔다면 앞으로의 실습에 도움을 받을 수 있을 것이기 때문에 가장 앞서서 tensorflow-datasets라는 python 패키지에 대해 입문하는 글을 작성하면서 배워보려고 한다. 0. tensorflow-dataset 패키지이 패키지는 분석을 시도해볼 수 있는 다양한 데이터들을 제공한다. 나는 기본적으로 MNIST 손글씨 데이터를 얻기 위해서 찾던 도중에 발견했다. 살펴보면 이미지 분류 모델에 필요한 지도학습 데이터뿐만 아니라 이미지 클러스터링, 자연어에 대한 데이터 등 여러 AI분..

5/29 Lovesey et al. Ch.8.4 Dichroism

여기서는 주로 polarization dichroism을 다룬다. 그것은 polarization에 따라 샘플을 투과한 빛의 세기가 달라지는 것을 말한다. Wikipedia에 의하면 분자구조에 chirality가 있다면 right or left circular polarization을 넣고 투과량을 비교하는 CD(circular dichroism)실험을 했을 때 차이가 생긴다고 한다. 만약 종이 같은 amorphous한 물질로 CD 실험을 한다고 해서 각 polarization마다 차이가 발생할 것으로 생각되지는 않는다. 이처럼 샘플의 chirality 같은 특수한 성질을 밝히는 데 CD 실험을 할 수 있을 것이다. 물론 샘플 두께와 투과성(scatterer 사이의 거리가 그것의 크기보다 꽤 큰 경우 \(..

3eq 2023.05.30

5/22~28 Lovesey et al. X-ray scattering

Lovesey et al. X-ray scattering and absorption by magnetic material. Ch8. Theoretical Framework 1. Differential cross-section $$ \frac{d\sigma}{d\Omega} = \frac{mr_e^2}{m^*}\frac{q'}{q} |\bra{\mu'} \vb{G} \ket{\mu}|^2 $$ Differential cross-section은 Fermi's golden rule에 의해 transition rate를 계산하고, flux로 나누면 얻을 수 있다. (Flux) * (반응면적) = (시간당 반응량) 이어야 되기 때문이다. 따라서 transition probability matrix element의..

3eq 2023.05.28