수리 공작소

[Pytorch/ 딥러닝] 딥러닝 개요 본문

Major/머신러닝

[Pytorch/ 딥러닝] 딥러닝 개요

suleee 2023. 5. 12. 17:25

[인공지능(Artificial Intelligence)이란?]

인간의 지능적인 능력을 모방하거나 대체하기 위한 기술

[인공지능의 역사 요약]

1950년, 엘런 튜링 (Alan Turing) 의 Turing Test

질의자(사람), 응답자1(사람), 응답자2(컴퓨터)

질의자는 두 응답을 보고 어느 것이 사람이고 어느 것이 컴퓨터인지 판별

-> 여기서 질의자의 판별이 어긋날 수록 컴퓨터는 인간처럼 사고하고 있음을 뜻함.

-> 즉, 시스템에 대한 인공지능의 개입을 사람이 눈치 채지 못 할수록 더 완벽한 인공지능이다.

 

1950-60년대, Perceptron의 등장 및 탐색 추론 영역의 AI 연구 부흥

1958년, Rosenbaltt의 인간의 뇌신경을 모방한 Perceptron 등장 - input과 weight의 개념 도입

 

1968년, Misky와 Papert의 Perceptron 한계 지적과 암흑기 시작

Perceptron으로는 XOR 문제를 해결할 수 없다!

-> 이후에 이는 다층 퍼셉트론으로 해결할 수 있음을 알았지만, 당시의 기술로 다층 퍼셉트론을 구현하는 것은 힘들었다.

 

1986년, Rumelhart의 Multi-Perceptron(다층 퍼셉트론)과 Back Propagation(오류역전파) 제안 

퍼셉트론을 여러겹 쌓아 XOR 문제를 해결할 수 있다!

여기서 사용되는 Back Propagation 알고리즘의 발견.

 

2006년, Hinton에 의해 정식으로 Deep Neural Network 용어 등장

 

 

[AI/ ML/ DL?]

AI/ ML/ DL은 위와 같은 포함관계에 있다. 

AI는 인간처럼 사고하는 기계를 포괄적으로 뜻한다.

ML은 AI 중에서 데이터로부터 얻은 경험을 통해 학습하는 것을 말한다.

DL은 ML 중에서 인간의 뇌를 모방한 인공신경망을 여러 겹 깊게 쌓은 학습 방법이다.

 

[용어 정리]

예측(prediction)이란?

주어진 데이터를 바탕으로 학습한 뒤, 새로운 데이터에 대한 정답을 예측

 

※prediction != forecast

전자는 데이터로 입력된 경험에 의해서만 정답을 예측.

후자는 데이터를 "분석"한 뒤 정답을 예측.

(말이 애매하긴 하다.)

 

모델(model)이란?

데이터(x)와 정답(y)이 주어졌을 때(x, y), 정답을 올바르게 분류 및 회귀하는 기울기와 편향을 구하는 것.

즉, 

y = ax + b에서 a, b를 구하는 것.

 

이 직선은 "결정 경계"라고 함.

 

※ 왜 직선을 이용? 곡선 이용하면 더 정확하지 않나?

NO. 일반적인(generality) 경우를 나타내는 것은 직선이 더 적합하다. 어쩌다가 튀어나온 한 데이터 때문에 부분 부분 곡선으로 변형시킨다면 오히려 전반적으로 보았을 때의 정확도가 떨어질 수 있다. 이것을 과적합(overfitting)이라고 부른다.

'Major > 머신러닝' 카테고리의 다른 글

CSV 파일이란?  (0) 2023.06.19