수리 공작소
[Pytorch/ 딥러닝] 딥러닝 개요 본문
[인공지능(Artificial Intelligence)이란?]
인간의 지능적인 능력을 모방하거나 대체하기 위한 기술
[인공지능의 역사 요약]
1950년, 엘런 튜링 (Alan Turing) 의 Turing Test
질의자(사람), 응답자1(사람), 응답자2(컴퓨터)
질의자는 두 응답을 보고 어느 것이 사람이고 어느 것이 컴퓨터인지 판별
-> 여기서 질의자의 판별이 어긋날 수록 컴퓨터는 인간처럼 사고하고 있음을 뜻함.
-> 즉, 시스템에 대한 인공지능의 개입을 사람이 눈치 채지 못 할수록 더 완벽한 인공지능이다.
1950-60년대, Perceptron의 등장 및 탐색 추론 영역의 AI 연구 부흥
1958년, Rosenbaltt의 인간의 뇌신경을 모방한 Perceptron 등장 - input과 weight의 개념 도입
1968년, Misky와 Papert의 Perceptron 한계 지적과 암흑기 시작
Perceptron으로는 XOR 문제를 해결할 수 없다!
-> 이후에 이는 다층 퍼셉트론으로 해결할 수 있음을 알았지만, 당시의 기술로 다층 퍼셉트론을 구현하는 것은 힘들었다.
1986년, Rumelhart의 Multi-Perceptron(다층 퍼셉트론)과 Back Propagation(오류역전파) 제안
퍼셉트론을 여러겹 쌓아 XOR 문제를 해결할 수 있다!
여기서 사용되는 Back Propagation 알고리즘의 발견.
2006년, Hinton에 의해 정식으로 Deep Neural Network 용어 등장
[AI/ ML/ DL?]
AI/ ML/ DL은 위와 같은 포함관계에 있다.
AI는 인간처럼 사고하는 기계를 포괄적으로 뜻한다.
ML은 AI 중에서 데이터로부터 얻은 경험을 통해 학습하는 것을 말한다.
DL은 ML 중에서 인간의 뇌를 모방한 인공신경망을 여러 겹 깊게 쌓은 학습 방법이다.
[용어 정리]
예측(prediction)이란?
주어진 데이터를 바탕으로 학습한 뒤, 새로운 데이터에 대한 정답을 예측
※prediction != forecast
전자는 데이터로 입력된 경험에 의해서만 정답을 예측.
후자는 데이터를 "분석"한 뒤 정답을 예측.
(말이 애매하긴 하다.)
모델(model)이란?
데이터(x)와 정답(y)이 주어졌을 때(x, y), 정답을 올바르게 분류 및 회귀하는 기울기와 편향을 구하는 것.
즉,
y = ax + b에서 a, b를 구하는 것.
이 직선은 "결정 경계"라고 함.
※ 왜 직선을 이용? 곡선 이용하면 더 정확하지 않나?
NO. 일반적인(generality) 경우를 나타내는 것은 직선이 더 적합하다. 어쩌다가 튀어나온 한 데이터 때문에 부분 부분 곡선으로 변형시킨다면 오히려 전반적으로 보았을 때의 정확도가 떨어질 수 있다. 이것을 과적합(overfitting)이라고 부른다.