본문 바로가기

IT 트렌드

인공지능(AI) 파헤치기 - 딥러닝(DL, Deep Learning). 3부

반응형

이전 1부, 2부를 통해 우리는 인공지능(AI)와 머신러닝(ML)에 대해 알게 되었다. AI -> ML -> DL의 순서대로 각자의 한계를 뛰어넘기위해 등장한 세부적인 개념들이다.

 

인공지능(AI) 파헤치기 - 머신러닝(ML, Machine Learning). 2부

이전 글에서는 인공지능(AI)의 개념에 대해서 알아보았다. 오늘 머신러닝에 대한 설명을 위해 간단히 이전 글을 요약하자면... 인공지능(AI) 파헤치기 - 인공지능(AI, Artificial Intelligence). 1부 여러분

www.kboutiq.com

 

잠깐 정리하면 인공지능(AI)는 인간과 같은 지능을 가진 컴퓨터라는 개념이며 이 개념을 실제로 개발하기 위한 구체적인 접근 개념이 머신러닝(ML)이다. 하지만 이런 머신러닝에도 복잡한 데이터의 인식률이 낮다는 단점이 있다. 그래서 등장한 것이 딥러닝(DL, Deep Learning)이다.

 

딥러닝(DL)은 머신러닝에서 나온 하나의 새로운 개념으로 사람의 뇌의 작동 구조인 신경망을 참고한 개념(기술)이다.

딥러닝(DL)에 대해 알아보기 전에 우리가 강아지를 어떻게 판단하는지 한 번 생각해보자.

 

 

우리가 난생 처음으로 강아지를 처음 봤다면 뭐라고 표현할까? 필자는 '저거'라고 표현할 것 같다. '저거'는 부모님, 선생님의 가르침으로 '강아지'가 된다. 

 

그리고 다른 종의 강아지, 나무에 가려진 강이지, 안개 낀 날에 흐리게 보이는 강아지를 보아도 우리는 정확하게 '강아지', 또는 '강아지같은 것'이라고 표현한다. 하지만 왜 그것이 강아지인지는 정확하게 설명할 수는 없다. 왜냐하면 우리는 'A면 반드시 B다'라는 형태로 사물을 인식하지 않고 'A면 B일 수 있겠네'와 같이 추상적인 부분들의 결과로 사물을 인식하기 때문이다.

 

추상적으로 인식


그러면 이제 딥러닝에 그대로 적용시켜보자.
데이터의 입력(강아지 사진)과 해답(강아지)만 제공하면 컴퓨터가 스스로 추상화한 기준(예시 : 강아지는 A 부분이 약 *23~30정도네.)을 정하도록 설계한 것이 딥러닝이다. 여기서 데이터가 많으면 많을수록 스스로 추상화한 기준의 정확도가 높아질 수도 있다.(예시 : 강아지는 A 부분이 약 25~26정도네.)

*23~30이라고 쓴 이유는 컴퓨터는 0, 1밖에 모르기 때문이다.

여전히 스스로 추상화한 기준은 무엇이고 왜 딥러닝은 사진의 일부가 가려져 있어도 인식률이 높을 수 밖에 없을까? 라는 궁금증이 남아있을 것이다. 먼저 인식률이 높은 이유를 아래 예시를 통해 보자.

실제로는 더 복잡하겠지만 컴퓨터가 이미지를 인식할 때 간단히 4구역으로 나눠서 판단한다고 가정하자.

1만장의 강아지 사진을 학습시킨 컴퓨터는 위와 같은 A, B, C, D구역의 값을 정해놓았다. 그러면 내가 새롭게 보여주는 이미지의 결과가 각 구역 값의 범위 내로 전부 들어오면 25%+25%+25%+25%=100% 강아지로 판단하게 된다.(구역 값에서 멀어지면 그 만큼 %가 떨어지게 된다.)

그러면 내가 새로운 사진을 보여준 결과가 (A구역 23, B구역 75 , C구역 3, D구역 90)이라면 100% 강아지를 도출할 것이다.(강아지네!)
만약, B구역이 완전히 가려진 강아지 사진을 보여준다면 (A구역 25, B구역 30, C구역 4, D구역 92)와 같이 판단할 것이고 약 75% 근처의 확률로 강아지라고 도출할 것이다.(강아지 같은데?)
B, C구역이 완전히 가려진 강아지 사진을 보여준다면 (A구역 25, B구역 37, C구역 80, D구역 92)와 같이 판단할 것이고 약 50% 근처의 확률로 강아지라고 도출할 것이다.(강아지인가?)

이제 왜 인식률이 높은지 느낌이 올 것이라고 생각한다. 그러면 이제 도대체 스스로 추상화하는 기준은 뭐야? 라는 것에 대해 보도록 하자.

 

출처 : https://www.jeremyjordan.me/convolutional-neural-networks/


사실 우리가 사진을 보고나서 강아지라고 이야기할 때에는 사진을 구석구석 꼼꼼하게 관찰 후 강아지라고 표현하지 않는다. 즉, 강아지라는 것을 판단할 때 사진에 있는 모든 정보를 활용하지 않는다는 것이다. 마찬가지로 컴퓨터가 이미지를 인식할 때 1*1픽셀 단위로 꼼꼼하게 볼 필요가 없다는 것이다. 컴퓨터는 수많은 사진들을 구역을 나누고 4*4픽셀, 16*16픽셀 단위 등으로 조금 크게, 크게 잘라서 다시 이어붙여 이미지를 만들면서 최대, 최소 어느정도 단위로 자르고 그 잘린 부분의 값이 어느 정도여야 강아지라는 것을 알 수 있다는 것을 스스로 정하게 된다.

단순하게 이야기하면 사람이 제공하는 요소인 강아지는 수염이 없다라는 개념은 딥러닝한 컴퓨터에게는 A구역을 4*4픽셀정도 크기로 자른 부분의 값이 23~26정도 나오는 것에 매칭된다는 것으로 해석될 수 있다.

 

정말 간단한 예시로 딥러닝(DL)에 대한 개념을 훑어 보았다. 딥러닝은 사람의 뇌의 신경망을 참고하여 인공신경망이라는 개념을 사용한다고 하는데 다음 글에서는 딥러닝과 인공신경망의 관계를 조금 더 자세하게 알아보도록 하자.

반응형