'2018/02 글 목록

공부할 때 참고한 자료들

이론/신경망 2018. 2. 27. 11:30

1. http://neuralnetworksanddeeplearning.com

처음 신경망을 공부하려고 마음먹고 공부한 자료다. MNIST Hand writing 문제를 가지고 neural network와 CNN까지 설명한다. 장점이라면, 쉽게 설명되어 있으면서도 Regularization, dropout, softmax, gradient vanishing등 전반적인 문제를 다루고, tensor레벨이 아니라 수식레벨에서 SGD와 Back Propagation을 유도하고 있어서 다소 이해가 쉬웠던 것 같다. 단점이라면 이 수식 유도를 일부만 보여주고 독자들에게 해보라고 시킨다는 것.. (내가 할 줄 알았으면 이걸 안 봤겠지..)

( 저자가 보는 나의 수식유도.. )

그리고 나중에 Tensor레벨의 back propagation을 이해하기 위해, 계산그래프를 이용한 Back Propagation유도와 Tensor 미적분 내용을 다시 찾아 봐야 했다는 것도 좀 단점이라면 단점이겠다.. 하지만 전체적으로 입문서로 보기에 231n 보다 좋은 것 같다. (참고로 샘플코드도 제공한다)

2. 밑바닥부터 시작하는 딥러닝 / 한빛 미디어 / 사이토 고키 저, 개앞맵시 역

물고기 책이다. 한글로 되어 있어서 1번보다 가독성이 좋은 장점이 있다. 계산 그래프 방식으로 back propagation을 소개하고 있어서 1번 자료를 정독하고 나서 읽었다. 1번 자료는 개별 데이터 단위, 계별 뉴런 단위로 back propagation을 유도해서 설명하다보니, 거기서 배운 것을 바로 layer단위, tensor 단위로 이뤄지는 back propagation에 적용하기 어려워서 이 책에서 설명하는 계산그래프를 공부했다.

책에서 설명하는 주제들은 대부분 1번 자료에서 다루는 주제와 겹친다. 하지만 설명만 놓고 보자면 1번 자료보다는 디테일이 좀 떨어지는 것 같다는 생각이 든다. 그래서 1번 자료를 한번 정독하고 보면 좋을 것 같다.

단점이라면 이놈의 책도 은근슬쩍 어려운 수식유도는 독자에게 넘긴다. 예를 들자면 affine계층의 backward pass를 유도할 때 "실제로 전개해 보면 다음 식이 도출 됩니다. [식 5.13]으로 이끄는 과정은 생략합니다." 라고 쓰고 유도를 안한다. 수식을 유도할 수 있어야 뭔가를 이해한 것 같다고 생각하는 사람에게는 상당히 찜찜한 전개다.

(필요한 만큼 못봤는데...)

그래서 한동안 Tesnor 미분을 어떻게 해야 하는지, Tensor 미분에서 chain rule은 어떻게 생각해야 하는지 한동안 자료를 찾아 구글을 떠돌아 다녔다. 그래도 상당히 친절한 편이며 코드를 제공하고 있어서 처음에 같이 따라해보면서 배우기에는 좋은 책인 것 같다.

3. cs231n (http://cs231n.stanford.edu/)

"딥러닝 입문자의 바이블이다." 라고 들었는데 실제로 나는 나 혼자 먼먼길을 돌아돌아 지금 이제서야 이걸 공부하고 있다. 하지만 1번 자료, 2번 자료를 어느정도 보고나서 공부하고 있기 때문에 그나마 이해를 하고 있는게 아닌가 싶다. 강의 비디오와 강의 노트가 제공되는데 강의 비디오를 아무 사전지식 없이 봤다면 영어 청취가 잘 안되는 나로서는 뭔소리인지 이해를 못하지 않았을까 싶다. 바이블인만큼 가장 많은 참고자료를 찾을 수 있어서 좋긴하다.

( 영어 잘하고 싶다.. )

저작자표시

'이론 > 신경망' 카테고리의 다른 글

He 초기화 구현 in tensorflow (0)	2018.09.19
tensorboard 간단 요약 (0)	2018.09.13
인공신경망과 학습 (0)	2018.03.05
전미분, 편미분, Gradient에 대해 (2)	2018.02.28
신경망 글을 시작하면서.. (0)	2018.02.26

Posted by 굿쟌

,

신경망 글을 시작하면서..

이론/신경망 2018. 2. 26. 18:38

인공지능 연구실에서 석사과정을 마쳤다. 석사 과정 때 지문인식과 얼굴인식 관련 연구를 했는데, 당시 첫번 째 연구 목표가 "생체인식 기능을 스마트 카드에 이식하는 것" 이었다. 두번 째는 얼굴과 지문을 잘 대표할 수 있는 양질의 feature를 뽑아 내는 것, 마지막wish 수준의 주제가 뽑아낸 feature간 유사도를 잘 판별 할 알고리즘을 찾는 것이었다. 지금와서 생각해보면 운이없게도 연구목표를 잘못 잡았다는 생각이 든다. 지금은 스마트카드와 아무 상관 없는 일을 하고 있는데...

(사실 목표를 잘 못 잡아서가 아니라, LoL때문에 더 많은 시간을 허비했다..)

당시에 다른 연구생들은 계량기 숫자인식 프로젝트를 하면서 여러 분류기를 다뤘다. 그 중 하나가 신경망이었는데, 지도교수님께 뭘 물어보기만 하면 "응.. 신경방에다가 돌려봐"라고 하셨던 기억이 난다. 당시에는 feature base의 알고리즘이 주류를 이룰때라 "뭐만 하면 신경망이구만.. 그렇게 아무데나 갔다 붙여도 되나.." 하고 생각했다.

그런데 그것이 실제로 일어났다... 이제는 신경망이 아니라 Deep Learning 이라는 이름을 달고 나와 세상을 바꿔 나가고 있고, 오만간데 심층신경망을 적용 했다는 뉴스가 나온다. 그래서 뒤늦게 나마 학부 때 잠깐 배웠던 기억을 떠올려 요즘 다시 deep learning을 공부하고 있는데 너무 어렵다..뭐 하나 배우면 다른걸 까먹고.. 원래 CS가 다 그렇지만, 수학이 너무 많다 수학공부좀 잘 해 놓을껄....

여튼 그래서 여디가다 공부한걸 정리 해보려고 한다. 나중에 휙 보고 다시 기억이 떠올랐으면 좋겠다. 아울러 혼자 끙끙대며 공부하는 다른 사람들에게도 작은 도움이 되었으면 좋겠다. 아무리 구글링을 해도 쓸모없는 정보만 나올 때의 절망감을 잘 안다. 나도 공부하는 처지라 항상 정답은 아니겠지만, 혼자 끙끙대고 있는누군가에게 작은 도움이나마 된다면 이 글을 올리는데 큰 보람이 될 것 같다.

저작자표시

'이론 > 신경망' 카테고리의 다른 글

He 초기화 구현 in tensorflow (0)	2018.09.19
tensorboard 간단 요약 (0)	2018.09.13
인공신경망과 학습 (0)	2018.03.05
전미분, 편미분, Gradient에 대해 (2)	2018.02.28
공부할 때 참고한 자료들 (0)	2018.02.27

Posted by 굿쟌

,

Slow walking man

'2018/02'에 해당되는 글 3건

전미분, 편미분, Gradient에 대해

'이론 > 신경망' 카테고리의 다른 글

공부할 때 참고한 자료들

'이론 > 신경망' 카테고리의 다른 글

신경망 글을 시작하면서..

'이론 > 신경망' 카테고리의 다른 글

카테고리

태그목록

최근에 올라온 글

최근에 달린 댓글

글 보관함

달력

링크

티스토리툴바