본문 바로가기

머신러닝7

CNN( Convolutional Neural Network)이해하기 모두의 딥러닝이라는 서적을 통해 딥러닝을 처음 접하면서 CNN(합성곱 신경망)이라는 모델을 공부했습니다. 통계 전공이지만 처음 알게되는 사실들이 많아 책보다는 좀 더 딥하게 공부하고 싶어서 구글링으로 더 공부하여 따로 포스팅을 하고싶어서 하게 됐습니다! 책에서는 CNN을 이미지 인식의 꽃 이라고 표현했지만, CNN은 자연어 처리에도 이용한다고 합니다. 제가 이 CNN을 공부하면서 가졌던 의문들이 다른 분들도 궁금할 수 있을 것이라고 생각합니다. 이 관점으로 포스팅을 시작할게요. 우선 가장 처음에 CNN을 공부할 때는 이미지 데이터에 합성곱을 적용하는 부분이 어렵진 않았지만, 이 합성곱이란게 뭔지가 궁금했습니다. 들어본 적이 없었거든요. 합성곱이 뭔지만 알고 내용을 시작하겠습니다! 먼저 위키피디아에서 어떻.. 2020. 8. 13.
[모두의 딥러닝] 6장/7장 단층, 다층 퍼셉트론 6장부터는 신경망의 이해라는 큰 챕터로 들어섭니다. 드디어 인공지능, 딥러닝에 대해 한 발짝 다가가는 거예요~ 어떻게 인공지능이 21세기 최근에서야 발전하고 핫해졌는지 마주쳤던 한계들과 이를 극복했던 방법도 나옵니다. 그 방법론이 바로 다층 퍼셉트론 이거든요~ 'AI(Artificial Intelligence)' 어떻게 컴퓨터로 인간의 지능을 구현해 낼 수 있을까요? 이는 인간의 뇌 구조와 굉장히 비슷합니다. 인간의 뇌는 약 천억 개의 뉴런으로 이루어져서 각각의 뉴런은 자극을 받고 그 자극이 어느 정도의 임계값을 넘기면 다음 뉴런으로 전달합니다.(임계값을 넘기지 못하면 아무것도 하지 않아요.) 이렇게 계속 수많은 뉴런으로 뻗어나가 인간은 지능을 가지고 생각을 하게 되죠. AI는 바로 여기서 출발합니다. .. 2020. 6. 1.
[모두의 딥러닝] 5장 참 거짓 판단 장치 : 로지스틱 회귀 이제껏 종속 변수 y 값이 연속형인 데이터의 수치를 예측하기 위한 선형 회귀를 알아봤습니다! 하지만 데이터는 다양합니다. 아래 그림처럼 종속 변수 y가 이산형이고, 범주형이라면? '예' or '아니오'로 수치가 아닌 정답을 원하는 데이터라면? 선형 회귀를 적용할 수 없습니다. 로지스틱 회귀는 바로 여기서 출발합니다. 로지스틱 회귀는 참 or 거짓을 판단해 주는 미니 판단 장치인 셈인 것이죠. 그림을 아무리 봐도 선형 회귀선을 그릴 수가 없죠? 직선이 아니라 S자 형태의 함수를 이용해야 합니다. 하지만 우리는 앞에서 S자 형태의 함수를 배운 적이 있습니다. 바로 '시그모이드 함수' 입니다. 로지스틱 회귀는 시그모이드 함수를 이용합니다. 로지스틱 회귀는 이렇게 시그모이드 함수로 표현이 가능합니다. 지수 부분.. 2020. 5. 18.
[모두의 딥러닝] 4장 오차 수정하기 : 경사 하강법 4장 관련 포스팅입니다. 제목을 보면 알 수 있듯이 경사 하강법은 오차를 수정하는 기법입니다. 대부분의 데이터는 입력 변수가 여러개인 다중 회귀를 이용하며, 다중 회귀는 최소 제곱법을 쓰지 못하기 때문에 경사 하강법은 매우 중요합니다. 경사 하강법은 먼저 기울기 a와 오차간의 관계를 알아야 합니다. 왼쪽에 우리가 3장에서 최소 제곱법을 이용해 그었던 주황색 회귀선이 있습니다. 이 회귀선의 기울기가 커져서 가팔라 진다고 생각해봅시다. 예측값과 실제값과의 오차가 커지겠죠? 기울기가 작아져도 마찬가지일 겁니다. 그렇다면 우리는 이 관계를 좌표 평면위에 함수로 나타낼 수 있어요. 위에 그림은 기울기 a와 오차간의 관계를 나타낸 함수입니다. 그림을 보면 알겠지만, a와 오차의 관계함수를 이용해 그 기울기가 가장 .. 2020. 5. 10.
[모두의 딥러닝] 3장 가장 훌륭한 예측선 긋기 : 선형 회귀 3장관련 포스팅입니다. 오늘은 드디어 통계학의 꽃이라고 불리는 회귀와 관련된 얘기를 해보겠습니다. 그 중에서도 선형 회귀에 대한 얘기를 할 거예요. 우선 회귀는 독립 변수와 종속 변수간의 관계를 가장 잘 설명해주는 식을 세워 데이터를 예측하는게 최대 목표예요. 근데 회귀라는 말부터가 직관적으로 와닿지가 않죠. 책에서도 딥러닝의 모델을 구현하기 위해서는 그 원리를 알고있는 것이 굉장히 중요하다고 강조하고 있기 때문에 우리는 꼭 한 번쯤은 자세히 이해할 필요가 있어요. 저도 맨 처음에 학교에서 회귀를 처음 접했을 때는, 사전에 회귀라는 단어를 가장 먼저 검색했던게 기억이 나는데, 사전적 의미를 보고도 이해를 못했었어요. 지금 검색해보니 회귀(regression)라고 붙인 이유까지 자세히 나와있네요. 선형 회.. 2020. 4. 23.
[모두의 딥러닝] 1장, 2장 'AI'라는 단어가 여러 매체에 오르내리면서 'Data science' 최근 아주 핫한 분야로 떠오르고 있죠. 구인 시장을 보면 정말 핫한지는(?) 모르겠지만, 최근 데이터 학원도 많이 생기고 있고, 해외 어떤 매체에는 가장 섹시한 직업으로 data scientist가 뽑힌것을 보니 화두에 있음은 분명해 보입니다. 각설하고 책 관련 포스팅 시작합니다. 초반부 내용이므로 1,2장은 한 번에 포스팅하겠습니다. 1장 나의 첫 딥러닝 초장에는 딥러닝 설명에 관한 내용이 많이 나와요. 인공지능(AI)이라는 카테고리 내에 머신러닝(ML)이 있고, 또 그 범주안에 딥러닝(DL)이 있죠. 딥러닝이 알고리즘 중에서도 예측력이 가장 뛰어나다고 책에서 설명하고 있네요. 보통 머신러닝 모델을 만드는 순서는 이렇습니다. 1. .. 2020. 4. 14.
[책 관련 포스팅]모두의 딥러닝 통계를 공부하면서 업데이트하는 블로그입니다. 새로 개설했어요 ! 데이터 공부를 많이 하는 편이라서 python에 대한 글을 많이 올릴텐데, 현재는 딥러닝에 관한 책 한권을 공부 중이라서 책 관련 포스팅을 계속 올릴 것 같네요. 첫째마당 딥러닝 시작을 위한 준비 운동 1장 나의 첫 딥러닝 2장 딥러닝을 위한 기초 수학 둘째마당 딥러닝의 동작 원리 3장 가장 훌륭한 예측선 긋기: 선형 회귀 4장 오차 수정하기: 경사 하강법 5장 참 거짓 판단 장치: 로지스틱 회귀 셋째마당 신경망의 이해 6장 퍼셉트론 7장 다층 퍼셉트론 8장 오차 역전파 9장 신경망에서 딥러닝으로 넷째마당 딥러닝 기본기 다지기 10장 모델 설계하기 11장 데이터 다루기 12장 다중 분류 문제 해결하기 13장 과적합 피하기 14장 베스트 모델.. 2020. 4. 13.