본문 바로가기

CNN architecture2

[논문 리뷰] SENet 설명 (Squeeze-and-Excitation Networks)(2018) 사실 SENet이라기보다는 SE block이 더 어울리는(?) SENet 논문을 리뷰합니다. 마찬가지로 Abstract는 자세히 짚고, 나머지는 중요한 부분들 위주와 저의 생각들로 포스팅합니다. 이 논문은 직접 읽지 않을 때는 느끼지 못했던 연구진들의 엄청난 관점이 이번에 논문을 읽고나서야 제대로 느낀 것 같습니다. 찾아보니 ILSVRC 2017에서 우승을 했다고 합니다. 1. Abstract 2. SE block 구조 3. SE block의 활용성 4. SE block 실험결과 5. 간단한 SE block 구현(케라스) Abstract 최근의 bulding block을 중심으로 CNN이 더욱 발전하면서, 각 layer의 공간적인 정보와 필터로 생성된 채널간의 정보를 결합하여 많은 정보를 쌓는 것이 가능.. 2022. 2. 7.
[CNN모델 이해하기] CNN 모델 설계하기 & CNN 모델 인사이트 이번 포스팅은 CNN 모델을 설계하면서, 중요한 점을 짚고 무엇이 어떻게 왜 쓰이는지 정리하려고합니다. 미리 학습된 모델을 쓰지 않고, 그냥 CNN모델을 설계하면서 성능차이를 봅시다. 캐글 컴피티션에 공유돼있는 노트북의 CNN 모델을 수정해가면서 개념을 되짚고, 성능을 높여보겠습니다. 이 과정에서 과적합을 방지하고 gradient vanishing을 유의하며 모델링합니다. 제 글을 끝까지 보시고 제가 공유한 노트북으로 모델 부분만 한 번 수정해보세요! 배운 것으로써는 당연한 결과지만 직접해보고 눈으로 보는 것 만큼 좋은 학습은 없죠 ㅎ 1. 캐글 컴피티션에 공유된 아주 basic한 CNN 모델을 살펴보기 2. 리뷰한 CNN 모델의 문제점을 찾고 수정해보기 .. 2021. 9. 1.