상세 컨텐츠

본문 제목

CNN 구현 논문 조사

AI

by cepiloth 2021. 8. 7. 18:28

본문

728x90
반응형

2021-08-07 : 서울대 입구역 어느 PC 방에서 4년간에 배고프고 고달프게 그래픽스 그림을 그리던 최화가께서는 제2의 장밋빛 인생을 맞이 하셨다. 그동안 이 세계에서 그린 모든 그림을 뒤로 두고 새로운 꽃 길로 가시는 것을 진심으로 축하드린다. 

 

 블랙 서바이벌 게임을 하다가 요새는 질려서 잘 안하게 된다. 게임하면서 빌드나 전략 및 컨트롤 여러 가지 생각할게 많아져서 게임에서 패배할 때의 스트레스가 너무 크다고 생각하여 멘털을 지키기 위해서 포트리스도 전향했다. 확실히 블랙 서바이벌보다는 포트리스는 정신적인 스트레스는 적고 마음에 안식을 주고 져도 재밌고 해서 시간 때우기에는 딱이다.

 

 그건 그렇다치고 매일 노는 것도 지겹고 해서 게임할 때 Open Broadcast라는 실시간 방송 프로그램으로 유튜브에 실시간 방송하는 것도 해보았는데 역시 콘텐츠가 부족하기 때문에 보는 사람들은 없다 가끔 친한 동료들이 조금 이야기해주는 정도 근대 뭐 나 자신이 생각해도 재미 요소가 없으니 그냥 유튜브를 실시간 방송하는 방법 정도를 익혔다고 생각하고 넘어가자.

 

놀다가 보니 한편으로 근심이 생겨서 떠나는 최화가님에게 부담을 줄 수 없어 CNN을 활용한 몇몇의 논문을 확인해보았다. 기본적으로 CNN 기반으로 네트워크를 구축하고 활성 함수나 classification 하는 노드에서 LSTM을 넣거나 SVM OR SOFTMAX 처리하는 것을 알 수 있었다.

 

CNN을 사용하였을 때 성능 평가를 하기 위한 지표는 아래와 같은 것들이 있었다. INDEX 정도로 걸어두고 나중에 세세하게  다시 찾아보도록 하자.

성능 평가는 정확도(ACC: Accuracy), F1 Score, 
평균분류오류(ACE: Average Classification Error)
재현율(Recall)
정밀도(Precision)
데이터 셋 : Mean Absolute error

 여기서 부터는 오늘 몇 개 확인한 논문들이다. 오늘 가장 재밌던 거는 영상을 분할해서 classification 하는 방법이 재미있었다. 건물을 분류할 때 나무, 비, 계절에 따라서 환경요소에 의해 색상이 바뀌거나 할 수 있는데 이러한 점을 건물 내의 특징을 따로 데이터로 만들어서 추론할 수 있는 방법을 기술돼있는 논문이 아이디어가 매우 좋다고 느꼈다. 

 

이미지 잡음에 강인한 CNN 기반 건물 인식 방법

 아무리 네트워크 구조가 좋아도 데이터 세트가 충분하지 않다면 좋은 학습 효과를 얻기가 어렵다.  건물의 전체 이미지를 학습하면 외부적인 환경의 잡음, 즉 건물을 가리는 나무나 현수막 등에 의해 건물 인식률이 저하된다.(그림 6). 반면, 그림 8과 같이 건물의 특징을 잘 나타내는 부분 이미지로 학습하면 외부 잡음에 영향을 많이 받지 않아 건물 인식률이 향상된다.


건물 외관에 나타나는 변화, 즉 계절, 조도, 각도 및 원근에 의해 떨어지는 인식률을 향상시키는 새로운 방법을 제안한다.
https://www.koreascience.or.kr/article/JAKO202005653789629.pdf

CNN 기반 이미지 회전  보정

회전 된 영상에 대해서 인식률 개선
mean absolute error (MAE) 성능지표를 사용함
데이터 셋 : Mean Absolute error
4.5951 지표의 의미?
https://www.koreascience.or.kr/article/JAKO202007752706232.pdf


일반 필기데이터와 CNN을 이용한 온라인 서명인식

cnn+lstm 뒤에 dropout 층을 추가하였다. 요새 대세는 기본 CNN 구조를 사용하고(VGG16, VGG19, ResNET) 정제가 잘된 데이터를 수집하고 각각 여러 네트워크에서 추론하여 가장 성능이 좋은 네트워크 구조를 사용하면 되는 것으로 판단된다. 그러나 여기서 좀 의구심이 드는 생각은 EPOCH 50 정도면 성능이 좋을 거라고 생각했는데 논문에서 100번 200번이라고 쓰여있어서 헷갈리긴 한다. 실제로 100번 200번 학습을 해본 경험이 없어서 그럴지도 모른다. 추후에  데이터 수집을 완료하면 데이터 증강을 하고 여러 네트워크를 통해 테스트를 해봐서 가장 좋은 성능을 갖는 PRE-TRAINING 모델을 선정해야겠다.
https://www.koreascience.or.kr/article/CFKO202024664105349.pdf

 

728x90
반응형

관련글 더보기

댓글 영역