P Stage 1 : Project Day 3
Day 3 list
- 신규 모델 구상
신규 모델 아이디어 구상
요약
- ResNet18 기준 0.5정도 나옴
- 성능 올리고자 data augmentation 이전에 모델 구성적 접근 구상
- 자세한 구상은 자세한 이야기에…
자세한 이야기
일단 이번 대회의 목표는 총 18개의 클래스를 분류하는 문제였습니다. 클래스의 분류는 다음과 같이 나눠져서 총 18개의 조합이 존재합니다.
- 마스크 착용
- normal : 마스크 미착용
- incorrect : 마스크 비정상 착용
- mask : 마스크 착용
- 성별
- 남
- 여
- 연령대
- 30세 미만
- 30세 이상 60세 미만
- 60세 이상
이미지를 넣어서 총 18개의 클래스로 분류하는 것이 개인적인 생각으로는 이미지의 feature를 찾는 데에 부담이 될 것으로 생각됩니다.
이처럼 1개의 batch 단위의 이미지가 들어오면 모델은 성별, 마스크, 연령을 모두 고려해서 이미지를 처리해야 합니다. 개인적인 생각이지만 이를 처리하려면 전반적으로 모델이 분류해야하는 특징점이 너무 세분화되는 것입니다.
만약 이렇게 세분화되는 과정이 있다면 모델의 학습에 부담이 될 것이고 성능에 영향을 줄 수 있을 것이라 생각해서 다음과 같이 모델을 구성할 수 있지 않을까 생각합니다. (물론 수학적 근거가 있지는 않습니다. 머릿속 구상이라…)
이를 해결하고자 앙상블 머신의 아이디어를 착안했습니다. 1개의 모델은 1개의 서브 클래스 부류에만 집중하는 것이 모델 자체의 성능 향상에 기여할 수 있을 것이라 생각합니다. 앙상블은 입력에 대해 여러 모델의 결과를 병합하는 것이지만 제가 생각한 것은 이와 유사하게 각 모델이 역할에 맞는 특징을 추출해주면 이를 조합해서 정답 클래스로 연결시키는 것입니다.
만약 모델이 보는 이미지의 특징이 조금이라도 줄어들면 정답을 처리하는데 충분히 도움이 될 것이라 생각합니다.
일단 이는 구상이고 내일 멘토님이랑 얘기도 해보고 관련 자료도 찾아봐야겠습니다.
Comments powered by Disqus.