Home [BoostCamp AI Tech / P Stage 1] Day31 - Project Day Final
Post
Cancel

[BoostCamp AI Tech / P Stage 1] Day31 - Project Day Final

P Stage 1 : Project Day Final


Day Final list

  1. 대회 종료
  2. 데이터 분포 변경 및 앙상블

대회종료

드디어! 2주간 진행된 대회가 종료되었습니다. 저희 팀은 나름 기적?을 보여줬다고 생각합니다.

대회 종료 2시간 전까지만 해도 48개 팀 중 47등이었는데…. 최종 10등으로 마무리했습니다. (private 13등) 2시간만에 37계단 상승을 보여줬습니다.
방법은 생각보다 간단했습니다. 자세한 내용은 2번에서 설명드리겠습니다.


데이터 분포 및 앙상블

사실 제일 큰 문제는 데이터의 분포였습니다. 제가 마지막으로 제출한 모델의 결과가 0.7000으로 나왔고 다른 팀원이 제출한 모델은 0.6 후반대가 나왔습니다. 왜 결과가 향상이 안되는지가 저희 팀의 가장 큰 문제점이었습니다. 모델변경, 데이터 증강 등 해볼 수 있는 대부분의 방법은 다 시도해봤기 때문입니다.
그러던 중 팀원이 상위 2개 제출의 결과를 실제 테스트와 비교를 해봤을 때, 제 모델은 연령을 제외한 마스크, 성별은 거의 다 맞추는 반면, 다른 팀원의 결과는 연령은 매우 잘 맞추고 있었습니다. 그래서 역연산을 통해 성별, 마스크, 연령을 각 모델에서 추출하여 재연산을 통해 결과를 도출했더니 점수 향상이 매우 높게 나타났습니다.
또한 60세이상의 데이터가 너무 적은 것이 문제이고 잘 맞추지 못한다는 문제가 나타나서 60세이상의 분포는 58세까지로 분포를 변경했더니 점수 향상이 굉장히 높게 나타났습니다. (F1 score 0.0464 향상)
추가로 재분류한 60세 이상 데이터를 GaussianBlur, HorizontalFlip, GridDistortion을 활용하여 증강을 진행했고 이 방법도 점수 향상이 나타났습니다. (F1 score 0.0401 향상)


최종 대회 코드 모음

대회 GitHub repository

This post is licensed under CC BY 4.0 by the author.

[Life] 코세라 MLOps 특화과정 수료!

[BoostCamp AI Tech / RecSys] Day32 - 추천 시스템 개념

Comments powered by Disqus.