Zorba blog
빅데이터 분석 경진대회 사이트 정리 본문
데이터 사이언티스트, 데이터 분석, 머신러닝 & 딥러닝 엔지니어 등 분야로 취업을 할 때 Git, 개인 프로젝트, 경진대회 수상 등으로 자신을 어필하고는 합니다. 특정 대회(Competition)의 경우 우수한 성적, 리더보드에서 상위에 위치하면 상금도 주고, 기업 주체로 열리는 대회인 경우 상위 수상자들에게 채용 가산점까지 주고 있습니다. 만약 자신이 가고자하는 기업에서 데이터 분석 대회를 개최한다면 필수로 참여해야겠네요.
이번 글에서는 데이터 분석 경진대회에는 어떠한 것들이 있는지 알아보겠습니다. 그리고 저도 그 중 하나를 선택해서 참가해보려고 합니다. 중간중간 대회 진행 과정이나 배운 것들을 포스팅 할 예정입니다.
1. 캐글 (https://www.kaggle.com/competitions)
캐글(Kaggle)은 2010년 설립된 예측모델 및 분석 대회 플랫폼이다. 기업 및 단체에서 데이터와 해결과제를 등록하면, 데이터 과학자들이 이를 해결하는 모델을 개발하고 경쟁한다. 2017년 3월 구글에 인수되었다. |
데이터 경진대회를 준비하는 사람이라면 한 번 쯤은 들어봤을 "캐글". 각 경진대회마다 큰 상금도 걸려있기에 수많은 사람들이 자신의 실력을 뽐내는 곳입니다. 데이터도 다양하고, 특히 사람들이 써놓은 글들의 퀄리티가 상당히 좋습니다. 해당 작업자가 쓴 코드와 더불어 해석까지 달려있어서 데이터분석을 공부하는 사람들에게 정말 많은 도움이 될 것 같아요.
2. 데이콘 (https://dacon.io/community/codeshare)
전세계적으로 유명한 것이 캐글이라면 한국에는 "데이콘"이 있습니다. 캐글과 마찬가지고 데이터셋이 제공되며, 수상에 따른 상금 그리고 채용시 가산점까지 부여해준다고 합니다. 만약 자신이 특정 기업에 가고싶은데, 해당 기업에서 데이콘에 경진대회를 열었다?! 그러면 정말 열심히해서 가산점을 받아야겠죠.
3. 카카오 아레나 (https://arena.kakao.com/)
카카오 아레나는 카카오가 주관하는 데이터 경진대회입니다. 지금까지 총 3번의 대회가 개최되었는데요. 각 대회의 주제는 "브런치 사용자를 위한 글 추천 대회", "쇼핑몰 상품 카테고리 분류", "Melon Playlist Continuation" 으로 삶과 밀접한 서비스들을 개선하는 과제여서 참가자들에게 많은 흥미를 끌었을 것 같네요. 다만 2020년 멜론 대회 이후로는 대회가 열리고있지 않은 상태입니다.
카카오 아레나의 경우 우수한 성적을 거둔 팀들의 솔루션이 책으로 나와있기도 합니다. "카카오 아레나 데이터 경진대회 1등 노하우" 라는 책인데, 책을 보면 코드와 함께 왜 해당 문제를 이렇게 풀었는지에 대한 해설도 함께 담겨있어, 공부하시는 분들에게 많은 도움이 될 것 같습니다.
4. AI Factory (https://aifactory.space/)
AI Facotory는 인공지능 경진대회 플랫폼 및 교육 실습 서비스, 운영 최적화 서비스를 제공하고 있습니다. 경진대회 플랫폼의 경우 위 3개의 플랫폼들과는 달리 약간 정리가 덜 되어있다는 느낌을 받았습니다. 그래도 진행중인 경진대회가 있는 것을 보니 꾸준히 대회가 업로드되는 것 같기는 합니다.
5. COMPAS (https://compas.lh.or.kr/intro)
COMPAS는 데이터 기반의 도시문제 해결을 위해 다양한 시민 분석가들이 참여하여, 함께 문제를 분석 및 해결하는 시민참여형 도시문제 해결 데이터 분석 플랫폼입니다. 지자체가 겪고 있는 도시문제들이 발굴되고, 참가자들은 최적의 솔루션을 제공하는 것을 목표로 합니다. 현재 진행중인 과제는 없으나 최근까지도 경진대회가 계속 올라오고 있습니다.