본문 바로가기

Others

도서 리뷰 : 캐글 메달리스트가 알려주는 캐글 노하우 [길벗출판사]

 

이번에 리뷰할 도서는 길벗출판사의 "캐글 메달리스트가 알려주는 캐글 노하우" 라는 도서입니다.

 

작년부터 Dacon, Kaggle 등 컴페티션을 할 수 있는 플랫폼을 이용하는 빈도가 증가하다보니 눈길이 가는 도서였습니다.

 

이 도서를 일찍 알았으면 좀 더 좋은 결과를 낼 수 있지 않았을까 하는 생각이 드는 도서였는데요,

이런 생각이 들었던 이유에 기반하여 이번 도서에 대해 리뷰하겠습니다.

 

사실 Kaggle, Dacon과 같은 플랫폼은 데이터 사이언스와 관련된 의견 제시, 토론, 컴페티션을 진행할 수 있는 플랫폼이지만,

대부분의 해당 플랫폼을 사용하는 이유는 컴페티션이지 않을까 싶습니다.

 

책의 앞부분에서는 Kaggle의 소개와 더불어 컴페티션을 진행하는데 있는 어려움, 진행 과정, 규칙 등에 대한 내용으로 구성되어 있습니다.

 

또한, 도서를 따라오는데 있어서 필요한 Kaggle Notebook 사용법에 대한 내용도 포함되어 있으며,

처음 Kaggle을 접하는 독자에게는 필수적으로 권장하고 싶은 내용입니다. 

 

앞부분에는 Kaggle에 한정된 내용도 있지만,

확대하여 적용한다면 컴페티션부터 개개인의 문제해결, 과제, 실험등에도 적용이 가능한 내용입니다.

 

책의 중간부터는 하나의 장이 참가자의 프로필, 컴페티션에 대한 내용과 솔루션, 참가자의 후기, 팁 등의 내용으로 구성되어 있습니다.

 

이 책의 핵심 부분으로, 각 장에 포함되어있는 다양한 솔루션과 참가자의 후기, 컴페티션의 목적을 정독한다면 문제 해결 주제가 주어졌을때 어떤 목적을 생각하고 접근해야 하는지, 어떤 방법을 적용할지, 어떠한 사례가 있었는지 고려하며 생각하는데 도움이 될 것 같습니다.

 

또한, 각 장의 주제가 정형 데이터, 이미지 데이터, 자연어 등의 주제로 구성이 되어 있는 만큼 다양한 주제와 데이터에 대한 문제 해결 능력 향상에 도움이 될 것 같습니다.

 

책의 끝부분에서는 Kaggle Notebook 작성 팁, 노하우와 관련된 내용으로 구성되어 있으며, 양이 많지 않으므로 부담 없이 이러한 방법도 있구나 하고 생각하면서 읽을 수 있는 구조입니다.

 

이 도서를 읽으면서 아쉬운 점이라면, 코드를 찾아서 보거나, 핸드 카피, 각각의 깃허브에 흩어져 있다는 점입니다.

그러나 Kaggle Notebook으로 존재하는 코드도 있다보니 크게 불편함을 주지는 않습니다.

(링크가 정리된 엑셀 파일이라도 있으면 좋지 않았을까 싶기도 합니다..)

 

전반적으로 이 도서는 Kaggle을 주제로 내용이 구성되어 있지만, 문제 해결 과정이나 실험 관련된 내용들은 전반적으로 다른 플랫폼에서도 적용이 가능한 내용으로, 어느 플랫폼을 이용하기 전에라도 읽어보면 도움이 많이 되며, 만약에 어떠한 주제에 대해서 문제를 해결해야 하는 일을 시작하는 사람, 대학원생, 문제 해결에 관심이 있는 사람이라면 추천하고 싶은 도서입니다.

 

한줄 요약 : Kaggle이라는 한정적인 주제를 벗어나, 책을 통한 지식의 적용 범위를 넓게 생각하면 꼭 읽어 보아야 할 도서