본문 바로가기

도서,강의 리뷰

데이터 과학 레벨 업 with 로드맵 서평

 


캐글에 대한 이해와 팁들을 얻을 수 있는 유용한 책들이다. 입문 서적 느낌이긴 핮디만, 머신러닝에 대한 이해를 어느정도 가지고 있는 사람이 봐야할 책이다. 따로 강의와 책 등으로 어떤 데이터를 분석해보고 모델로 학습해서 추론까지 해본 경험이 있는 사람이라면 충분히 도전할 수 있는 책이라고 생각한다. 

 

 


1부에서는 캐글 대회에 대한 이해와 사이트 이용법 등 캐글 대회를 처음 나가보려는 사람들을 위한 기초적인 것들을 알려준다. 캐글노트북의 하드웨어 사양 등이나 구글 코랩과 어떤 차이가 있는지 등을 알려주는 게 꽤 유용한 부분이다. 코랩은 캐글노트북보다 대중적이지만, 캐글노트북은 그에 반해 조금 덜 알려진 듯하기 때문이다. 하드웨어 면에서는 캐글노트북이 무료버전에서는 약간 더 나은 느낌이 있긴하다. 무료 버전의 코랩과 캐글노트북을 병행해서 쓴다면, 가성비를 최대한 낼 수 있지 않을까 생각한다.

 



2부에서는 실제 대회를 위해 알아야할 지식이나 기법 등을 알려준다. 과제와 지표, EDA, 최적화와 검증 테크닉 등등 예제를 바탕으로 설명한다. 1장의 내용을 자세히 안다면, 슥 훏어보고 2장에서 상세한 캐글 대회 예제와 팁들을 얻어가면 좋을 것 같다. 개인적으로, 평가지표에 대해 모두 다 다룬 느낌이라서 좋은 것 같다. 아무래도, 캐글은 모든 종류의 데이터 사이언스 대회를 열다보니 그런게 아닌가 싶다. 실무에서도 꽤 유용한 챕터가 아닐까 싶다.

이 책의 3부에서는 캐글을 활용하여 포트폴리오를 어떻게 구성하고 잡 포지션을 어떻게 찾는지 등을 알려준다. 캐글 그랜드 마스터 31명의 인터뷰 내용이 있기에 캐글에 끝판왕들에 생생한 팁들과 경험담이 꽤 유용하다. 캐글로 수상을 한다면, 왠만한 대학원 이력보다 훨씬 쳐주는 느낌이다. 이러한 팁이 시간이 지났다고 크게 변할 것 같지는 않다. 이를 자세히 읽어보고 어떻게 녹일지 잘 연구해보자.


"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."