Author: 칼리드 엘 에맘, 루시 모스케라, 리처드 홉트로프 지음 / 심상진 옮김

             출판사: 한빛미디어

             Score /5: ⭐️⭐️⭐️⭐️

 

요즘 머신러닝 또는 인공지능 분야가 소위 '핫' 하다.

사람이 해결할 수 없는 부분을 인공지능이라는 신기술(?)을 통해서 해결할 수 있다고 언론 또는 미디어에 과장광고가 되어 있기 때문이다.

우리가 영화로 본 터미네이터의 '스카이넷'과 같은 인공지능은 강 인공지능 또는 초 인공지능이라고 해서 인간을 추월한 인공지능이며, 해당 인공지능까지는 갈 길이 멀다.

따라서 우리가 현재 활용하고 있는 인공지능은 약 인공지능이지만, 현재의 수준으로도 만족할만한 결과를 얻을 수 있고 미래가 유망한 분야가 인공지능이기도 하다.

 

하지만 인공지능 분야가 아무런 데이터 없이 마법처럼 '내가 원하는 미래의 결과를 알려주세요' 같은 것은 불가능하다.

그렇기에 인공지능이 수많은 연산으로 모델을 만들고 해당 모델로 자신이 원하는 결과를 얻게 하기 위해서는 양질의 데이터가 정말 많이 필요하다!!

즉 데이터 수집 -> 전처리 -> 모델 생성 (학습) -> 평가의 프로세스 안에서 이 책은 전처리 부분에 가까우며,  모델(쉽게 말하면 함수라고 생각하면 된다. 일차, 이차 방정식처럼)을 만들기 위한 데이터 셋을 어떤 관점으로, 어떤 프레임워크로 접근 또는 평가할 지 가이드 해주는 실무자에게 필요한 책이다.

머신러닝 또는 인공지능 분야를 공부하고자 하는 분들도 보면 좋긴 하겠지만 생각보다 깊은 내용으로 당황할 수 있다.

만약 입문자라면 '이런 이런 생각을 가지고 접근하는 구나' 정도로 이해하고 레퍼런스 삼아서 지속적으로 보는게 좋을 것 같다.

하지만, 실무자 입장에서는 굉장히 괜찮은 책이다. 약 171 페이지 안에서 실무자에게 필요한 핵심적인 내용만 간결하게 추려 놓았다.

 

나는 데이터 사이언티스트나 엔지니어가 아니지만 주변 업계에 있는 분들의 얘기로는 데이터를 가공하는게 정말로 힘들고 고단한 일이라 한다. 이 책을 기준으로 관련 실무자 분들이 좀 더 수고를 덜 수 있었으면 좋겠다.

 

[결론]

초보자: 레퍼런스 삼아 계속 볼 것. 한번에 모두 이해하려 하지 말 것

실무자: 정말 좋은 레퍼런스 책!

 

 

 

 

 

 

+ Recent posts