
차례
1. 이 책을 고른 이유
2. 무엇을 배웠나요?
3. 어떤 게 좋았나요?
4. 마치며
1. 이 책을 고른 이유
첫 번째 이유
이 책을 고른 첫 번째 이유는 지금 다니는 회사에서 고객 데이터 감정 분석 기술이 필요했기 때문이다.
하지만 책이 배송되었을 때는 이미 프로젝트는 조각조각 난도당한 상태였고,
이사 준비로 바빠 뒤늦게 본가에 가 책을 수령한 나는 의미를 잃어버린 그 녀석을 소중하게 집어 들었다.

심지어 길벗 측의 사소한 실수로 책이 5권이 발송되어서 '어떠카지! 어떠카지!' 하다가 성윤님한테 연락드려 책을 돌려드리러 묵직한 그 녀석의 4개의 분신을 들고 뚜벅뚜벅 편의점을 왔다가 갔다. 성윤 님도 왔다 갔다 힘드셨을 거야. 성윤님 너무 고생 많으셨어요ㅠㅠ
두 번째 이유
이 책을 고른 두 번째 이유. 3년 전부터 자연어 처리에 대한 해소되지 않은 갈증이 남아있었다.
그 때 나는 졸업논문 주제를 '신문 기사 3줄 요약 AI'로 잡았었다.
(AI 수업 하나 잘 보고 잔뜩 신이 나서 감히 잠자는 NLP의 코털을 건드렸다)
데이콘에서 한국어 문서를 요약하는 챌린지가 있었는데 거기서 제공받은 신문 기사 데이터를 바탕으로 textrank 나 KoGPT2 처럼 직접 나만의 자연어 처리 모델을 만드려고 했지만, 빈약한 배경지식과 관련 자료의 부족. 물리적 시간, 정신적 나의 에너지를 고려하지 않아 당당하게 실패하고 말았다.
결국, 졸업논문은 textrank를 사용한 신문 기사 요약, 생성 웹을 만드는 것으로 방향을 전환했었는데, 그 당시에 못해본 찝찝함을 해소해 보고자 이 책을 골랐다.
2. 무엇을 배웠나요?
책의 목차는 다음과 같다.
1장. 자연어 분석 준비
2장. 스크래퍼로 데이터 수집
3장. 수집한 데이터로 자연어 분석
4장. 자연어 분석에 필요한 통계 공부
부록 A. GPT-3.5로 자연어 분석하기
부록 B. 코랩 시작하기
부록 C. GPU 사용 설정하기
1장에서는 파이썬 기초와 Pandas를 사용해 엑셀 쪼개고 붙이고 자르고 하는 그런 것들이 자세하게 나와 있다. 이 책을 읽으며 정인근 선생님이 대단히 따뜻한 사람이라고 혼자 멋대로 생각하게 되었는데, 되게 편한 단어들을 주로 사용하고 친절한 옆집 아저씨 같은 말투로 서술되어 있다는 것이다. 중간중간 주는 팁들도 그렇고, 간단한 matplotlib로 그래프 그리는 것까지 알려줘 대학시절 생각이 살짝살짝 낫다. (사실 1장은 힐끔 보고 건너 뛰었다.)
2장에서는 크롤링과 스크래퍼에 대해 다룬다. 길벗 사이트 스크래핑을 해보는 과정이 인상적이었고(ㅋㅋㅋㅋ 길벗 랜딩 페이지가 바뀌는 순간 2장의 예시는 모두 사용할 수 없게 된다!)
3장에서는 실제 데이터를 분석하는 과정을 다룬다. 개념 -> 실습 형태로 해서 흐르듯 이해하며 넘어갈 수 있었고, 흥미 깊은 주제(ex. 어떤 떡볶이가 맛있을까, 내 여자친구 최애 쿠션 찾아주기)에 대해 얘기하며 중간중간 데이터와 머신러닝 개념들을 설명하는 게 인상적이다.
4장은 본격적으로 데이터 용어들을 다룬다. 간단하게 설명되어 있어 데이터에 대해 무지한 사람이 읽기 좋을 것 같다. 실제로 그래프를 그려보는 과정은 갓 파이썬 입문한 사람들에게 귀할 것 같다는 생각을 했다.
3. 어떤 게 좋았나요?
의문을 먼저 해결해 주는 소프트한 데이터 분석
책을 읽다가 어? 이건 어떻게 하지?라는 부분이 생기면 바로 다음 장에 그것에 대한 개념과 실습이 있다.
여러 가지 라이브러리 제공과 비교 분석
한국어 맞춤법 교정을 해주는 hanspell 라이브러리는 더 이상 pip으로 설치할 수 없는데, 소스파일을 제공해 줬다! (감사)
koromon이나 okt 같은 형태소 분석기를 비교 분석하며 알려주는 부분이 세심하다고 생각했다.
흥미로운 주제로 해보는 실습
남자 개발자라면 응당 목차를 보고 3.4 '내 여자친구 최애 쿠션 찾아 주기'부터 펼쳐봤을 것이다. 나만 그런가 이런 킥을 놓치지 않는 부분이 참 좋았다.
편안한 단어와 편안한 말투. 따뜻한 설명
딱딱한 전문 용어나 복잡한 문장을 사용하지 않고 누구나 쉽게 이해할 수 있는 쉽고 부드러운 단어를 위주로 사용한다.
알맞은 도식을 사용하고 자연스러운 문체로 흘러가서 읽는데 피로감이 덜하다.
독자를 설득시켜 주는 책.
근시안적인 결과에 대해 경계하는 저자는, 데이터를 이용해 설득하는 방법을 보여준다고 나는 생각했다. 주어진 데이터를 이용해 '맛있는 떡볶이'를 기획하는 저자의 단단한 논리에 감히 의심을 품을 수 없었다.
※ 길벗 출판사의 후원을 받아 서평을 작성했습니다. 책을 받게 되어 영광입니다. 감사합니다.
https://www.yes24.com/Product/Goods/125892195
고객 니즈가 보이는 데이터 분석 with 파이썬 - 예스24
고객의 진정한 니즈가 담긴 데이터를 수집하고 분석한다!유튜브, 네이버 카페, 트위터 등에서 찾아내는 고객 니즈와 시장 트렌드!데이터 시대에서 살아가고 있는 만큼, 데이터를 분석해 의사 결
www.yes24.com