파이썬 라이브러리를 활용한 텍스트 분석
Blueprints for Text Analytics Using Python
텍스트에서 통찰을 이끌어내는 98가지 자연어 처리 전략
젠스 알브레히트, 싯다르트 라마찬드란, 크리스티안 윙클러 지음
심상진 옮김
1장 텍스트 데이터에서 찾는 통찰
2장 API로 추출하는 텍스트 속 통찰
3장 웹사이트 스크래핑 및 데이터 추출
4장 통계 및 머신러닝을 위한 텍스트 데이터 준비
5장 특성 엔지니어링 및 구문 유사성
6장 텍스트 분류 알고리즘
7장 텍스트 분류기
8장 비지도 학습 : 토픽 모델링 및 클러스터링
9장 텍스트 요약
10장 단어 임베딩으로 의미 관계 탐색
11장 텍스트 데이터를 이용한 감성 분석
12장 지식 그래프 구축
13장 프로덕션에서 텍스트 분석 사용
REVIEW
분석에 필요한 텍스트를 수집하는 방법부터 시작해서 텍스트에서 여러 가지 방법을 통해 정보를 추출하고, 머신러닝을 통하여 분석하는 과정까지 담고 있다. 모든 코드는 깃헙을 통해 직접 실습해 볼 수 있다. 각 장마다 다른 여러가지 데이터를 사용하여 각 데이터에 따라 맞는 전략을 설명한다. 각각의 데이터를 활용하여 풀 수 있는 문제, 문제를 풀기 위해 필요한 라이브러리와 전략을 다양하게 소개하여 실제 비즈니스에서 발생하는 다양한 문제에도 쉽게 적용할 수 있다.
1-3장에서는 다양한 데이터셋을 수집하는 방법,
4-5장에서는 텍스트를 머신러닝에 활용하기 위해 정제하고 처리하는 방법,
6-12장에서는 수집한 텍스트를 머신러닝을 통해 분류, 요약 등의 테스크를 수행하는 과정,
13장에서는 프로덕션에서 텍스트 분석을 사용하는 방법을 담고 있다.
한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.
'Review' 카테고리의 다른 글
트랜스포머를 활용한 자연어처리 (0) | 2022.12.30 |
---|---|
[도서 리뷰] 데이터 스토리 (0) | 2022.10.26 |
[도서리뷰] 소문난 명강의 : 김기현의 딥러닝 부트캠프 with 파이토치 (0) | 2022.10.02 |
[도서 리뷰] 그로킹 심층 강화학습 (0) | 2022.08.28 |
[도서 리뷰] 파이썬을 활용한 베이지안 통계 (0) | 2022.07.23 |