본문 바로가기
Review

[도서 리뷰] 파이썬 라이브러리를 활용한 텍스트 분석

by newnu 2022. 11. 27.
반응형

 

파이썬 라이브러리를 활용한 텍스트 분석

Blueprints for Text Analytics Using Python

 

텍스트에서 통찰을 이끌어내는 98가지 자연어 처리 전략

 

젠스 알브레히트, 싯다르트 라마찬드란, 크리스티안 윙클러 지음

심상진 옮김


1장 텍스트 데이터에서 찾는 통찰

2장 API로 추출하는 텍스트 속 통찰

3장 웹사이트 스크래핑 및 데이터 추출

4장 통계 및 머신러닝을 위한 텍스트 데이터 준비

5장 특성 엔지니어링 및 구문 유사성

6장 텍스트 분류 알고리즘

7장 텍스트 분류기

8장 비지도 학습 : 토픽 모델링 및 클러스터링

9장 텍스트 요약

10장 단어 임베딩으로 의미 관계 탐색

11장 텍스트 데이터를 이용한 감성 분석

12장 지식 그래프 구축

13장 프로덕션에서 텍스트 분석 사용


REVIEW

 

분석에 필요한 텍스트를 수집하는 방법부터 시작해서 텍스트에서 여러 가지 방법을 통해 정보를 추출하고, 머신러닝을 통하여 분석하는 과정까지 담고 있다. 모든 코드는 깃헙을 통해 직접 실습해 볼 수 있다. 각 장마다 다른 여러가지 데이터를 사용하여 각 데이터에 따라 맞는 전략을 설명한다. 각각의 데이터를 활용하여 풀 수 있는 문제, 문제를 풀기 위해 필요한 라이브러리와 전략을 다양하게 소개하여 실제 비즈니스에서 발생하는 다양한 문제에도 쉽게 적용할 수 있다. 

 

1-3장에서는 다양한 데이터셋을 수집하는 방법,

4-5장에서는 텍스트를 머신러닝에 활용하기 위해 정제하고 처리하는 방법,

6-12장에서는 수집한 텍스트를 머신러닝을 통해 분류, 요약 등의 테스크를 수행하는 과정,

13장에서는 프로덕션에서 텍스트 분석을 사용하는 방법을 담고 있다.

 

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

반응형