-
데이터 / 바이오 파이썬
-
2014-08-30 (Sat) 14:00 - 14:45
-
Korean
-
젬마홀
-
-
Photography and recording is not allowed
Slide
http://www.lucypark.kr/slides/2014-pyconkr/
Description
NLTK 덕에 파이썬으로 자연어처리를 하는 것이 편리해졌다. 단, 한국어만 분석하려하지 않는다면. 파이썬으로 한국어를 분석할 수는 없을까? 국문, 영문, 중문 등 다양한 문자가 섞여 있는 문서는 어떻게 분석을 할 수 있을까?
이 발표에서는 자연어처리의 기초적인 개념을 다룬 후, NLTK 등의 자연어처리 라이브러리와 한국어 분석을 위해 개발중인 KoNLPy를 소개한다. 또, 파이썬으로 한국어를 분석할 때 유용한 몇 가지 트릭을 공유한다.
- Presentation slides (HTML): http://lucypark.kr/slides/2014-pyconkr/
Comments
blog comments powered by