SC0908 SC1956 SC1944 SC4907 SC7909 SC0916 SC2920 SC2940 SC1941 SCN902

자바, 미안하다! 파이썬 한국어 NLP

  • 데이터 / 바이오 파이썬
  • 2014-08-30 (Sat) 14:00 - 14:45
  • Korean
  • 젬마홀
  • Photography and recording is not allowed

Slide

http://www.lucypark.kr/slides/2014-pyconkr/

Description

NLTK 덕에 파이썬으로 자연어처리를 하는 것이 편리해졌다. 단, 한국어만 분석하려하지 않는다면. 파이썬으로 한국어를 분석할 수는 없을까? 국문, 영문, 중문 등 다양한 문자가 섞여 있는 문서는 어떻게 분석을 할 수 있을까?

이 발표에서는 자연어처리의 기초적인 개념을 다룬 후, NLTK 등의 자연어처리 라이브러리와 한국어 분석을 위해 개발중인 KoNLPy를 소개한다. 또, 파이썬으로 한국어를 분석할 때 유용한 몇 가지 트릭을 공유한다.


- KoNLPy docs: http://konlpy.readthedocs.org

- Presentation slides (HTML): http://lucypark.kr/slides/2014-pyconkr/
- Presentation slides (PDF): http://slideshare.net/lucypark/py-con-2014-38531830

Comments

blog comments powered by Disqus

Sponsor list


골드


실버


출판 및 미디어


플래티넘