청와대 국민청원 데이터로 파이썬 자연어처리 입문하기(3시간)

Beginner 4 hours 한국어 120 명

박조은


참가신청하기

Tutorial Information


일시 : 2018-08-17 14:00:00 ~ 2018-08-17 17:00:00

Brief

파이콘 한국 2018이 열리는 8월에 청와대 국민청원이 시작된지 1년이 됩니다.

파이썬 자연어 처리 도구를 통해 지난 1년간의 국민청원 데이터를 분석해 봅니다.

자연어처리를 공부하고 싶으신 분들에게 텍스트 데이터를 전처리하고 시각화 하는 방법에 대해 소개하고 실습해 볼 예정입니다.

또, 임의로 결측치를 만들고 해당 결측치를 분류와 회귀 기법으로 예측해 봅니다.


Detailed description

다루는 내용

* 텍스트 데이터 전처리 및 시각화 

* 텍스트 데이터 벡터화(BOW, TF-IDF, Word2Vec)

* Random Forest 로 청원 카테고리와 투표수 예측하기


  • 대상 : 파이썬 자연어처리에 대한 기초 지식을 얻고 싶은 입문자
  • 준비물 : 개인용 노트북 그리고 Google Colaboratory 로그인을 위한 gmail계정
  • 사용할 도구  : Python3, Pandas, plotnine, soynlp, Scikit-learn, gensim, Anaconda (또는 Google Colaboratory)
  • 튜토리얼에 사용 될 노트북 : https://goo.gl/x8kasp (해당 노트북의 폴더를 개인 구글 드라이브로 복사해 주세요.)
  • github : https://github.com/corazzon/petitionWrangling  

Back to list

Sponsors

다이아몬드

사파이어

플래티넘

골드

실버

커뮤니티

미디어