Is online news comment really a voice of people?
- Data Gathering
- Difficulty Beginner
- 2018-08-19 (Sun) 11:00 - 11:40
- Korean
- 102
- Photography and recording is not allowed
Description
N모사와 D모사 뉴스를 보면 기사 내용과는 전혀 무관하다고 할 수 있는 반복적인 댓글이 자주 등장하는 것을 볼 수 있습니다. 하지만 글쓴이의 ID도 같지 않은 경우도 많습니다. 그렇다면 이 글쓴이들은 누구이고, 얼마나 많은 댓글을 쓰고있고, 얼마나 다양한 내용(주제 혹은 실제 글 내용)의 댓글을 쓰고있을까요?
위 질문에 답하기 위해 N모사의 뉴스와 D모사의 뉴스에서
- 댓글들을 크롤링하고 + 저장하는 과정,
- 저장한 데이터를 Pandas/Dask를 이용해 전처리하는 과정,
- 그리고 몇가지 간단한 데이터 분석 (#잘된것, #망한것) 사례를 통해
'댓글'이라는 방식이 신뢰할만한 데이터 분석의 원천이 될 수 있는지 알아봅니다.