캐글(Kaggle) 뉴욕시 임대 아파트 문제 머신러닝 튜토리얼

Intermediate 4 hours 한국어 45 people

이상열 캐글뽀개기

캐글뽀개기 스터디 운영진 (https://www.facebook.com/groups/kagglebreak)

데이터 분석 및 머신러닝 개발의 관심 있음. 파이콘 2016년 행사 때 diversity의 감명을 받아 신청하게 됨. 

캐글뽀개기는 다른 스터디와 다르게 학생이 많은 곳이기 때문에 항상 '희망'을 외치고 공부라는 것은 언제 어디서나

서로 배운 것을 나눠주면서 공생하는 집단 지성의 힘을 믿고 있음. 



Tutorial Information

일시 : 2017년 8월 15일

시간 : 오전 10시 ~ 오후 2시

장소 : 코엑스 그랜드볼륨 2층 

신청 : https://onoffmix.com/event/107250


Brief

튜토리얼 제목 : 캐글(Kaggle) 뉴욕시 임대 아파트 문제 머신러닝 튜토리얼

캐글(Kaggle)은 2010년에 설립된 예측모델 및 분석대회 플랫폼입니다. 캐글은 머신러닝을 처음 접하는 사람들이 다루기 좋은 데이터 품질과 문제를 푸는 솔루션이 공개되어 있습니다. 캐글은 crowdsourcing 접근 방식으로 예측 모델링 작업에 적용할 수있는 무수한 전략이 있으며 어떤 기술 또는 분석가가 가장 효과적인지를 처음부터 알 수 없다는 사실에 의존하여 문제를 접근합니다 (wikipedia)


Detailed description

튜토리얼 제목 : 캐글(Kaggle) 뉴욕시 임대 아파트 문제 머신러닝 튜토리얼
참가 필요 스킬 또는 과목 : Python(기초), 통계(기초), 머신러닝(기초)

캐글 포럼에는 데이터 분석과 머신 러닝에 관련된 많은 튜토리얼이 공개되어 있습니다. 캐글의 관심있는 사람들을 모으고자 2015년부터 캐글뽀개기 스터디를 페이스북에서 운영하고 있으며 스터디에서는 종종 캐글 문제를 풀면서 데이터 과학의 영역을 넓히고 학생들이 스터디를 통하여 데이터 분석 역량을 쌓고 직장인들은 사내에서 적용할만한 분석 솔루션을 찾는데 목표가 있습니다.


이번 파이콘 튜토리얼은 Renthop(미국 임대아파트 검색엔진)에서 제공하는 데이터를 활용하여 뉴욕 시 임대 아파트의 점수 품질을 분류하여 검색 결과를 향상하는 데 목적이 있습니다. 해당 문제는 Two Sigma and RentHop 두 회사가 공동 주최한 대회이며 현재 종료되었습니다.
이번 튜토리얼에서는 캐글을 이해하기 위해서 문제를 어떤 식으로 사람들이 접근했는 지를 포럼에서 살펴보고 Python의 대표적인 부스팅 모델인 Xgboost 라이브러리 소개 및 참가자들에게 머신러닝을 접할 수 있는 튜토리얼로 구성하려고 합니다.


예상 시간 : 약 4 hour

(캐글 및 데이터 소개, 탐색적 데이터 분석 및 솔루션 소개 ( 부스팅 모델 ), 문제 답 제출 및 평가 확인)

스터디 모임 주소 : 캐글뽀개기 (https://github.com/kagglebreak) 

튜토리얼은 Jupyter notebook으로 진행할 예정


파이썬 버전 / 미리 설치해야할 라이브러리 목록
파이썬 3.5 버전 이상으로 진행할 예정. numpy, pandas, scipy, xgboost, sklearn, seaborn, matplotlib


Back to list

Sponsors

플래티넘

골드

실버

브론즈