- 주제는 무엇인가요?
본 세션은 tutorial 성격의 세션입니다. 주제는 요즘 많은 사람들이 관심을 보이는 데이터 분석을 위한 기본 패키지들을 소개합니다.
statsmodels: 회귀 분석 및 시계열 처리를 위한 고전적 데이터 분석 패키지
scikit-learn: classification 쪽의 머신 러닝 알고리즘을 소개하기 위한 교육용 패키지
theano: 딥 러닝이나 몬테카를로 연산에 사용되며 복잡함 수학 연산식을 심볼릭하게 컴파일하여 gradient를 계산하며 GPU 등을 위한 하위 코드로 변환해주는 패키지
또한 이러한 패키지를 사용하여 실제로 간단한 회귀 분석, 시계열 분석, 머신 러닝을 하는 과정을 설명하여 데이터 분석에서 파이썬이 어떻게 활용될 수 있는지를 보이고자 합니다.
- 대상 청중은 누구인가요?
파이썬을 사용하여 데이터 분석을 하고자하는 중급 이상의 사용자들입니다.
- 발표를 통해서 청중이 어떤 것을 얻을 수 있나요?
최근 머신 러닝 열풍으로 tensorflow 등 일부 패키지와 딥러닝을 사용한 이미지 분류 등이 인기를 얻고 있지만 사실 이러한 분야는 데이터 분석에서 극히 일부의 영역입니다. 위의 세가지 패키지를 사용하게 되면 데이터 분석의 거의 전 분야에 걸쳐 파이썬을 활용할 수 있습니다.