구름이 하늘의 일이라면: Python과 TensorFlow를 이용한 기상예측

  • Science / Data
  • Intermediate
  • 2017-08-13 (Sun) 11:20 - 12:00
  • Korean
  • 103
  • Photography and recording is allowed

Slides

https://www.slideshare.net/haezoom/pycon-kr-2017

Video

https://youtu.be/He63UEmgjLs

Description

기계학습을 새로운 도메인의 문제에 적용하여 해결하는 전체 프로세스에 대한 인상과 노하우를 전달하는 것을 발표의 목적으로 합니다. 1) 실질적인 효용을 가져다줄 수 있는 문제를 정의하고, 2) 그에 맞는 데이터를 수집하고, 3) 머신러닝 알고리즘을 잘 설계하여 만족할만한 성능을 얻어내는 매 단계가 모두 힘든 일입니다. 주식회사 해줌에서는 태양광 발전소의 미래 전력 생산량을 예측하기 위하여 미래 기상을 예측하고 있고, 이 과정에서 각 단계를 어떻게 해결해나갔는지 공유합니다. 단순히 기계학습을 흥미 수준에서 적용하는 것이 아니라면, 기계학습을 적용했을 때 효용이 분명한 문제를 찾는 것 자체가 중요하고 어려운 일입니다. 많은 사람들이 간과하고 있지만, 기계학습을 적용했을 때의 효용이 분명하지 않거나, 잘못된 예측을 수행했을 때의 리스크가 지나치게 큰 상황들이 매우 많습니다. 이러한 부분에서 저희가 기계학습 도입을 위해 사용했던 기준과 고려사항들을 공유합니다. 머신러닝 문제를 정의했으면, 데이터를 수집하고, 문제 해결을 위한 핵심 알고리즘을 연구하고, 머신러닝 시스템을 구축해야합니다. 기상데이터에 대한 간단한 소개와 더불어, 기상데이터를 수집하고 처리하는 데에 파이썬이 어떻게 사용되었는지 공유합니다. 알고리즘 연구에서 Jupyter Notebook를 어떻게 하면 협업과 기록을 위해 보다 잘 활용할 수 있을까 고민한 결과로 수립한 워크플로우를 제안합니다. 또한 머신러닝 시스템에서, 지속가능한 머신러닝 개발을 위한 설계한 class구조를 제안합니다. 데이터를 원하는 형태로 가공한 후에는 기계학습 알고리즘을 적용하는, 가장 즐거운 단계에 들어옵니다. 주식회사 해줌의 모델은 TensorFlow로 구현되어 있으며, TensorFlow사용에 있어서 속도를 향상시키고 연구를 도와줄 수 있는 팁들을 공유합니다. Variational Autoencoder, Generative Adversarial Network을 포함하여 해줌이 시도해본 여러 가지 알고리즘들로부터 얻은 결과들을 공유합니다. 결과적으로 이를 통해 해줌이 풀고자하는 태양광 발전소 미래 전력 생산량 예측 문제가 어떻게 개선되었는지 발표합니다. 기계학습, 딥러닝, 데이터마이닝에 상당한 관심이 있으신 분들이 주된 청중이며, 실제 문제와 부딪혔을 때 해결해나가는 과정에서 얻은 인사이트를 공유할 수 있기를 기대합니다.

Comments

blog comments powered by Disqus

Sponsors