법률 네트워크 분석: 30년간의 변화 Changes in legal citation network over 30 years

Slide


https://www.slideshare.net/ssuser32e51e/changes-in-legal-citation-network-over-30-yearspycon-korea-2018

Video


https://www.youtube.com/watch?v=JRiCsrNJujc

Description


이 발표는 비개발자가 Python을 배우면서 얼마나 쉽게 법률 데이터를 분석하게 되었는지, 사례를 공유하는 내용입니다.

저는 과거 법제업무를 하면서 생긴 의문들을 해소해보려고 법률 데이터 분석을 시작했습니다. '법률이 늘어나고 있는데 괜찮을까, 어디에 어떤 규정이 있는지 찾기 힘들어지는데 어떻게 할까? 법문에서 발생하고 있는 오류들을 모두 입법자 탓으로 돌릴 수 있는가? 법률 시스템에 문제가 있는 것은 아닌가?' 이런 의문들이었습니다.

작년까지는 이 연구를 여러개의 유료 패키지와 단순 반복작업으로 어렵고 느리게 끌고 나갔습니다. 그러다가 우연히 나간 알파로우 스터디에서 Python을 접하면서 연구를 Python 기반으로 재구성하게 되었습니다.

비개발자가 단기간에 익혀서 코드를 짤 수 있었던 것은 "Computer programming for everybody" 라는 Python의 비전과 Python 커뮤니티 덕분이라고 생각합니다. 비록 단순 통계분석이지만, 법률 영역에서도 Python을 활용할 수 있음을 보여드리고 싶습니다. 그리고 연구 내용뿐만 아니라 비개발자가 Python을 배우면서 느낀 점, 가령 법률 만드는 일과 프로그래밍에 유사성이 있다는 점 등을 말씀드리고자 합니다.

대상 청중 expected audience

    다음 주제에 관심이 있는 분, 누구든지

    1. 네트워크 분석    network analysis
    2. 복잡성 이론    complexity theory
    3. 데이터 시각화    data visualization
    4. 리걸테크    legal tech

    분석 내용 analysis

      법률간 인용관계의 30년간 변화 Changes in Korean legal code's citation structure over 30 years

      법률을 네트워크 노드(node)로, 법률간 인용을 연결(edge)로 보고 네트워크 분석을 시도합니다. 웹크롤링으로 수집한 1985년부터 2015년까지의 법률간 인용 정보(5년 간격)로 어떤 법률이 많이 인용되는지, 시간 흐름에 따라 네트워크의 모습이 어떻게 변하는지를 분석합니다. 분석 결과 나오는 인용-피인용 수 표를 연도별, 그룹별 순위변동 차트로 시각화합니다. 그리고 법률(node)이나 인용(edge) 중 특정 단어를 포함한 경우를 네트워크 내에서 뽑아서 살펴봅니다.

      법률의 복잡성 측정 Measuring the complexity of legal code

      복잡성(complexity)과 창발(emergence)의 증거로 여겨지는 power law 분포가 법률 네트워크에서 나타나는지를 검증합니다. 법률 피인용 수가 power law, log-normal, truncated power law의 경쟁가설 중 어떤 분포를 따르는지 log likelihood 추정을 합니다. 그리고 log-log 평면에서 각 경쟁가설 분포와 실제 데이터 분포를 CCDF( = 1 - CDF)로 나타내어 시각화합니다.

      라이브러리 libraries

      1. networkX : 네트워크 분석
      2. powerlaw : 복잡성 분석
      3. matplotlib : 시각화

      + seaborn, pandas 약간

      여담 Etc.

      1. 법률과 프로그래밍 언어의 유사성 arbitrary systems of rules - legal code and programming language(feat. Stefan Wolfram)
      2. 법률은 어떤 규칙 체계인가? What kind of rules system is the legal code?
      3. 법률의 오류 사례 Frequent errors in legal code : 404, ctrl + c ctrl + v, refactoring disaster, version control failure
      4. 복잡한 네트워크, 척도 없는 네트워크 Complex network & scale-free network
      5. Why Python? : before & after
      6. 싸이버스 알파로우 소개


      One of the largest, most accessible, and best documented human-created networks in existence.


      Comments

      blog comments powered by Disqus

      Sponsors

      다이아몬드

      사파이어

      플래티넘

      골드

      실버

      커뮤니티

      미디어