본문 바로가기

분류 전체보기32

영국 런던 그레이트 스모그, 1952 1952년 12월의 시작쯤, 그때 당시에 영국의 산업화로 스모그가 자주 끼는 현상이 발생했는데 추운 겨울날, 낮은 질의 석탄 사용량이 폭등하면서 런던은 짙은 안개에 빠지게 된다. 런던에 들이닥친 그레이트 스모그로 단 4일동안 약 일 만명이 넘는 사람들이 호흡기곤란 혹은 시야 미확보로 인해 사고로 죽었던 사건 그때 당시 총리였던 처칠에겐 운이 좋았던 걸까? 결과적으로는 그 이후 1956년에 대기오염방지법을 내면서 더 살기 좋은 세상이 되긴 했다. 경험으로 인한 발전 2020. 3. 12.
개발환경 01 - KoNLPy 설치하기 한글 텍스트 마이닝은 진짜 하기 싫었는데; 어쩌다보니 맡게 되었으니,, 한번 해봅시답! 화이팅! Window 버전, KoNLPy 설치하기 KoNLPy는 Korean+NLP+py 이런 느낌으로 네이밍 한게 아닐까 싶은데, 어쨌던! 한국어를 대상으로 자연어처리하기 위한 패키지다. 잘몰랐는데, 윈도우 상에서 얘를 설치하려면 번거로운 작업들이 몇 가지 필요하다.. 지난번에 뻘짓하며 한번 설치했었는데, 노트북을 바꾸게 되면서.. 또 한 번 고생할 걸 생각하여,, 기록을 위해 남겨둔다 ㅠ_ㅠ ※ Install에 대한 메뉴얼 위치 : https://konlpy-ko.readthedocs.io/ko/v0.4.3/install/ 설치하기 — KoNLPy 0.4.3 documentation 주석 설치 및 사용 도중 문제가.. 2020. 2. 5.
Anaconda, TensorFlow 설치 1. Anaconda 설치 https://www.anaconda.com/distribution/#download-section Anaconda Python/R Distribution - Free Download Anaconda Distribution is the world's most popular Python data science platform. Download the free version to access over 1500 data science packages and manage libraries and dependencies with Conda. www.anaconda.com 2. Conda 가상환경 생성 Anaconda Prompt 실행 후, 아래와 같이 입력한다. conda create .. 2020. 1. 29.
기술통계량 훑어보기 for EDA 기술 통계량에서 흔히 다루는 개념들에 대해서 알아보자. 평균 : 중심 = 대표값 표준편차 : 퍼짐을 나타내는 정도 = 산포 = 다름 분산 : 다름의 평균 값 samples : 1, 2, 8, 9 평균 : (1+2+8+9)/4 = 5 분산 : ((1-5)^2 + (2-5)^2 + (8-5)^2 + (9-5)^2 ) / (n-1) 표준편차(s) : root (분산) => 평균과 평균적으로 이정도의 편차를 보이고 있다라고 해석한다. 이상치가 있을 경우에 위의 방식대로 표본의 특징을 나타내는 것은 매우 위험하다. 분산이나 표준편차를 구할때, 편차들의 합에 자유도 만큼으로 나눠준다. 자유도(df : degree of freedom)는 데이터의 갯수(n)일 수도 있고, n-1일 수도 있음 자유도란? (Degree .. 2019. 7. 16.