본문 바로가기

AI 이론과 개발의 혼재23

k-means Clustering - 군집화 알고리즘 Machine Learning 알고리즘 중에서도 매우 기본 중에 기본인 k-means clustering에 대해서 알아볼께요. k-means 군집 알고리즘은, 어떤 데이터들이 있을 때, 유사한 데이터들끼리 자동으로 그룹핑을 해주는 알고리즘 입니다. 기본 로직은 아래와 같습니다. 모든 ML 알고리즘은 반복적인 과정을 통해 최적화를 해나가는 특징이 있습니다. 마찬가지로 k-means 알고리즘도 n번의 iteration 과정을 거쳐 최종 군집 결과를 보여주게 됩니다. 기본 로직을 단계별로 한번 살펴볼께요 ! (1) Choose random k points and set as cluster centers. A. raw data 말 그대로, 날 것의 data 그 자체예요. 데이터가 이렇게 있다고 했을 때, 몇 개.. 2020. 4. 23.
Python - MySQL (PyMySQL 설치, 기본 사용법 CRUD) Python. MySQL 기본 사용법 1. PyMySQL 설치 Python에서 MySQL을 사용하기 위해서는 먼저 PyMySQL 설치가 필요합니다. pip install PyMySQL 2. 테이블 생성 / 삭제 예제와 함께 해봅시다요~ (1) 테이블 생성 import pymysql.cursors def create_table(): conn = pymysql.connect(host=HOST, user=USER, password=PW, db=DB, charset='utf8mb4') sql = ''' CREATE TABLE USERS ( USER_ID VARCHAR(50) NOT NULL PRIMARY KEY, USER_NM VARCHAR(200) NOT NULL COMMENT '사용자명', TEL_NO VA.. 2020. 4. 23.
Python - DB2 연동 (라이브러리 설치, CRUD 테스트) IBM에서 제공하는 DB2와 python 연동을 하려고 하는데, 왜 이렇게 reference가 부실한 것인지.. ^_ㅠ 좀 정리좀 해둬야겠다. 1. 라이브러리 설치 pip install ibm_db 설치가 제대로 되었는지는, python에서 import ibm_db 를 실행했을 때 문제가 없으면 잘 설치 되었다는 것^_^ 2. DB Connection 설정 파이썬에서, DB 접속을 가능하게 하기 위해서는 DB Connection 을 설정해주어야 합니다. Python - DB2 Connection IBM에서 일반적으로 2개의 connection 방법을 제공한다. "persistent connection vs. non- persistent connection" 비지속 연결(non-persistent conn.. 2020. 4. 23.
태블로(Tableau) Prep 써보기 - DB 연동 워우, 요즘 들어 이것저것 Tool을 다양하게 쓰다보니 뇌에 한계가 오는 것 같습니다. 매번 발전하는 기술에 적응하기 너무 힘든 것 같아요.. ㅠㅠ 음,, 이번에 친해져볼 Tool은 BI Tool에서 유명한 것 중 하나인 태블로(tableau)입니다. 전세계 BI 툴의 장단점을 고려했을 때, 데이터 시각화 및 분석에 좋다고 하여서 한번 사용해보도록 해보겠습니다. 기본적으로 엑셀을 통해 데이터를 불러오는 것도 가능하지만, 저는 Prep이라는 데이터 전처리 Tool을 이용하여 DB에서 데이터를 가져오고, 원하는 모습으로 바꿔서 사용해보고자 합니다. 1. DB Connector 설치 DB에 데이터가 있다는 가정하에, 데이터를 가져오기 위해 DB 접근이 가능하도록 해야겠죠!~ https://mariadb.com.. 2020. 3. 31.