본문 바로가기

분류 전체보기32

Neural Network - 인공신경망 사실, 코드 넣기가 너무 복잡해서 티스토리를 계속 할까 말까 고민하다가 이게 웬일인가요!! ㅎ_ㅎ 코드도 추가할 수 있게 되었네요. 오호호..!!!! 그렇다면.. 힘내서 다시 이 블로그에 잘 정리해볼까 합니다. 슉슉 고우고우! 오늘은 Neural Network에 대해서 아주 간단하게 정리를 해볼까 해요. 중요한 것만 짚고 넘어갈까 합니다. Neural Network, 인공신경망 인공지능이라는 것이 우리의 뇌를 표방하여 만든 건데요.. 이름만 들어도 짐작 할 수 있겠다 싶이, Neuron 이라는 우리의 신경세포를 모티브로 만들어지게 된 알고리즘입니다. 그래서 그런지 생김새도 우리의 뉴런과 굉장히 유사해요. Perceptron 좌측이 우리 뇌의 신경세포이고, 우측이 그를 본 따 만든 인공신경이라고 생각하면 .. 2019. 5. 1.
딥러닝실습을 위한 간단 개발환경 설정 (Git, Python) for Window 빠른 실습을 위한 간단 개발환경 설정 방법 :-) 사이트 참고 ▼https://github.com/udacity/deep-reinforcement-learning 1. Git 설치하기 for Window참고> http://dev-gabriel.tistory.com/21 2. Anaconda 설치하기참고> https://dwfox.tistory.com/67 3. 개발 가상환경 Setting 4. 관련 library 설치 1)open AI Gym 관련git clone https://github.com/openai/gymcd gympip install -e . 2) RL 관련 pkg 설치git clone https://github.com/udacity/deep-reinforcement-learning.git .. 2019. 1. 9.
Reinforcement Learning(강화학습) 개념 이해하기 (2) MDPs Reinforcement Learning problem as a 'Markov Decision Process (MDP)' * Example : Goal : 쓰레기통아,, 쓰레기를 최대한 많이 치워줘 !Condition : 쓰레기통의 밧데리가 한정되어 있다. 그러나 중간에 DOCKING STATION에서 Charging 가능!Question : 밧데리가 별로 없을때 주변에 쓰레기와 DOCKING STATION이 주어진 상황에서 쓰레기를 먼저 주울까? 아니면 밧데리를 충전하러 가는게 좋을까? Definition :- Action (A) : 쓰레기통이 행할 수 있는 모든 액션 (Action Space) 1) 쓰레기를 찾는다. (=줍는다). 2) 밧데리를 충전한다. 3)대기한다. - States (S) : 주어.. 2019. 1. 9.
Reinforcement Learning(강화학습) 개념 이해하기 (1) Reinforcement Learning - 박석 * UDACITY에서 제공하는 강화학습 자료 : https://github.com/udacity/deep-reinforcement-learning * Reinforcement BOOK (like bible)..ㅎ_ㅎ (pdf download)http://incompleteideas.net/book/the-book.html시작하기에 앞서 notation에 대한 정보는 위 git에서 cheatsheet 를 참고하자. *Applications - AlphaGo Zero (AlphaGo Zero win.) AlphaGo는 기보를 직접 학습해서 만들어진 Supervised Learning. AlphaGo Zero는 only Reinforcement Learning.. 2019. 1. 9.