본문 바로가기

AI 이론과 개발의 혼재23

딥러닝실습을 위한 간단 개발환경 설정 (Git, Python) for Window 빠른 실습을 위한 간단 개발환경 설정 방법 :-) 사이트 참고 ▼https://github.com/udacity/deep-reinforcement-learning 1. Git 설치하기 for Window참고> http://dev-gabriel.tistory.com/21 2. Anaconda 설치하기참고> https://dwfox.tistory.com/67 3. 개발 가상환경 Setting 4. 관련 library 설치 1)open AI Gym 관련git clone https://github.com/openai/gymcd gympip install -e . 2) RL 관련 pkg 설치git clone https://github.com/udacity/deep-reinforcement-learning.git .. 2019. 1. 9.
Reinforcement Learning(강화학습) 개념 이해하기 (2) MDPs Reinforcement Learning problem as a 'Markov Decision Process (MDP)' * Example : Goal : 쓰레기통아,, 쓰레기를 최대한 많이 치워줘 !Condition : 쓰레기통의 밧데리가 한정되어 있다. 그러나 중간에 DOCKING STATION에서 Charging 가능!Question : 밧데리가 별로 없을때 주변에 쓰레기와 DOCKING STATION이 주어진 상황에서 쓰레기를 먼저 주울까? 아니면 밧데리를 충전하러 가는게 좋을까? Definition :- Action (A) : 쓰레기통이 행할 수 있는 모든 액션 (Action Space) 1) 쓰레기를 찾는다. (=줍는다). 2) 밧데리를 충전한다. 3)대기한다. - States (S) : 주어.. 2019. 1. 9.
Reinforcement Learning(강화학습) 개념 이해하기 (1) Reinforcement Learning - 박석 * UDACITY에서 제공하는 강화학습 자료 : https://github.com/udacity/deep-reinforcement-learning * Reinforcement BOOK (like bible)..ㅎ_ㅎ (pdf download)http://incompleteideas.net/book/the-book.html시작하기에 앞서 notation에 대한 정보는 위 git에서 cheatsheet 를 참고하자. *Applications - AlphaGo Zero (AlphaGo Zero win.) AlphaGo는 기보를 직접 학습해서 만들어진 Supervised Learning. AlphaGo Zero는 only Reinforcement Learning.. 2019. 1. 9.
프로그래밍 언어별 딥러닝 라이브러리 프로그래밍 언어별 딥러닝 라이브러리 http://terrorjang.tistory.com/145 2018. 8. 30.