본문 바로가기

deep learning4

딥러닝실습을 위한 간단 개발환경 설정 (Git, Python) for Window 빠른 실습을 위한 간단 개발환경 설정 방법 :-) 사이트 참고 ▼https://github.com/udacity/deep-reinforcement-learning 1. Git 설치하기 for Window참고> http://dev-gabriel.tistory.com/21 2. Anaconda 설치하기참고> https://dwfox.tistory.com/67 3. 개발 가상환경 Setting 4. 관련 library 설치 1)open AI Gym 관련git clone https://github.com/openai/gymcd gympip install -e . 2) RL 관련 pkg 설치git clone https://github.com/udacity/deep-reinforcement-learning.git .. 2019. 1. 9.
Reinforcement Learning(강화학습) 개념 이해하기 (2) MDPs Reinforcement Learning problem as a 'Markov Decision Process (MDP)' * Example : Goal : 쓰레기통아,, 쓰레기를 최대한 많이 치워줘 !Condition : 쓰레기통의 밧데리가 한정되어 있다. 그러나 중간에 DOCKING STATION에서 Charging 가능!Question : 밧데리가 별로 없을때 주변에 쓰레기와 DOCKING STATION이 주어진 상황에서 쓰레기를 먼저 주울까? 아니면 밧데리를 충전하러 가는게 좋을까? Definition :- Action (A) : 쓰레기통이 행할 수 있는 모든 액션 (Action Space) 1) 쓰레기를 찾는다. (=줍는다). 2) 밧데리를 충전한다. 3)대기한다. - States (S) : 주어.. 2019. 1. 9.
Reinforcement Learning(강화학습) 개념 이해하기 (1) Reinforcement Learning - 박석 * UDACITY에서 제공하는 강화학습 자료 : https://github.com/udacity/deep-reinforcement-learning * Reinforcement BOOK (like bible)..ㅎ_ㅎ (pdf download)http://incompleteideas.net/book/the-book.html시작하기에 앞서 notation에 대한 정보는 위 git에서 cheatsheet 를 참고하자. *Applications - AlphaGo Zero (AlphaGo Zero win.) AlphaGo는 기보를 직접 학습해서 만들어진 Supervised Learning. AlphaGo Zero는 only Reinforcement Learning.. 2019. 1. 9.
Tensorflow, Input pipeline 예제 코드 (string_input_producer) Tensorflow Input Pipeline 구현 TensorFlow를 이용해서 딥러닝을 구현하고자 할 때, 먼저 데이터를 로드하고, 그래프를 정의하고 학습을 하는 코드를 작성할 것이다. 가장 먼저 일어나는 학습 데이터를 불러오는 일은 보통 Numpy나 Pandas로 처리하기도 하지만, 최근에는 메모리 활용을 잘한다는 tf.Data API 또한 많이 이용하고 있다. 내가 만난 문제점은 바로 이 것 ,, 만약 Training Data의 용량이 매~우 클 경우에는 한번에 Load할 경우, 엄청나게 많은 Memory를 잡고있기 때문에 효율적이지 못하다.어떻게 적은 메모리를 사용하면서 대용량의 이미지 데이터를 학습할 수 있을까? string_input_producer 활용방법 1) Image File Dire.. 2018. 8. 28.