딥러닝4 Reinforcement Learning(강화학습) 개념 이해하기 (2) MDPs Reinforcement Learning problem as a 'Markov Decision Process (MDP)' * Example : Goal : 쓰레기통아,, 쓰레기를 최대한 많이 치워줘 !Condition : 쓰레기통의 밧데리가 한정되어 있다. 그러나 중간에 DOCKING STATION에서 Charging 가능!Question : 밧데리가 별로 없을때 주변에 쓰레기와 DOCKING STATION이 주어진 상황에서 쓰레기를 먼저 주울까? 아니면 밧데리를 충전하러 가는게 좋을까? Definition :- Action (A) : 쓰레기통이 행할 수 있는 모든 액션 (Action Space) 1) 쓰레기를 찾는다. (=줍는다). 2) 밧데리를 충전한다. 3)대기한다. - States (S) : 주어.. 2019. 1. 9. Reinforcement Learning(강화학습) 개념 이해하기 (1) Reinforcement Learning - 박석 * UDACITY에서 제공하는 강화학습 자료 : https://github.com/udacity/deep-reinforcement-learning * Reinforcement BOOK (like bible)..ㅎ_ㅎ (pdf download)http://incompleteideas.net/book/the-book.html시작하기에 앞서 notation에 대한 정보는 위 git에서 cheatsheet 를 참고하자. *Applications - AlphaGo Zero (AlphaGo Zero win.) AlphaGo는 기보를 직접 학습해서 만들어진 Supervised Learning. AlphaGo Zero는 only Reinforcement Learning.. 2019. 1. 9. AdamOptimizer Save and Restore for Retraining - 딥러닝 재학습 TensorFlow를 이용하여 딥러닝 재학습 하기 이미 기학습된 모델을 불러와 예측/분류 하는 일은 비교적 간편하나,그 모델을 다시 불러와서 재학습시키는 것은 생각보다 까다로웠다. --물론 필자에게만 해당된 얘기일수도^_ㅠ --TensorFlow를 이용하여 딥러닝 재학습을 하기 위한 방법 및 이슈 해결 방안을 기록한다. 방법1. logits, optimizer 재정의 학습한 모델을 먼저 불러와보자. Input Data를 넣을 Placeholder X, X2, Y와 분류 결과를 내뱉는 logits 를 가져왔다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24with tf.Session() as sess : saver = tf.train.imp.. 2018. 8. 30. Tensorflow, Input pipeline 예제 코드 (string_input_producer) Tensorflow Input Pipeline 구현 TensorFlow를 이용해서 딥러닝을 구현하고자 할 때, 먼저 데이터를 로드하고, 그래프를 정의하고 학습을 하는 코드를 작성할 것이다. 가장 먼저 일어나는 학습 데이터를 불러오는 일은 보통 Numpy나 Pandas로 처리하기도 하지만, 최근에는 메모리 활용을 잘한다는 tf.Data API 또한 많이 이용하고 있다. 내가 만난 문제점은 바로 이 것 ,, 만약 Training Data의 용량이 매~우 클 경우에는 한번에 Load할 경우, 엄청나게 많은 Memory를 잡고있기 때문에 효율적이지 못하다.어떻게 적은 메모리를 사용하면서 대용량의 이미지 데이터를 학습할 수 있을까? string_input_producer 활용방법 1) Image File Dire.. 2018. 8. 28. 이전 1 다음