강화학습 논문 스터디

카테고리 없음

강블루 2023. 1. 31. 14:13

논문명 : Deep Reinforcement Learning for Real-Time Optimization of Pumps in Water Distribution Systems

-> 배수 펌프의 실시간 최적화를 위한 심층 강화 학습 시스템

1)강화학습(Reinforcement Learning)

1-1 개념

: 주어진 환경과 상호작용하여 좋은 점수를 얻는 방향으로 성장하는 머신러닝 분야

: 강화학습은 AI Agent가 특정 state/situation 내에 최대의 보상 Q를 가져다주는 action을 학습하는 과정

-일반적인 강화학습 단계

환경에 따라 state가 주어짐 -> Agent는 state를 통해 이제껏 관잘해온 정보를 바탕으로 최대의 보상을 줄 action을 policy에 따라 선택 -> 보상을 받음 -> Agent는 보상을 바탕으로 policy를 업데이트하고, state는 바뀜 -> 반복

1-2 환경, 상태, 행동 그리고 보상

1-3 벨만 방정식

1-4 Q Learning

1-5 Deep Q Networks

-m pip install --upgrade pip

HuggingFace, 빅데이터분석기사필기공부법, AI, HuggingFace실습, 인공지능교육, 멋쟁이사자처럼 AI 스쿨, 논문서치, 신입개발자, AI 스쿨, STT실습, 논문읽는법, 빅데이터분석기사벼락치기, Deep Residual Learning for Image Recognition, TTS실습, 정보처리기사필기공부법, 빅데이터분석기사필기, 정보처리기사벼락치기, Trasformer, 비전공자, 빅데이터분석기사필기합격,

AI Developer