본문 바로가기

Studies/ML-Agents3

[ML-Agents] 유니티에 ML-Agents 적용하기 // 파이토치와 유니티 ML-Agents로 배우는 강화학습 책에 대한 공부 요약 글입니다.  개요   유니티에서 ML-Agents를 활용해 강화학습을 진행하려면, 학습을 진행할 환경을 구축할 수 있어야 한다. 본 글에서는 환경 구축에 필요한 과정, 특히나 유니티에 ML-Agents를 적용하는 과정에 대해 알아본다.  파이썬 설치 / 유니티 설치 버전 확인하기  책이나 ML-Agents 공식 문서에서 권장하는 버전은 생각보다 잘 동작하지 않았다. 본 글에서는 시행착오 끝에 다음 버전을 사용한다.Python : 3.9.13Unity : 2022.3.28f1ml-agents : 0.30.0ml-agents-envs : 0.30.0PyTorch : 2.4.0numpy : 1.12.1 깃허브에서 ML-Agents.. 2024. 8. 22.
[ML-Agents] ML-Agents 구성 요소 알아보기 - Agent Script // 파이토치와 유니티 ML-Agents로 배우는 강화학습 책에 대한 공부 요약 글입니다. 개요  ML-agents의 구성 요소를 간단하게 살펴보고, 그 중 Agent 스크립트의 구성요소에 대해 알아본다.       Agent Script - Max Step  Max Step은 한 에피소드의 최대 스텝 수를 결정하는 값이다. Max Step이 5000으로 설정되어 있으면, 5000스텝이 지나야 한 에피소드가 종료된다. 에피소드 (Episode) : 에이전트가 어떠한 환경 내에서 행동을 시작하고, 특정한 조건을 만족하거나 목표에 도달하여 행동이 끝날 때 까지의 여정 하나를 하나의 에피소드라고 부른다.   Agent Script 의 주요 함수 - Initialize public override void.. 2024. 8. 14.
[ML-Agents] ML-Agents 구성 요소 알아보기 - Behavior Parameters // 파이토치와 유니티 ML-Agents로 배우는 강화학습 책에 대한 공부 요약 글입니다. 개요  ML-agents의 구성 요소를 간단하게 살펴보고, 그 중 Behavior Parameter 컴포넌트의 구성요소에 대해 알아본다.      ML-Agents 의 구성 요소  ML-Agents 예제 3D Ball의 3DBall의 Agent를 클릭하면, 인스펙터에서 다음과 같은 컴포넌트들을 찾아볼수 있다.Behavior ParametersBall 3D AgentDecision RequesterModel Overrider Behavior Parameters  Behavior Parameters는 학습에 필요한 여러가지 파라미터들을 관리하는 컴포넌트다. Behavior Parameters는 다음과 같은 구성 요소들.. 2024. 8. 9.