선박항해 에이전트 학습을 위한 보상설계 방안에 관한 연구
DC Field | Value | Language |
---|---|---|
dc.contributor.author | 박세길 | - |
dc.contributor.author | 오재용 | - |
dc.date.accessioned | 2021-12-08T07:42:03Z | - |
dc.date.available | 2021-12-08T07:42:03Z | - |
dc.date.issued | 20201113 | - |
dc.identifier.uri | https://www.kriso.re.kr/sciwatch/handle/2021.sw.kriso/2282 | - |
dc.description.abstract | 본 논문은 선박항해 에이전트가 개발 의도와 부합되도록 학습시키는데 있어 가장 중요한 역할을 수행하는 보상설계에 대해 소개한다. 보상설계는 먼저 학습 대상이 무엇인지 명확히 정의하는 것이 중요하며, 보상이 상황에 따라 다른 목적으로 활용되지 않도록 하고 에이전트에게 너무 드물게 주어지지 않도록 보상 형태화를 적용하는 등의 방법을 사용할 필요가 있다. 또한 보상을 구성하는 요소가 많아지는 경우에는 의도가 명확하게 전달이 되지 않을 수 있으므로 문제를 작은 문제들로 나누어 접근하는 계층적강화학습 방법 등을 적용할 필요가 있다. | - |
dc.language | 한국어 | - |
dc.language.iso | KOR | - |
dc.title | 선박항해 에이전트 학습을 위한 보상설계 방안에 관한 연구 | - |
dc.title.alternative | A Study on the Development of Learning Environment for Ship Navigation Agents | - |
dc.type | Conference | - |
dc.citation.title | 2020년 한국항해항만학회 추계학술대회 | - |
dc.citation.volume | 1 | - |
dc.citation.number | 1 | - |
dc.citation.startPage | 177 | - |
dc.citation.endPage | 178 | - |
dc.citation.conferenceName | 2020년 한국항해항만학회 추계학술대회 | - |
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.
(34103) 대전광역시 유성구 유성대로1312번길 32042-866-3114
COPYRIGHT 2021 BY KOREA RESEARCH INSTITUTE OF SHIPS & OCEAN ENGINEERING. ALL RIGHTS RESERVED.
Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.