ilikeafrica.com

Innovative Summaries and Translations of Scientific Papers

다앐 언어로 작성된 최적화 SEO 제목

|

이 게시물은 논문을 기반으로 AI가 생성한 요약 및 분석 결과입니다. 원문 PDF를 다운로드하거나 브라우저에서 직접 확인하세요.

➡️ 원문 PDF 다운로드


Summary (English)

In this paper, the authors present a summary of David H.
Wolpert’s mathematical framework for Multi-Agent Systems (MAS).
The COllective INtelligence (COIN) approach is used to design large decentralized systems with little centralized communication or control, and involves agents modifying their behavior via reinforcement learning algorithms.
These alterations are designed so as to facilitate leader-follower experiments in the achievement of global objectives.
The COIN framework investigates various formalizations of desiderata that whenever local utility values increase, then so must the value of the world utility.
One way agents can achieve large values of their local utility functions is by modifying the agent’s utilities via reinforcement learning algorithms.
However due to uncertainties in the type of the agent for interactions, dynamics are set in the COIN initialization process which usually involves only a good first guess.

요약 (Korean)

이 논문에서 저자들은 다중 에이전트 시스템 (MAS)에 대한 David H.
Wolpert의 수학적 프레임 워크에 대한 요약을 제시한다.
COIN (Collective Intelligence) 접근 방식은 중앙 집중식 커뮤니케이션 또는 제어가 거의없는 대형 분산 시스템을 설계하는 데 사용되며 강화 학습 알고리즘을 통해 행동을 수정하는 에이전트가 포함됩니다.
이러한 변경은 글로벌 목표 달성에서 리더-팔로워 실험을 용이하게하기 위해 설계되었습니다.
코인 프레임 워크는 로컬 유틸리티 값이 증가 할 때마다 세계 유틸리티의 가치도 증가해야한다는 Desiderata의 다양한 공식화를 조사합니다.
한 가지 방법 에이전트는 로컬 유틸리티 기능의 많은 값을 달성 할 수 있습니다.
강화 학습 알고리즘을 통해 에이전트의 유틸리티를 수정하는 것입니다.
그러나 상호 작용을위한 에이전트 유형의 불확실성으로 인해, 동전 초기화 프로세스에서 역학이 일반적으로 좋은 첫 번째 추측 만 포함됩니다.

기술적 용어 설명 (Technical Terms)

본 논문을 이해하는 데 도움이 되는 주요 기술 용어와 일반적인 설명을 제공합니다. 각 용어 옆의 링크를 통해 외부 참고 자료를 검색해 볼 수 있습니다.

  • Multi-Agent Systems (MAS) [Wikipedia] [NASA] [PubMed] [Nature] [arXiv]: 중앙 집중식 커뮤니케이션 또는 제어가 거의없는 분산 시스템은 강화 학습 알고리즘을 통해 행동을 수정하여 글로벌 목표를 달성합니다. (Original: Decentralized systems with little centralized communication or control, involving agents modifying their behavior via reinforcement learning algorithms to achieve global objectives.)
  • Reinforcement Learning Algorithms [Wikipedia] [NASA] [PubMed] [Nature] [arXiv]: MAS 시스템의 에이전트가 사용하는 기술은 글로벌 목표 달성에서 리더-팔로워 실험을 용이하게하기 위해 행동을 수정합니다. (Original: A technique used by agents in MAS systems where they modify their behavior so as to facilitate leader-follower experiments in the achievement of global objectives.)
  • COllective INtelligence (COIN) [Wikipedia] [NASA] [PubMed] [Nature] [arXiv]: 중앙 집중식 커뮤니케이션 또는 제어가 거의없는 다중 에이전트 시스템과 관련된 접근법은 에이전트가 강화 학습 알고리즘을 통해 행동을 수정하고 강화 학습이라는 프로세스를 통해 지역 유틸리티 기능의 많은 가치를 달성합니다. (Original: An approach involving Multi-Agent Systems with little centralized communication or control, where agents modify their behavior via reinforcement learning algorithms and achieve large values of their local utility functions through a process called reinforcement learning.)

Excerpt (English Original)

GENERAL PRINCIPLES OF LEARNING-BASED MULTI-AGENT SYSTEMS David H.
Wolpert Kevin R.
Wheeler Kagan Tumer NASA Ames Research Center NASA Ames Research Center NASA Ames Research Center Moffett Field, CA 94035 Caelum Research Caelum Research dhw@ptolemy.arc.nasa.gov Moffett Field, CA 94035 Moffett Field, CA 94035 kwheeler@mail.arc.nasa.gov kagan@ptolemy.arc.nasa.gov September 6, 2018 1999 ABSTRACT 4.
Control of a large, distributed chemical plant.
We consider the problem of how to design large decentralized These kinds of problems may well be most readily ad-May multi-agent systems (MAS’s) in an automated fashion, with dressed by using a large Multi-Agent System (MAS) [19], little or no hand-tuning.
Our approach has each agent run where each agent is restricted to communicate with only a a reinforcement learning algorithm.
This converts the prob- few neighbors, and where each agent runs a Reinforcement10 lem into one of how to automatically set/update the reward Learning (RL) algorithm.
In such systems, a crucial problem functions for each of the agents so that the global goal is is ensuring that the agents’ RL algorithms do not “work at achieved.
In particular we do not want the agents to “work cross-purposes”, so that their collective behavior maximizes at cross-purposes” as far as the global goal is concerned.
We a provided global utility function.
The difficulty in achiev- use the term artificial COllective INtelligence (COIN) to re- ing this is that these systems have no centralized control, so fer to systems that embody solutions to this problem.
In this the dynamics is governed by the collective effects of the indi- paper we present a summary of a mathematical framework vidual agents each modifying their behavior via their (local) RL algorithms.[cs.MA] for COINs.
We then investigate the real-world applicability of the core concepts of that framework via two computer ex- We are interested in such systems where…

발췌문 (Korean Translation)

학습 기반 다중 에이전트 시스템의 일반 원칙 David H.
Wolpert Kevin R.
Wheeler Kagan Tumer NASA Ames Research Center NASA AMES 연구 센터 NASA AMES RESTEAR CENTRE MO U ETT FIEL, CA 94035 CAELUM RESTEAR CAELUM RESTEAR DHW@ptolemy.ARC.NASA.GOV MO ff ETT FIEL, CA 94035 MO ett Field, CA 9435 kwheeler@mail.arc.nasa.gov kagan@ptolemy.arc.nasa.gov 2018 년 9 월 6 일 1999 년 초록 4.
대형 분산 화학 공장의 제어.
우리는 이러한 종류의 문제가 큰 다중 에이전트 시스템 (MAS)을 사용하여 옷을 입어 드레스를 입어 자동화 된 방식으로 이러한 종류의 문제가 대규모로 분산 된 대형 분산화 된 방법에 대한 문제를 고려합니다 [19], 손을조차하지 않아도됩니다.
우리의 접근 방식은 각 에이전트가 강화 학습 알고리즘과 만 통신하도록 제한되는 각 에이전트가 실행됩니다.
이것은 소수의 이웃을 변환하고 각 에이전트가 RL (Resward Learning) 알고리즘을 자동으로 설정/업데이트하는 방법 중 하나로 강화 10 LEM을 실행합니다.
이러한 시스템에서 각 에이전트에 대한 중요한 문제 기능은 에이전트의 RL 알고리즘이 “달성되지 않는다는 것입니다.
특히 우리는 에이전트가”작업 “을”작업 “하기를 원하지 않으므로 전 세계 목표에 관한 한 집단적 행동이 교차 검사에서 최대화되기를 원합니다.
우리는 제공된 글로벌 유틸리티 기능을 제공합니다.
이를 위해 인공 집단 지능 (코인)이라는 용어를 달성하는 데 있어서는이 시스템이 중앙 집중화 된 제어가 없으므로이 문제에 대한 솔루션을 구현하는 시스템에 대한 제어가 없다는 것입니다.
이 역학에서는 개별 논문의 집단적 영향에 의해 지배된다.
우리는 (로컬) RL 알고리즘을 통해 동작을 수정하는 수학적 프레임 워크 Vidual 에이전트의 요약을 제시한다.
[cs.ma] 코인.
그런 다음 두 컴퓨터를 통해 해당 프레임 워크의 핵심 개념의 실제 적용 가능성을 조사합니다.
우리는 그러한 시스템에 관심이 있습니다.

출처: arXiv

➡️ 원문 PDF 다운로드 (하단)