ilikeafrica.com

Innovative Summaries and Translations of Scientific Papers

arXiv:cs/9905005v1 [cs.MA] 10 May 1999

|

This post provides an AI-generated summary and analysis of the scientific paper titled “arXiv:cs/9905005v1 [cs.MA] 10 May 1999“. You can access the original PDF document directly using the links provided.

➡️ Download Original PDF Document


Summary (English)

Multi-Agent Systems (MAS’s) are decentralized systems that utilize reinforcement learning algorithms to automate design and control processes. These MAS’s aim to achieve global objectives through agents with reward functions, while ensuring that the agents do not work at cross-purposes. The COIN framework investigates these concepts by designing a mathematical framework for COllective INtelligence (COIN) systems where alterations are made via reinforcement learning algorithms and overall system structure is automatically set. Experiments were conducted to test the usefulness of COIN concepts in various domains, including leader-follower experiments.


요약 (Korean Summary)

MAS (Multi-Agent Systems)는 강화 학습 알고리즘을 활용하여 설계 및 제어 프로세스를 자동화하는 분산 시스템입니다. 이 MAS의 목표는 보상 기능을 갖춘 에이전트를 통해 글로벌 목표를 달성하는 동시에 에이전트가 교차 목적으로 작동하지 않도록합니다. 코인 프레임 워크는 강화 학습 알고리즘을 통한 변경이 이루어지고 전체 시스템 구조가 자동으로 설정되는 집단 인텔리전스 (COIN) 시스템을위한 수학적 프레임 워크 (COIN) 시스템을위한 수학적 프레임 워크를 설계함으로써 이러한 개념을 조사합니다. 리더-팔로워 실험을 포함한 다양한 영역에서 코인 개념의 유용성을 테스트하기 위해 실험을 수행 하였다.


Key Technical Terms (Explained in Korean with English Original)

The following key technical terms from the paper are explained to aid understanding. Original English explanations are also provided, along with quick search links to external resources.

  • Multi-Agent Systems (MAS’s) [Wikipedia] [Britannica] [NASA] [PubMed] [Nature] [arXiv]: 자동화 된 보상 기능 및 전반적인 시스템 구조 업데이트를 통해 글로벌 목표를 달성하기 위해 강화 학습 알고리즘을 실행하는 에이전트로 설계된 분산 시스템. (Original English: Decentralized systems designed with agents that run reinforcement learning algorithms to achieve global objectives through automated reward functions and overall system structure updates.)
  • COllective INtelligence (COIN) [Wikipedia] [Britannica] [NASA] [PubMed] [Nature] [arXiv]: 강화 학습 알고리즘을 통해 변경되는 시스템을 설계하기위한 프레임 워크로, 에이전트가 집단적 행동 효과를 달성하면서 상사에서 작동하지 않도록합니다. (Original English: A framework for designing systems where alterations are made via reinforcement learning algorithms, ensuring that the agents do not work at cross-purposes while achieving collective behavioral effects.)

Excerpt from the Paper (English Original)

GENERAL PRINCIPLES OF LEARNING-BASED MULTI-AGENT SYSTEMS David H. Wolpert Kevin R. Wheeler Kagan Tumer NASA Ames Research Center NASA Ames Research Center NASA Ames Research Center Moffett Field, CA 94035 Caelum Research Caelum Research dhw@ptolemy.arc.nasa.gov Moffett Field, CA 94035 Moffett Field, CA 94035 kwheeler@mail.arc.nasa.gov kagan@ptolemy.arc.nasa.gov September 6, 2018 1999 ABSTRACT 4. Control of a large, distributed chemical plant. We consider the problem of how to design large decentralized These kinds of problems may well be most readily ad-May multi-agent systems (MAS’s) in an automated fashion, with dressed by using a large Multi-Agent System (MAS) [19], little or no hand-tuning. Our approach has each agent run where each agent is restricted to communicate with only a a reinforcement learning algorithm. This converts the prob- few neighbors, and where each agent runs a Reinforcement10 lem into one of how to automatically set/update the reward Learning (RL) algorithm. In such systems, a crucial problem functions for each of the agents so that the global goal is is ensuring that the agents’ RL algorithms do not “work at achieved. In particular we do not want the agents to “work cross-purposes”, so that their collective behavior maximizes at cross-purposes” as far as the global goal is concerned. We a provided global utility function. The difficulty in achiev- use the term artificial COllective INtelligence (COIN) to re- ing this is that these systems have no centralized control, so fer to systems that embody solutions to this problem. In this the dynamics is governed by the collective effects of the indi- paper we present a summary of a mathematical framework vidual agents each modifying their behavior via their (local) RL algorithms.[cs.MA] for COINs. We then investigate the real-world applicability of the core concepts of that framework via two computer ex- We are interested in such systems where…

논문 발췌 (Korean Translation)

학습 기반 다중 에이전트 시스템의 일반 원칙 David H. Wolpert Kevin R. Wheeler Kagan Tumer NASA Ames Research Center NASA AMES 연구 센터 NASA AMES RESTEAR CENTRE MO U ETT FIEL, CA 94035 CAELUM RESTEAR CAELUM RESTEAR DHW@ptolemy.ARC.NASA.GOV MO ff ETT FIEL, CA 94035 MO ett Field, CA 9435 kwheeler@mail.arc.nasa.gov kagan@ptolemy.arc.nasa.gov 2018 년 9 월 6 일 1999 년 초록 4. 대형 분산 화학 공장의 제어. 우리는 이러한 종류의 문제가 큰 다중 에이전트 시스템 (MAS)을 사용하여 옷을 입어 드레스를 입어 자동화 된 방식으로 이러한 종류의 문제가 대규모로 분산 된 대형 분산화 된 방법에 대한 문제를 고려합니다 [19], 손을조차하지 않아도됩니다. 우리의 접근 방식은 각 에이전트가 강화 학습 알고리즘과 만 통신하도록 제한되는 각 에이전트가 실행됩니다. 이것은 소수의 이웃을 변환하고 각 에이전트가 RL (Resward Learning) 알고리즘을 자동으로 설정/업데이트하는 방법 중 하나로 강화 10 LEM을 실행합니다. 이러한 시스템에서 각 에이전트에 대한 중요한 문제 기능은 에이전트의 RL 알고리즘이 “달성되지 않는다는 것입니다. 특히 우리는 에이전트가”작업 “을”작업 “하기를 원하지 않으므로 전 세계 목표에 관한 한 집단적 행동이 교차 검사에서 최대화되기를 원합니다. 우리는 제공된 글로벌 유틸리티 기능을 제공합니다. 이를 위해 인공 집단 지능 (코인)이라는 용어를 달성하는 데 있어서는이 시스템이 중앙 집중화 된 제어가 없으므로이 문제에 대한 솔루션을 구현하는 시스템에 대한 제어가 없다는 것입니다. 이 역학에서는 개별 논문의 집단적 영향에 의해 지배된다. 우리는 (로컬) RL 알고리즘을 통해 동작을 수정하는 수학적 프레임 워크 Vidual 에이전트의 요약을 제시한다. [cs.ma] 코인. 그런 다음 두 컴퓨터를 통해 해당 프레임 워크의 핵심 개념의 실제 적용 가능성을 조사합니다. 우리는 그러한 시스템에 관심이 있습니다.

Source: arXiv.org (or other source if specified in the paper)

➡️ Re-Download Original PDF (Bottom of Page)