This post, leveraging AI, summarizes and analyzes the key aspects of the research paper “GENERAL PRINCIPLES OF LEARNING-BASED MULTI-AGENT SYSTEMS”. For in-depth information, please refer to the original PDF.
📄 Original PDF: Download / View Fullscreen
English Summary
The paper discusses the design of large decentralized systems, where agents are restricted to communicate with only a few neighbors. The authors propose using reinforcement learning (RL) algorithms for such systems and present a mathematical framework called COINs. They investigate the real-world applicability of the core concepts of this framework via two computer experiments and demonstrate that their COINs perform near optimally in a difficult variant of Arthur’s bar problem. However, they also illustrate optimal performance for their COINs in a machine learning-like fashion to facilitate leader-follower problem solving.
Key Technical Terms
Below are key technical terms and their explanations to help understand the core concepts of this paper. You can explore related external resources via the links next to each term.
- Multi-Agent Systems (MAS) [Wikipedia (Ko)] [Wikipedia (En)] [나무위키] [Google Scholar] [Nature] [ScienceDirect] [PubMed]
Explanation: A group of autonomous agents that can communicate and cooperate to achieve a common goal. - Reinforcement Learning (RL) [Wikipedia (Ko)] [Wikipedia (En)] [나무위키] [Google Scholar] [Nature] [ScienceDirect] [PubMed]
Explanation: A type of machine learning in which an agent learns to make decisions by interacting with its environment and receiving rewards or penalties based on those decisions. - Artificial Collective Intelligence (COIN) [Wikipedia (Ko)] [Wikipedia (En)] [나무위키] [Google Scholar] [Nature] [ScienceDirect] [PubMed]
Explanation: {Concise English explanation 1 for Term 1}. {Optional: Related Technology/Concept: [Related Term]} - Multi-Agent System (MAS) [Wikipedia (Ko)] [Wikipedia (En)] [나무위키] [Google Scholar] [Nature] [ScienceDirect] [PubMed]
Explanation: A system consisting of multiple agents that can communicate and interact with each other to achieve a common goal. - COIN (Collective INtelligence) [Wikipedia (Ko)] [Wikipedia (En)] [나무위키] [Google Scholar] [Nature] [ScienceDirect] [PubMed]
Explanation: A framework for designing large decentralized systems using multi-agent systems (MAS) and reinforcement learning (RL). It aims to ensure that agents’ RL algorithms do not work at cross-purposes, maximizing the global goal. COINs perform well in experiments, including Arthur’s bar problem. - MAS (Multi-Agent System) [Wikipedia (Ko)] [Wikipedia (En)] [나무위키] [Google Scholar] [Nature] [ScienceDirect] [PubMed]
Explanation: A system consisting of multiple agents that interact with each other to achieve a common goal.
View Original Excerpt (English)
GENERAL PRINCIPLES OF LEARNING-BASED MULTI-AGENT SYSTEMS David H. Wolpert Kevin R. Wheeler Kagan Tumer NASA Ames Research Center NASA Ames Research Center NASA Ames Research Center Moffett Field, CA 94035 Caelum Research Caelum Research dhw@ptolemy.arc.nasa.gov Moffett Field, CA 94035 Moffett Field, CA 94035 kwheeler@mail.arc.nasa.gov kagan@ptolemy.arc.nasa.gov September 6, 2018 1999 ABSTRACT 4. Control of a large, distributed chemical plant. We consider the problem of how to design large decentralized These kinds of problems may well be most readily ad-May multi-agent systems (MAS’s) in an automated fashion, with dressed by using a large Multi-Agent System (MAS) [19], little or no hand-tuning. Our approach has each agent run where each agent is restricted to communicate with only a a reinforcement learning algorithm. This converts the prob- few neighbors, and where each agent runs a Reinforcement10 lem into one of how to automatically set/update the reward Learning (RL) algorithm. In such systems, a crucial problem functions for each of the agents so that the global goal is is ensuring that the agents’ RL algorithms do not “work at achieved. In particular we do not want the agents to “work cross-purposes”, so that their collective behavior maximizes at cross-purposes” as far as the global goal is concerned. We a provided global utility function. The difficulty in achiev- use the term artificial COllective INtelligence (COIN) to re- ing this is that these systems have no centralized control, so fer to systems that embody solutions to this problem. In this the dynamics is governed by the collective effects of the indi- paper we present a summary of a mathematical framework vidual agents each modifying their behavior via their (local) RL algorithms.[cs.MA] for COINs. We then investigate the real-world applicability of the core concepts of that framework via two computer ex- We are interested in such systems where…
🇰🇷 한국어 보기 (View in Korean)
한글 요약 (Korean Summary)
이 논문은 대규모 분산 시스템의 설계에 대해 논의하며, 이는 에이전트가 소수의 이웃과 의사 소통하도록 제한됩니다. 저자는 그러한 시스템에 대한 RL (Renforcement Learning) 알고리즘을 사용하여 코인이라는 수학적 프레임 워크를 제시합니다. 그들은 두 개의 컴퓨터 실험을 통해이 프레임 워크의 핵심 개념의 실제 적용 가능성을 조사하고 동전이 Arthur의 막대 문제의 어려운 변형에서 최적으로 성능을 발휘한다는 것을 보여줍니다. 그러나 그들은 또한 코인의 최적의 성능을 기계 학습과 같은 방식으로 보여주기 위해 리더-팔로우 문제 해결을 촉진합니다.
주요 기술 용어 (한글 설명)
- Multi-Agent Systems (MAS)
설명 (Korean): 공동 목표를 달성하기 위해 의사 소통하고 협력 할 수있는 자율적 인 에이전트 그룹.
(Original English: A group of autonomous agents that can communicate and cooperate to achieve a common goal.) - Reinforcement Learning (RL)
설명 (Korean): 에이전트가 환경과 상호 작용하고 해당 결정에 따라 보상 또는 처벌을 받음으로써 결정을 내리는 법을 배우는 기계 학습 유형.
(Original English: A type of machine learning in which an agent learns to make decisions by interacting with its environment and receiving rewards or penalties based on those decisions.) - Artificial Collective Intelligence (COIN)
설명 (Korean): {1}의 간결한 영어 설명 1}. {선택 사항 : 관련 기술/개념 : [관련 용어]}
(Original English: {Concise English explanation 1 for Term 1}. {Optional: Related Technology/Concept: [Related Term]}) - Multi-Agent System (MAS)
설명 (Korean): 공통 목표를 달성하기 위해 서로 통신하고 상호 작용할 수있는 여러 에이전트로 구성된 시스템.
(Original English: A system consisting of multiple agents that can communicate and interact with each other to achieve a common goal.) - COIN (Collective INtelligence)
설명 (Korean): MAS (Multi Agent Systems) 및 강화 학습 (RL)을 사용하여 대형 분산 시스템을 설계하기위한 프레임 워크. 에이전트의 RL 알고리즘이 교차 목적으로 작동하지 않도록하여 글로벌 목표를 극대화하는 것을 목표로합니다. 동전은 Arthur의 막대 문제를 포함하여 실험에서 잘 작동합니다.
(Original English: A framework for designing large decentralized systems using multi-agent systems (MAS) and reinforcement learning (RL). It aims to ensure that agents’ RL algorithms do not work at cross-purposes, maximizing the global goal. COINs perform well in experiments, including Arthur’s bar problem.) - MAS (Multi-Agent System)
설명 (Korean): 공통 목표를 달성하기 위해 서로 상호 작용하는 여러 에이전트로 구성된 시스템.
(Original English: A system consisting of multiple agents that interact with each other to achieve a common goal.)
발췌문 한글 번역 (Korean Translation of Excerpt)
학습 기반 다중 에이전트 시스템의 일반 원칙 David H. Wolpert Kevin R. Wheeler Kagan Tumer NASA Ames Research Center NASA AMES 연구 센터 NASA AMES RESTEAR CENTRE MO U ETT FIEL, CA 94035 CAELUM RESTEAR CAELUM RESTEAR DHW@ptolemy.ARC.NASA.GOV MO ff ETT FIEL, CA 94035 MO ett Field, CA 9435 kwheeler@mail.arc.nasa.gov kagan@ptolemy.arc.nasa.gov 2018 년 9 월 6 일 1999 년 초록 4. 대형 분산 화학 공장의 제어. 우리는 이러한 종류의 문제가 큰 다중 에이전트 시스템 (MAS)을 사용하여 옷을 입어 드레스를 입어 자동화 된 방식으로 이러한 종류의 문제가 대규모로 분산 된 대형 분산화 된 방법에 대한 문제를 고려합니다 [19], 손을조차하지 않아도됩니다. 우리의 접근 방식은 각 에이전트가 강화 학습 알고리즘과 만 통신하도록 제한되는 각 에이전트가 실행됩니다. 이것은 소수의 이웃을 변환하고 각 에이전트가 RL (Resward Learning) 알고리즘을 자동으로 설정/업데이트하는 방법 중 하나로 강화 10 LEM을 실행합니다. 이러한 시스템에서 각 에이전트에 대한 중요한 문제 기능은 에이전트의 RL 알고리즘이 “달성되지 않는다는 것입니다. 특히 우리는 에이전트가”작업 “을”작업 “하기를 원하지 않으므로 전 세계 목표에 관한 한 집단적 행동이 교차 검사에서 최대화되기를 원합니다. 우리는 제공된 글로벌 유틸리티 기능을 제공합니다. 이를 위해 인공 집단 지능 (코인)이라는 용어를 달성하는 데 있어서는이 시스템이 중앙 집중화 된 제어가 없으므로이 문제에 대한 솔루션을 구현하는 시스템에 대한 제어가 없다는 것입니다. 이 역학에서는 개별 논문의 집단적 영향에 의해 지배된다. 우리는 (로컬) RL 알고리즘을 통해 동작을 수정하는 수학적 프레임 워크 Vidual 에이전트의 요약을 제시한다. [cs.ma] 코인. 그런 다음 두 컴퓨터를 통해 해당 프레임 워크의 핵심 개념의 실제 적용 가능성을 조사합니다. 우리는 그러한 시스템에 관심이 있습니다.
Source: arXiv.org (or the original source of the paper)
답글 남기기