多智能体入门
在上一章中,我们简要讨论了单智能体的创建。虽然对许多情况来说,单智能体可能已经足够,但更复杂的任务通常需要协作和团队合作,这也就是多智能体为什么必不可少的原因。MetaGPT的核心优势也在于轻松灵活地开发一个智能体团队。在MetaGPT框架下,用户可以通过少量代码实现智能体之间的交互。
完成本节,你将能够:
- 理解智能体之间如何进行交互
- 开发你的第一个智能体团队
运行“软件公司”示例
python startup.py --idea "write a function that calculates the product of a list",
python startup.py --idea "write a function that calculates the product of a list",
开发你的第一个智能体团队
希望你会发现软件创业示例很有启发。也许现在你已经有了灵感,想要开发一个根据你的独特需求而定制的智能体团队。在本节中,我们将继续在智能体入门中的简单代码示例中添加更多角色,并引入智能体之间的交互协作。
让我们还雇佣一名测试人员和一名审阅人员携手与编码人员一起工作。这开始看起来像一个开发团队了,不是吗?总的来说,我们需要三个步骤来建立团队并使其运作:
- 定义每个角色能够执行的预期动作
- 基于标准作业程序(SOP)确保每个角色遵守它。通过使每个角色观察上游的相应输出结果,并为下游发布自己的输出结果,可以实现这一点。
- 初始化所有角色,创建一个带有环境的智能体团队,并使它们之间能够进行交互。
完整的代码在本教程的末尾可用
定义动作和角色
与智能体入门相同的过程,我们可以定义三个具有各自动作的Role
:
SimpleCoder
具有SimpleWriteCode
动作,接收用户的指令并编写主要代码SimpleTester
具有SimpleWriteTest
动作,从SimpleWriteCode
的输出中获取主代码并为其提供测试套件SimpleReviewer
具有SimpleWriteReview
动作,审查来自SimpleWriteTest
输出的测试用例,并检查其覆盖范围和质量
通过上述概述,我们使得 SOP(标准作业程序)变得更加清晰明了。接下来,我们将详细讨论如何根据 SOP 来定义Role
。
定义动作
我们列举了三个 Action
。
class SimpleWriteCode(Action):
PROMPT_TEMPLATE = """
Write a python function that can {instruction} and provide two runnnable test cases.
Return ```python your_code_here ``` with NO other texts,
your code:
"""
def __init__(self, name="SimpleWriteCode", context=None, llm=None):
super().__init__(name, context, llm)
async def run(self, instruction: str):
prompt = self.PROMPT_TEMPLATE.format(instruction=instruction)
rsp = await self._aask(prompt)
code_text = parse_code(rsp)
return code_text
class SimpleWriteCode(Action):
PROMPT_TEMPLATE = """
Write a python function that can {instruction} and provide two runnnable test cases.
Return ```python your_code_here ``` with NO other texts,
your code:
"""
def __init__(self, name="SimpleWriteCode", context=None, llm=None):
super().__init__(name, context, llm)
async def run(self, instruction: str):
prompt = self.PROMPT_TEMPLATE.format(instruction=instruction)
rsp = await self._aask(prompt)
code_text = parse_code(rsp)
return code_text
class SimpleWriteTest(Action):
PROMPT_TEMPLATE = """
Context: {context}
Write {k} unit tests using pytest for the given function, assuming you have imported it.
Return ```python your_code_here ``` with NO other texts,
your code:
"""
def __init__(self, name="SimpleWriteTest", context=None, llm=None):
super().__init__(name, context, llm)
async def run(self, context: str, k: int = 3):
prompt = self.PROMPT_TEMPLATE.format(context=context, k=k)
rsp = await self._aask(prompt)
code_text = parse_code(rsp)
return code_text
class SimpleWriteTest(Action):
PROMPT_TEMPLATE = """
Context: {context}
Write {k} unit tests using pytest for the given function, assuming you have imported it.
Return ```python your_code_here ``` with NO other texts,
your code:
"""
def __init__(self, name="SimpleWriteTest", context=None, llm=None):
super().__init__(name, context, llm)
async def run(self, context: str, k: int = 3):
prompt = self.PROMPT_TEMPLATE.format(context=context, k=k)
rsp = await self._aask(prompt)
code_text = parse_code(rsp)
return code_text
class SimpleWriteReview(Action):
PROMPT_TEMPLATE = """
Context: {context}
Review the test cases and provide one critical comments:
"""
def __init__(self, name="SimpleWriteReview", context=None, llm=None):
super().__init__(name, context, llm)
async def run(self, context: str):
prompt = self.PROMPT_TEMPLATE.format(context=context)
rsp = await self._aask(prompt)
return rsp
class SimpleWriteReview(Action):
PROMPT_TEMPLATE = """
Context: {context}
Review the test cases and provide one critical comments:
"""
def __init__(self, name="SimpleWriteReview", context=None, llm=None):
super().__init__(name, context, llm)
async def run(self, context: str):
prompt = self.PROMPT_TEMPLATE.format(context=context)
rsp = await self._aask(prompt)
return rsp
定义角色
在许多多智能体场景中,定义Role
可能只需几行代码。对于SimpleCoder
,我们做了两件事:
- 使用
_init_actions
为Role
配备适当的Action
,这与设置单智能体相同 - 多智能体操作逻辑:我们使
Role
_watch
来自用户或其他智能体的重要上游消息。回想我们的SOP,SimpleCoder
接收用户指令,这是由MetaGPT中的BossRequirement
引起的Message
。因此,我们添加了self._watch([BossRequirement])
。
这就是用户需要做的全部。对于那些对底层机制感兴趣的人,请参见本教程的本章中的机制解释。
class SimpleCoder(Role):
def __init__(
self,
name: str = "Alice",
profile: str = "SimpleCoder",
**kwargs,
):
super().__init__(name, profile, **kwargs)
self._watch([BossRequirement])
self._
init_actions([SimpleWriteCode])
class SimpleCoder(Role):
def __init__(
self,
name: str = "Alice",
profile: str = "SimpleCoder",
**kwargs,
):
super().__init__(name, profile, **kwargs)
self._watch([BossRequirement])
self._
init_actions([SimpleWriteCode])
与上述相似,对于 SimpleTester
,我们:
- 使用
_init_actions
为SimpleTester
配备SimpleWriteTest
动作 - 使
Role
_watch
来自其他智能体的重要上游消息。回想我们的SOP,SimpleTester
从SimpleCoder
中获取主代码,这是由SimpleWriteCode
引起的Message
。因此,我们添加了self._watch([SimpleWriteCode])
。一个扩展的问题:想一想如果我们使用
self._watch([SimpleWriteCode, SimpleWriteReview])
会意味着什么,可以尝试这样做
此外,你可以为智能体定义自己的操作逻辑。这适用于Action
需要多个输入的情况,你希望修改输入,使用特定记忆,或进行任何其他更改以反映特定逻辑的情况。因此,我们:
- 重写
_act
函数,就像我们在智能体入门中的单智能体设置中所做的那样。在这里,我们希望SimpleTester
将所有记忆用作编写测试用例的上下文,并希望有5个测试用例。
class SimpleTester(Role):
def __init__(
self,
name: str = "Bob",
profile: str = "SimpleTester",
**kwargs,
):
super().__init__(name, profile, **kwargs)
self._init_actions([SimpleWriteTest])
self._watch([SimpleWriteCode])
# self._watch([SimpleWriteCode, SimpleWriteReview]) # 可以尝试这样做
async def _act(self) -> Message:
logger.info(f"{self._setting}: ready to {self._rc.todo}")
todo = self._rc.todo
# context = self.get_memories(k=1)[0].content # 使用最近的记忆作为上下文
context = self.get_memories() # 使用所有记忆作为上下文
code_text = await todo.run(context, k=5) # 指定参数
msg = Message(content=code_text, role=self.profile, cause_by=type(todo))
return msg
class SimpleTester(Role):
def __init__(
self,
name: str = "Bob",
profile: str = "SimpleTester",
**kwargs,
):
super().__init__(name, profile, **kwargs)
self._init_actions([SimpleWriteTest])
self._watch([SimpleWriteCode])
# self._watch([SimpleWriteCode, SimpleWriteReview]) # 可以尝试这样做
async def _act(self) -> Message:
logger.info(f"{self._setting}: ready to {self._rc.todo}")
todo = self._rc.todo
# context = self.get_memories(k=1)[0].content # 使用最近的记忆作为上下文
context = self.get_memories() # 使用所有记忆作为上下文
code_text = await todo.run(context, k=5) # 指定参数
msg = Message(content=code_text, role=self.profile, cause_by=type(todo))
return msg
按照相同的过程定义 SimpleReviewer
:
class SimpleReviewer(Role):
def __init__(
self,
name: str = "Charlie",
profile: str = "SimpleReviewer",
**kwargs,
):
super().__init__(name, profile, **kwargs)
self._init_actions([SimpleWriteReview])
self._watch([SimpleWriteTest])
class SimpleReviewer(Role):
def __init__(
self,
name: str = "Charlie",
profile: str = "SimpleReviewer",
**kwargs,
):
super().__init__(name, profile, **kwargs)
self._init_actions([SimpleWriteReview])
self._watch([SimpleWriteTest])
创建一个团队并添加角色
现在我们已经定义了三个 Role
,是时候将它们放在一起了。我们初始化所有角色,设置一个 Team
,并hire
它们。
运行 Team
,我们应该会看到它们之间的协作!
async def main(
idea: str = "write a function that calculates the product of a list",
investment: float = 3.0,
n_round: int = 5,
):
logger.info(idea)
team = Team()
team.hire(
[
SimpleCoder(),
SimpleTester(),
SimpleReviewer(),
]
)
team.invest(investment=investment)
team.start_project(idea)
await team.run(n_round=n_round)
if __name__ == '__main__':
fire.Fire(main)
async def main(
idea: str = "write a function that calculates the product of a list",
investment: float = 3.0,
n_round: int = 5,
):
logger.info(idea)
team = Team()
team.hire(
[
SimpleCoder(),
SimpleTester(),
SimpleReviewer(),
]
)
team.invest(investment=investment)
team.start_project(idea)
await team.run(n_round=n_round)
if __name__ == '__main__':
fire.Fire(main)
本教程的完整脚本
https://github.com/geekan/MetaGPT/blob/main/examples/build_customized_multi_agents.py
使用以下命令运行:
python examples/build_customized_multi_agents.py --idea "write a function that calculates the product of a list"
python examples/build_customized_multi_agents.py --idea "write a function that calculates the product of a list"
或在Colab上运行
机制解释
虽然用户可以编写几行代码来设置运行的Role
,但描述内部机制是有益的,这样用户就能理解设置代码的含义,并对框架有一个整体的了解。
如图的右侧部分所示,Role
将从Environment
中_observe
Message
。如果有一个Role
_watch
的特定 Action
引起的 Message
,那么这是一个有效的观察,触发Role
的后续思考和操作。在 _think
中,Role
将选择其能力范围内的一个 Action
并将其设置为要做的事情。在 _act
中,Role
执行要做的事情,即运行 Action
并获取输出。将输出封装在 Message
中,最终 _publish
到 Environment
,完成了一个完整的智能体运行。
在每个步骤中,无论是 _observe
、_think
还是 _act
,Role
都将与其 Memory
交互,通过添加或检索来实现。此外,MetaGPT提供了 react
过程的不同模式。这些部分的详细内容,请参阅使用记忆 和 思考与行动。
当每个 Role
被适当设置时,我们可以看到与本教程中前面示例相应的SOP,如图的左侧部分所示。虚线框表明如果我们使 SimpleTester
同时 _watch
SimpleWriteCode
和 SimpleWriteReview
,则可以扩展 SOP。
我们鼓励对此感兴趣的开发人员查看 Role
的代码,因为它相当易读。可以 run
、_observe
、react
、_think
、_act
、_publish
的内容,应该能够让你对其有一个相当不错的理解。