Facebook AI Research 已经构建并开源了 BlenderBot 2.0,这是第一个可以同时建立长期记忆的聊天机器人,它可以持续访问、搜索互联网以获取及时信息,并就几乎任何主题进行复杂的对话。这是对原版的重大更新
在与人交谈时,BlenderBot 2.0 表明,与它的前身、现有的最先进的聊天机器人相比,它更擅长在多个会话中进行更长、更有见识且事实一致的对话。
该模型获取在对话期间收集的相关信息并将其存储在长期记忆中,以便它可以在可能持续数天、数周甚至数月的正在进行的对话中利用这些知识。知识针对与之交谈的每个人单独存储,这确保在一次对话中学到的新信息不会在另一次对话中使用。
在对话期间,该模型可以生成上下文互联网搜索查询,读取结果,并在回复人们的问题和评论时整合该信息。这意味着该模型在不断变化的世界中保持最新状态。
今天,我们发布了完整的模型、代码和评估设置,以及两个新的对话数据集——互联网搜索支持的人类对话,以及与参考之前会话的人的多会话聊天——用于训练模型,因此其他研究人员可以重现这项工作并推进对话式人工智能研究。
当前的语言生成模型,例如 GPT-3和 Facebook AI 的第一个版本可以清晰地表达自己,至少在正在进行的对话中,并生成看起来逼真的文本。但他们遭受了非常短暂的“金鱼记忆,”而且他们所拥有的任何长期记忆都是静态的——仅限于他们之前所学的内容。他们永远无法获得额外的知识,这就是为什么 GPT-3 和 BlenderBot 认为 NFL 巨星汤姆·布雷迪(Tom Brady)仍在新英格兰爱国者队效力,并且不知道他与坦帕湾海盗队一起赢得了 2021 年超级碗冠军的原因。
如果你昨天告诉 GPT-3 或 BlenderBot 1.0 什么,它今天就会忘记它。更糟糕的是,由于他们的算法存在缺陷,这些模型臭名昭著地产生了知识幻觉——也就是说,自信地陈述不正确的信息
聊天机器人不必受到这些限制的束缚,这就是为什么我们很高兴地宣布我们将通过我们的研究平台发布一个新的开源聊天机器人 BlenderBot 2.0
. BlenderBot 2.0 具有访问记忆和减少幻觉的能力,它建立在 BlenderBot 的原始版本之上,BlenderBot 是第一个将多种对话技能(包括同理心、知识和个性)融合到一个系统中的聊天机器人。
对语言模型生成的研究进展迅速,作为一个行业,我们拥有比以往任何时候都更好的工具来显着扩展聊天机器人的对话能力。虽然现有系统可以询问和回答关于食物、电影或乐队等基本问题,但它们通常难以处理更复杂或自由形式的对话,例如详细讨论 Tom Brady 的职业生涯。
但是,基于 BlenderBot 2.0 的技术有朝一日可以成为日常生活中有用的一部分,因为它能够就任何可持续数天、数周甚至数月的话题进行多会话对话,并增加它所知道和可以谈论的内容对话发展。这是因为它是第一个能够生成互联网搜索查询、随着时间的推移使用和构建知识并参考以前的想法的聊天机器人。这些进步,包括建立长期记忆和增强与互联网信息对话的能力,克服了当前系统的一些缺点。在测试中,我们发现 BlenderBot 2.0 优于现有最佳系统的对话能力。
在对话期间,BlenderBot 2.0 可以使用任何搜索引擎在互联网上查询相关的新知识,并且可以读取和写入其长期本地内存存储,BlenderBot 2.0 还记得之前讨论的上下文。因此,例如,如果您在几周前与 Tom Brady 谈论过它,它可能会在未来的对话中提到 NFL,因为它知道这与您相关。同样,如果你在今年的奥斯卡颁奖典礼之前用它谈论过电影,它随后可能会提到获得奥斯卡奖的 Nomadland。此外,由于 BlenderBot 2.0 能够利用知识,与其他系统(如我们的实验评估中所测量的)相比,产生幻觉的可能性更小。