Large Language Models are Superpositions of All Characters: Attaining Arbitrary Role-play via Self-Alignment

总结

这篇论文介绍了一种名为DITTO的自我对齐方法，用于增强大型语言模型(LLMs)的角色扮演能力。DITTO的核心思想是利用LLMs在预训练过程中学习到的丰富角色知识和对话风格，通过自我对齐来激发其内在的角色扮演能力。

DITTO的主要步骤包括：

DITTO的优势：

论文还提出了一个客观的角色扮演评估方法，重点关注以下三个方面：

实验结果表明，DITTO在各种规模的LLMs上都取得了显著的效果，甚至超过了专有LLMs的性能。

此外，论文还通过交叉监督实验分析了角色扮演能力的分解，发现：

总而言之，DITTO为增强LLMs的角色扮演能力提供了一种有效且可扩展的方法，并为理解LLMs的角色扮演能力提供了新的见解。

论文中评估角色身份一致性的方法是将角色扮演对话评估转化为一个多选题问题。具体步骤如下：

通过这种方式，可以将复杂的角色扮演评估简化为一个多选题问题，从而实现高效且可重复的评估。

实验结果表明，DITTO方法在角色身份一致性方面取得了显著的效果，甚至超过了专有LLMs的性能。

论文中构建角色扮演训练数据集的方法称为 DITTO，它包含三个主要步骤：

1. 角色知识收集：

2. 对话模拟：

查询模拟
- 利用 LLM 生成与角色相关的查询和对比查询。
- 相关查询要求提供与角色背景密切相关的信息。
- 对比查询要求提供超出角色知识范围的信息。
- 为了高效生成大量查询，论文中将角色配对，并为 LLM 提供详细的 profile，使其生成一个角色可以回答而另一个角色不合适回答的问题。
回答模拟
- 将结构化的角色 profile 线性化为文本，并附加一个查询。
- 要求 LLM 从提供的信息中提取相关信息，并模拟角色生成回答。

3. 监督微调：

通过这种方式，DITTO 可以构建一个大规模、高质量的角色扮演训练数据集，从而有效地增强 LLM 的角色扮演能力。

note

#paper

论文阅读 Large Language Models are Superpositions of All Characters

http://iamlihua.github.io/2024/10/17/large-language-models-are-superpositions-of-all-characters/

Author

LiHua

Posted on

October 17, 2024

Licensed under