관심있는 NLP 논문을 읽어보고 간단히 정리했습니다.
혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 🙇♂️
[Microsoft Research, University of illinois]
- multiple personas로 multi-turn self-collaboration을 통해 LLM을 cognitive synergist으로 변환, Solo Performance Prompting (SPP)
- SPP를 통해 internal knowledge acquisition 능력을 향상시키고, hallucination을 줄이며, reasoning capabilities를 유지
- 배경
- LLM은 여전히 knowledge-intensive & reasoning-intensive tasks에서 hallucination으로 인한 한계를 보임
- 어린이의 인지 발달과 관련된 pretend play & role-playing으로부터 biological intuition을 획득
- multiple LLM agent를 활용하는 기존의 방식은 fixed or task-specific personas를 사용하거나, 각 persona마다 개별 LLM instance를 필요로 한다는 문제점이 존재
- Related Works
- LLMs as role-playing agents
- LLM에게 persona나 role을 부여해주는 것이 generator behavior에 큰 영향을 줌
- AI society를 만드는 것에 대한 연구
- 기존까지는 agent 하나에 single persona를 부여하거나, perona의 개수를 고정하는 방식
- Improving reasoning and knowledge acquisition abilities in LLMs
- LLM은 hallucination과 인간과 같은 사고의 부재로 인해 각각 complex knowledge-intensive task, 그리고 reasoning-intensive task에서 어려움을 겪음
- CoT나 Self-Refinement와 같은 방법들로도 hallucination을 줄이거나 factuality를 향상시키는 것에 한계가 있음
- 외부 sources로부터 정보를 가져오는 방식으로도 모델의 추론 능력을 향상시킬 수는 없음
- LLMs as role-playing agents
- Contributions
- 주어진 태스크에 따라 persona를 dynamically 설정하고 multi-turn self-collaboration에 참여시킴으로써 single LLM을 cognitive synergist로 만드는 Solo Performance Prompting (SPP)를 구현
- Trivia Creative Writing, Codenames Collaborative and Logic Grid Puzzle 세 개의 challenging task에 대해 평가
- dynamic, fine-grained personas > fixed, coarse-grained personas
- Solo Performance Prompting
- SPP Task-Solving Procedure
- 1) Persona Identification: leader persona에 해당하는 AI Assistant를 포함하여 태스크 처리에 필요한 special personas를 identify
- 2) Beginning Remarks: 각 persona가 자신의 전문 지식을 바탕으로 주어진 문제를 어떻게 해결할지에 대한 beginning remark를 전달
- 3) Multi-Persona Iterative Collaboration: leader persona, AI Assistant가 초기 solution을 제안하고 다른 참여자들의 피드백을 수용하여 답변을 반복적으로 수정
- SPP Prompt Design
- System Principle: "..., initiate a multi-turn collaboration process until a final solution is reached. ... "
- Demonstration Examples: 1) AI Assistant & Math Expert로 Game of 24 task, 2) 다양한 요구 조건을 포함한 poem-writint task
- Task Prefix: "indentify the participants and collaboratively solve the following task step by step."
- SPP Task-Solving Procedure
- Results
- SPP는 LLM의 internal knowledge acquisition과 reasoning 능력을 효과적으로 향상시킬 수 있음
- LLM은 추가적인 fine-tuning 없이도 태스크 해결에 필요한 useful personas를 찾을 수 있음
- Dynamic personas가 고정된 숫자의 personas를 사용하는 것보다 성능 향상에 도움이 됨
- 각 persona에 대한 description을 같이 입력으로 제공하게 되는 경우 오히려 모델 성능이 저하됨
- persona의 역할을 fine-grained한 것이 그렇지 않은 것보다 더 좋음 (ex. 'Film Expert' & 'Sport Enthusiast' vs. 'Expert')
- Limitations
- 비록 fine-grained persona가 부여된다고 할지라도 정답이 여전히 부정확한 경우가 존재
- 어떤 태스크가 주어지더라도 동일한 두 개의 demonstration example을 SPP prompt와 함께 제공한다는 한계
- computational budget 자체가 제약이 될 수 있음