発表のポイント:
- NTTは、人間と同じく対話を通じて、他のエージェントとアウトプットイメージをすり合わせながら協調してタスクに取り組むAIエージェント自律協調の基盤技術を開発しました。
- 従来技術では質の高い解の導出が難しかった、「企業ブランディング戦略の立案」「多角的なビジネスプラン検討」といった、一貫性・実現性・具体性が求められる複雑なプランニング業務へのAIエージェントの適用や、継続的な業務改善への貢献が期待されます。
- 引き続きAIエージェント自律協調技術の研究開発を促進し、本年度中のPoC(Proof of Concept)に向けて取り組んで参ります。
NTT株式会社(本社:東京都千代田区、代表取締役社長:島田 明、以下「NTT」)は、人間と同じく対話を通じて、他のエージェントとコミュニケーションを取り、チーム内でアウトプットイメージをすり合わせながら協調してタスクを解決するAIエージェント自律協調の基盤技術を開発しました。従来技術では質の高い解の導出が難しかった、「デザイン・広報・マーケティング等を統合する企業ブランディング戦略の立案」「視点の異なるニーズを同時に満たすための多角的なビジネスプラン検討」といった、多様なニーズを満たしつつ、一貫性・実現性・具体性が求められる複雑なプランニング業務に対して、高品質な解の生成を可能とします。また、蓄積した知識を再利用させることで、タスク解決性能を継続的に向上させることが可能となりました。
本成果は、2025年7月28日に、自然言語処理分野の最難関国際会議ACL2025にて発表(※1, 2)しました。
図1:AIエージェント自律協調の基盤技術の特徴
1.背景
昨今、複数のAIエージェントが協調することで、業務の一部を代行するマルチエージェントシステムが注目を集めています。また、マルチエージェントシステムの進化による将来を見越した取組みとして、Carnegie Mellon Universityの『The Agent Company』などの研究は現実世界における組織運営へのAIエージェントの適用可能性を評価しており、OpenAIが提示する生成AIの進化段階においても、最終的な目標として「AIによる組織運営」の概念が言及され、AIが自律的に組織運営を担う世界が将来的なビジョンとして注目を集めています。
しかし、従来のマルチAIエージェントシステムでは、分割したサブタスクを各エージェントが個別に処理するため、他のエージェントのサブタスクとの整合性を保ったタスク遂行が難しいという問題がありました。このため、サブタスクが完全に独立しており、単純にサブタスクの結果を連結すれば解決できる定型タスクであれば解決できますが、相反するものを含む複数のニーズを一度に満たす必要がある複雑なタスクにおいて、AIエージェントが一貫性・実現性・具体性を持ってタスクを完遂するのは困難でした。これでは複数部署間の調整が必要となる企業戦略検討や、多様な解を持つビジネス企画策定といった、複雑なタスクを実行できません。
対して、今回NTTは、AIエージェントに、人間を模倣した「記憶構造」および「協働創造プロセス」をとらせることで、まるで人間のように互いの解決アプローチや能力を確認・更新しながら複雑タスクを解決するAIエージェントの自律協調の基盤技術を開発しました。将来的にAIが自律的に組織運営を担う際に必要となる業務のうち、ビジネス企画策定関連のタスクを幅広く解決することを狙います。
なお、NTTでは、人とAIがパートナーとして協調しながら生産活動を行う「Human-AI協調」社会(図2)を見据え、AI同士が相互に議論・訂正を行いながら多様な視点を提供し、人と共に解の創出をめざす、AIコンステレーションの研究開発に取り組んでいます。本技術はAIコンステレーションを構成する技術の1つとして開発しました。
図2:NTTがめざす「Human-AI協調」社会
2.研究の成果
本技術では、まず複雑タスクを分割したサブタスク毎にエージェントを生成し、各エージェントは担当するサブタスクに関する知識を構築します(図3(a))。私たち人間の知識体系は、個別の経験(エピソード記憶)と、一般化された事実(意味記憶)の両方に支えられています。本技術では、その2つの記憶構造を組み合わせてAIエージェントに知識を蓄積させる仕組みを採用しています。
さらに、本技術では、人間社会における協働創造プロセスを模倣し、他のエージェントと動的に知識を獲得・共有します(図3(b)(c)(d))。また、適宜タスク遂行に必要な知識を有す専門家エージェントを生成し議論を行うことで、タスク解決に必要な知識を習得します(図3(c))。複雑タスクを解決するために、チーム会議や生産会議を通じて、自身や他のエージェントが割り当てられたサブタスクの内容や、サブタスク解決に対する個々のアプローチへの理解を継続的に更新します。また、適宜タスク解決の方針をすり合わせ、互いに協調しながら多様なサブタスクを統合します(図3(b)(d))。このようなプロセスをとることで、実行精度と解決策の質の向上を実現しています。本技術は、たとえば「デザイン・広報・マーケティング等を統合する企業ブランディング戦略の立案」、また「視点の異なるニーズを同時に満たすための多角的なビジネスプラン検討」といった、多様なニーズを満たしつつ、一貫性・実現性・具体性が求められる複雑なプランニング業務でも、高品質なアウトプットの導出が可能です。
図3:本技術の概要
3.技術のポイント
①人間の記憶構造を模倣した知識管理
AIエージェントが、会話を通じて他のエージェントとの「エピソード記憶」を獲得し、段階的に抽象化したものを「意味記憶」として、知識を階層的に管理します。この知識にもとづいて議論を繰り返すことで相互的な共通理解が進み、多様な視点を取り入れた生産的な議論進行が可能となります。
②知識の相互チェックによる正確性の担保
AIエージェントは、チーム会議や、専門的な知識を持つ専門家エージェントとの会話を通じて知識を更新することで、自身の知識が精錬されていきます。このアプローチは、異なる立場を持つエージェント同士の知識の相互チェックとして作用し、最終的な解の正確性の担保に繋がります。
③エージェント再利用によるタスク解決性能の向上
議論を通じて知識を蓄積し、相互理解を深めたエージェント群を、以降のタスクで再利用することで、タスク解決性能を継続的に向上させることが可能です。
4.実験の概要
今回、多様な創造的文書生成タスクにおいてタスク遂行性能を比較したところ、本技術は自動評価と人手評価の両方において従来手法を上回る成果を獲得しました。たとえば紅茶を題材とした、多様な顧客ニーズを反映するビジネスプラン検討の事例においては、従来手法では、エージェントごとのサブタスクの解決策を単純に羅列したのみで、サブタスクの統合に際し解決策の組合せや相互補完が行われなかったのに対して、本技術はエージェントごとのタスクについて、各タスクの詳細情報や互いの検討内容を考慮して統合(図4)し、多様な顧客ニーズに応じた幅広い紅茶関連製品の開発と、淹れ方やフレーバーに関するワークショップを通じて顧客体験を向上させる多角的なビジネスプラン(図5)を出力することを確認しました。また、生成した企画書と、正解として人手で準備された複数の企画書案との一致度合いをRougeにより評価したところ、本技術は従来手法と比較して平均14.4%程度スコアが向上し、更にタスク遂行時の知識を再利用した場合は平均17.2%程度スコアが向上することを確認しました。
これらの成果は、本技術がAIエージェント間の連携を通じて、高品質なアウトプットを導出可能であることを示しています。
図4:各エージェントが取り組んだサブタスクの内容と、本技術/従来手法による統合結果の比較
図5:本技術が出力したビジネスプラン
5.今後の展開
本成果では、AIエージェントに、人間を模倣した「記憶構造」および「協働創造プロセス」をとらせることで、まるで人間のように互いの解決アプローチや知識を確認・更新しながら複雑タスクを解決するAIエージェントの自律協調の基盤技術を実現しました。今後は、本件について本年度中のPoCに向けて取り組んで参ります。
また、人間とAIとの協調によるさらなる創造性の発揮に向けて、最終的な成果物や中間生成物に対して人間が要求した改善や方向修正の反映といった人間の意図の汲み上げを可能とすることで、AIエージェントの実ビジネスシーンでの活用をめざし、研究開発を促進して参ります。
【用語解説】
※1. ACL
自然言語分野の最難関国際会議の1つ(ACL2025本会議採録率は20.3%)
※2. 本技術の論文情報:
https://aclanthology.org/2025.acl-long.823/
Makoto Nakatsuji, Shuhei Tateishi, Yasuhiro Fujiwara, Ayaka Matsumoto, Narichika Nomoto, and Yoshihide Sato. 2025. ACT: Knowledgeable Agents to Design and Perform Complex Tasks. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 16831–16861, Vienna, Austria. Association for Computational Linguistics.