東芝デジタルソリューションズ株式会社(本社:神奈川県川崎市、取締役社長:島田 太郎、以下 当社)は、2025年4月1日、国立研究開発法人情報通信研究機構(本部:東京都小金井市、理事長:徳田 英幸、以下 NICT)と、大規模言語モデル(LLM:Large Language Model)を用いた検索拡張生成(RAG:Retrieval-Augmented Generation)
*1の品質向上に関する共同研究(以下 本研究)を開始しました。
当社は、生成AIの事業活用において、LLMのファインチューニング技術
*2やRAGの回答精度を高める技術、AIエージェントの活用技術、工場内データの読み解き技術、ソフトウェア解析技術など様々な応用技術開発を進めています。また、NICTは、これまでに大量の言語データを整備し、日本語に特化したLLMや検索ツールを開発してきました。本研究では、NICTの日本語特化型LLMや検索ツールを活用し、より正確で有益な情報を得るための生成AI周辺技術の高度化を目的とします。これにより、組織内に蓄積された大量の文書を活用した知識継承や業務効率化の実現を目指します。
生成AIが急速に進化、普及し、様々な業務に活用する動きが広まっています。東芝グループでは、社内業務の効率化や、エネルギー、社会インフラ、製造、ITサービス等の事業分野に向けた生成AI活用に積極的に取り組んでいます。これらの事業分野では、少子高齢化による労働力不足や熟練者の後継者不足が深刻な課題となっており、生成AI技術を活用した知識継承や業務効率化がその解決策として期待されています。
LLMは、事前に学習した膨大なデータに基づいて、様々な公知の専門知識も含めた回答が可能です。しかし、最新の情報や一般には入手できない組織内にしかない情報に基づく回答は困難です。これを補うために、組織内に蓄積される文書等のデータベースから情報を検索し、その情報を基に正確な応答を生成するRAGへの期待が高まっています。RAGを活用した技術の研究開発はまだ発展途上の段階にあり、回答品質を向上させるための取り組みが必要です。
東芝グループでは、自社の製品・サービスに関わる設計、製造、保守等の長年にわたる膨大なデータを保有しています。本研究では、大量の日本語データで学習されたNICTの日本語特化型LLMを活用し、東芝グループが保有するデータを利用して、RAGの高精度化技術を研究開発し、業務効率化や知識継承に活用できる生成AI技術の確立を目指します。
当社は、NICTとの共同研究を生かし、生成AIを活用した社会課題解決に資するサービスの提供を目指します。
<各社の役割>
東芝デジタルソリューションズ:NICTの言語モデル・ツールを活用した生成AIの回答品質向上に関する研究開発の遂行。
NICT:日本語を中心とした大量の学習用言語データを活用した言語モデル・ツールの提供および強化開発。
*1 検索拡張生成(RAG:Retrieval-Augmented Generation):独自のデータ等からの情報検索と生成AIを組み合わせることで、質問に対する回答の精度を高める手法
*2 ファインチューニング:既存のAIモデルを特定のタスクやデータセットに適応させるために、追加の学習データでAIモデルの性能を向上させる手法
生成AIへの東芝デジタルソリューションズの取り組み
https://www.global.toshiba/jp/products-solutions/ai-iot/generative-ai.html