リコー、経済産業省の国内生成AI開発力強化プロジェクト「GENIAC」に採択
~企業の知の結晶である様々なドキュメント群を読み取るマルチモーダルLLMの本格的な開発を開始~
株株式会社リコー(社長執行役員:大山 晃)は、経済産業省が推進する国内の生成AIの開発力強化を目的としたプロジェクト「GENIAC(Generative AI Accelerator Challenge)」のもと、国立研究開発法人新エネルギー・産業技術総合開発機構(以下、NEDO)が2024年8月に実施した公募「ポスト5G情報通信システムの開発(委託、助成)/計算可能領域拡大のための計算基盤技術開発(委託、助成)/競争力ある生成AI基盤モデルの開発(助成)」(以下、本事業)に採択されました。本事業では、主に生成AIのコア技術である基盤モデルの開発に対する計算資源の提供や、データやAIの利活用に向けた実証調査の支援等が行われます。リコーは、本事業において、企業の知の結晶である様々な企業内ドキュメント群を読み取るマルチモーダルLLMの本格的な開発を開始します。
マルチモーダルLLM(以下、LMM)とは、テキスト・画像・音声・動画など複数の種類のデータを一度に処理できるAI技術のことです。スクリーンショットからのテキストの要約や、図を使った質問への適切な回答など、さまざまなタスクに優れており、幅広いデータ形式を効果的に処理する適応性に期待が集まっています。
企業内で蓄積されるドキュメントは、請求書および領収書などのトランザクションデータ、事業戦略や計画などの経営資料、サービスマニュアルや社内で定める技術標準、品質管理基準などの技術文書など、様々な形式があり、テキストだけではなく、図や表組、画像等も含まれています。企業内文書の効率的な利用や新たな価値・イノベーションを生み出すための活用が期待されていますが、「テキスト検索でも意図した結果がでない」、「検索のみの利用で効果的な活用ができていない」等の課題があります。また、近年の労働力の減少に対応する効率的な働き方や、ベテラン社員の退職に伴う技能伝承、外国人労働者も増える中での社内文書の多言語化への対応などの経営課題に対して、性能向上著しいAIを活用し、より効率的で、付加価値のある企業知の活用のニーズが高まっています。既存のLLM/LMMではきめ細かな画像認識を必要とするビジネス文書の読解精度が課題となっており、リコーは、本事業において日本企業で活用できるLMMの開発に取り組みます。
紙文書をベースに業務を行っている企業も多い中、リコーは複合機やスキャナーなどの独自のエッジデバイスを活用して、高精度なデジタル化が可能です。さらにAIを活用した先進的な画像認識やOCR技術に強い独スタートアップ「natif.ai」もグループ企業に迎えるなど、技術力強化を着実に進めてきました。これらに加えて、LMMによるドキュメントの高度な活用によって、ドキュメントに関わる一連の流れを効率化・自動化するプロセスオートメーションを実現します。
リコーは、ワークプレイスサービスプロバイダーとして、デジタルによる業務プロセスの最適化を通じ、単純作業を減らし生産性の向上を実現すると共に、AI・データの活用により新たな価値を提供し、お客様の創造力の発揮を支援します。
【本事業における取り組み内容】
日本企業の業務DXを促進するマルチモーダルLLMの開発。
1.マニュアル等の様々な図表を読解可能なマルチモーダル性能。
2.製造現場で使われる長文のマニュアルや指示書を理解するためのロングコンテキスト処理能力。
3.企業特有のドキュメント群に容易に適用可能なカスタマイズ性能。
【リコーのAI開発について】
リコーは、1990 年代に AI 開発を始め、2015 年からは画像認識技術を活かした深層学習 AI の開発を進め、外観検査、振動モニタリングなどに適用してきました。2020 年からは自然言語処理技術を活用し、オフィス内の文書やコールセンターに届いた顧客の声(VOC)などを分析して業務効率化や顧客対応に活かす「仕事のAI」の提供を開始しました。2022年からはいち早く、大規模言語モデル(LLM)の研究・開発に着目し、2023年3月にはリコー独自のLLMを発表し、その後も、700億パラメータの大規模でありながらオンプレミスでも導入可能なLLM(日英中3言語に対応)を開発するなど、お客様のご要望に応じて提供可能な様々なAIの基盤開発を行っています。また、画像認識、自然言語処理に加え、音声認識AIに関しても研究開発をすすめ、音声対話機能を持つAIエージェントのお客様への提供も開始しています。
■関連リンク
NEDO:本公募「ポスト5G情報通信システム基盤強化研究開発事業/ポスト5G情報通信システムの開発(助成)」に係る公募について
https://www.nedo.go.jp/koubo/IT2_100331.html
NEDO:生成AIの開発力強化に向けたプロジェクト「GENIAC」において、新たに計算資源の提供支援を行うAI基盤モデル開発テーマ20件と、データの利活用に向けた実証を行うテーマ3件を採択しました
https://www.nedo.go.jp/news/press/AA5_101790.html
マルチモーダルLLM(以下、LMM)とは、テキスト・画像・音声・動画など複数の種類のデータを一度に処理できるAI技術のことです。スクリーンショットからのテキストの要約や、図を使った質問への適切な回答など、さまざまなタスクに優れており、幅広いデータ形式を効果的に処理する適応性に期待が集まっています。
企業内で蓄積されるドキュメントは、請求書および領収書などのトランザクションデータ、事業戦略や計画などの経営資料、サービスマニュアルや社内で定める技術標準、品質管理基準などの技術文書など、様々な形式があり、テキストだけではなく、図や表組、画像等も含まれています。企業内文書の効率的な利用や新たな価値・イノベーションを生み出すための活用が期待されていますが、「テキスト検索でも意図した結果がでない」、「検索のみの利用で効果的な活用ができていない」等の課題があります。また、近年の労働力の減少に対応する効率的な働き方や、ベテラン社員の退職に伴う技能伝承、外国人労働者も増える中での社内文書の多言語化への対応などの経営課題に対して、性能向上著しいAIを活用し、より効率的で、付加価値のある企業知の活用のニーズが高まっています。既存のLLM/LMMではきめ細かな画像認識を必要とするビジネス文書の読解精度が課題となっており、リコーは、本事業において日本企業で活用できるLMMの開発に取り組みます。
紙文書をベースに業務を行っている企業も多い中、リコーは複合機やスキャナーなどの独自のエッジデバイスを活用して、高精度なデジタル化が可能です。さらにAIを活用した先進的な画像認識やOCR技術に強い独スタートアップ「natif.ai」もグループ企業に迎えるなど、技術力強化を着実に進めてきました。これらに加えて、LMMによるドキュメントの高度な活用によって、ドキュメントに関わる一連の流れを効率化・自動化するプロセスオートメーションを実現します。
リコーは、ワークプレイスサービスプロバイダーとして、デジタルによる業務プロセスの最適化を通じ、単純作業を減らし生産性の向上を実現すると共に、AI・データの活用により新たな価値を提供し、お客様の創造力の発揮を支援します。
【本事業における取り組み内容】
日本企業の業務DXを促進するマルチモーダルLLMの開発。
1.マニュアル等の様々な図表を読解可能なマルチモーダル性能。
2.製造現場で使われる長文のマニュアルや指示書を理解するためのロングコンテキスト処理能力。
3.企業特有のドキュメント群に容易に適用可能なカスタマイズ性能。
【リコーのAI開発について】
リコーは、1990 年代に AI 開発を始め、2015 年からは画像認識技術を活かした深層学習 AI の開発を進め、外観検査、振動モニタリングなどに適用してきました。2020 年からは自然言語処理技術を活用し、オフィス内の文書やコールセンターに届いた顧客の声(VOC)などを分析して業務効率化や顧客対応に活かす「仕事のAI」の提供を開始しました。2022年からはいち早く、大規模言語モデル(LLM)の研究・開発に着目し、2023年3月にはリコー独自のLLMを発表し、その後も、700億パラメータの大規模でありながらオンプレミスでも導入可能なLLM(日英中3言語に対応)を開発するなど、お客様のご要望に応じて提供可能な様々なAIの基盤開発を行っています。また、画像認識、自然言語処理に加え、音声認識AIに関しても研究開発をすすめ、音声対話機能を持つAIエージェントのお客様への提供も開始しています。
■関連リンク
NEDO:本公募「ポスト5G情報通信システム基盤強化研究開発事業/ポスト5G情報通信システムの開発(助成)」に係る公募について
https://www.nedo.go.jp/koubo/IT2_100331.html
NEDO:生成AIの開発力強化に向けたプロジェクト「GENIAC」において、新たに計算資源の提供支援を行うAI基盤モデル開発テーマ20件と、データの利活用に向けた実証を行うテーマ3件を採択しました
https://www.nedo.go.jp/news/press/AA5_101790.html