企業の最適なAI導入をプロトタイプ作成から支援
“実ビジネスに寄与するAI”のPoCからAIシステムの完成まで 当社の取り組みをご紹介
ディープラーニングを用いた第3世代AIの進化を背景に、画像認識による疾患の早期発見や意味理解を用いた文書検索など様々な分野でAIの実用化が進んでいます。NTTデータ先端技術のAIソリューション事業部では、AIを用いたPoC(Proof of Concept:概念実証)で顧客課題を解決していくことを得意としています。AI活用のアイデアをシステム化して有効性を評価するPoC
AI案件は多種多様で、「画像認識」、「音声認識」、「自然言語処理」などを駆使して目的を達成していきますが、これらは一般的な開発案件とは異なり、仕様が明確でない場合が多くあります。例えば、「マーケティング活動に役立てるために、製品の情報が記載された多様な文書から製品の短所が記載された文章を抽出したい」といった顧客要望は、「多様な文書」や「短所が記載された文章」など不明瞭な部分が多く、未知の入力情報に対して人の思考のようなもので文章を評価する必要がありそうなため、仕様がなかなか決められません。このような難しい案件において、技術の検証を行いながら実現可能性を見極めていくPoCが重要な役割を果たします。
先述の顧客要望に対しては、対象となる文書や表現、また人間の思考に当てはめた場合にどのような手順を踏んで目的を達成するかなどを考えていきます。正解の定義が難しい場合には、ディープラーニングを用いて「このような表現を短所としたい」という事例をAIモデルに学習させ、そのAIモデルに推論させてあげることで良い結果が得られるかもしれません。このようなプロセスを経て手法が決定したらAIの実装を行い、次は学習用のデータを準備してモデルを作成します。自然言語処理にディープラーニングを用いる場合は、コーパスと呼ばれる言語資源データと教師データ(事例の正解例と不正解例)を用いてモデルを作成することが一般的です。こうした工程を経てプロトタイプを完成させます。
正解率の高さ=優れたAI? AIの性能評価で重要視される「根拠の説明」
AIから出力された結果の正誤判定は非常に難しく、モデル作成時の教師データの与え方や結果を利用する側の見方により正解とも不正解とも判断しがたいケースが多々あります。そのため、教師データに偏りがでないように学習用と検証用のデータを少しずつずらしてモデルを作成する交差検証を用いたり、判断に迷いが生じそうな結果は複数人で不公平なく評価するなどして総合的に判断することが求められます。 AIの性能は主に正解率・適合率・再現率といった数値指標で表しますが、数値ばかりに注目してはいけません。例えば、「豚の写真から病気を検知するAI」を2種類用意したとして、一つは正解率が90%で、もう一つは正解率が85%としましょう。この場合は正解率が高いほうが優れたAIと言えそうですが、仮に正解率90%のAIは判定の根拠を説明することができず、正解率85%のAIは判定した根拠を説明することができたとした場合、どう受け止めればよいしょうか。AIを利用する側の用途にもよりますが、このような場合は多少精度が落ちても根拠を説明できたほうがより納得感や安心感があります。さらに、その根拠を分析することでAI適用現場での次のアクションを決定する手掛かりになったり教師データやハイパーパラメータ(学習時に与える設定値群)の改善策を講じたりすることができます。
生命や収益に直結するような結果を求められるAIは、結果とあわせてその根拠を説明することが求められます。これまでの技術ではこれら根拠の提示が不得意であることが多く、教師データやハイパーパラメータのチューニングはとても難しい作業となっています。根拠を出力するためにはAI内部で保持している計算過程の数値情報を人間が理解できるかたちに変換する必要があり、このような仕組みを取り入れたAIは、XAI(Explainable AI:説明可能なAI)と呼ばれています。
AIシステムの精度目標の達成~AIの完成
AIのプロトタイプが完成してモデルの学習ができるようになったら、評価実験とチューニングを繰り返しながら最終目標の精度を定めていきます。チューニングの過程で、教師データやハイパーパラメータをどのように与えると、結果にどう影響するのかがわかってきます。ここまできたら、あとは何度か評価実験とチューニングを繰り返し、精度目標の達成を目指します。 目標を無事に達成すると、AI開発はひと段落ついたことになりますが、ここで終わりではありません。PoCの成果物は“概念を実証する”ことを主目的に作られているため、長時間動作させた場合やあらゆるデータを入力させた場合の挙動の隅々まで確認することはしていません。そのため、製品として必要な品質に仕立てるための作りこみや試験を実施します。さらに、AIシステムではルールやモデルのチューニングにより精度を高めていく等の“運用”が重要な要素になるため、エンジニアでなくても扱えるようにノウハウの手順化やレクチャーを行うことも必要となります。こうした取り組みの結果、ようやく製品として独り立ちすることができます。
バックオフィス業務の効率化・自動化ソリューション「INTELLILINK バックオフィスNLP」
NTTデータ先端技術では、バックオフィス業務の自動化・効率化に向けた先進自然言語処理ソリューション「INTELLILINK(インテリリンク)バックオフィスNLP」を提供しています。「INTELLILINK バックオフィスNLP」は、バックオフィス業務に必要となる文書分類、知識読解、自動要約など様々な言語理解が可能な各種AI機能を具備し、用途に応じた機能を組み合わせて活用することができます。また、XAIの実装も進めており、業務の効率化のみならず品質向上も期待できます。本ソリューションを用いて当社がPoCからAI導入まで支援することで、コストを抑えながら、個々の企業にとって最適かつ迅速なAI適用を実現します。
https://www.intellilink.co.jp/business/software/phronecore.aspx
<本件に関するお問い合わせ先>
NTTデータ先端技術
ソフトウェアソリューション事業本部
AIソリューション事業部
AIサービス開発担当
関
Tel:03-5843-6848