データ分析の適用範囲を広げるバラバラなデータの回帰分析を世界で初めて実現～「万能近似能力」を持つ深層学習によるデータ分析の適用領域の拡大～

2024年04月26日 15:00

　日本電信電話株式会社（本社：東京都千代田区、代表取締役社長：島田　明、以下「NTT」）は、入力変数と出力変数の対応関係が失われたバラバラなデータから、深層学習を用いて入出力の関係を表す関数を推定する新たなデータ分析手法を世界で初めて実現しました。この方法を用いることで、入力と出力に該当する情報が別の部署や組織で収集されたデータや、個人が識別できない集団単位で収集されたデータなどから、入出力の関係を表す関数を推定し、データを分析することが可能になります。なお、本成果は 2024年2月20日から27日まで、カナダ・バンクーバーで開催される人工知能分野の最高峰国際会議 38th AAAI Conference on Artificial Intelligence (AAAI 2024)* において発表されました。
*https://aaai.org/aaai-conference/

1．研究の背景　
　スマートフォンやウェアラブルデバイスなどの普及に伴い、ヒトの状態や行動などに関する多種多様なデータが蓄積されています。しかし、観測コストやプライバシ保護などのために網羅的なデータ収集を行うことは困難であり、データの活用が難しい場面が今もなお多く存在しています。例えば、図１に示すように、取扱商品やサービスの情報や紹介動画をオンラインサイトに掲載・実店舗で商品販売を行う企業などでは、オンラインサイトの閲覧者に関する情報(閲覧時間など)と実店舗の商品購入者に関する情報(購入金額など)はバラバラに得られていることが多く、閲覧者と購入者の情報の対応関係は分かりません (閲覧時間が何秒の人が何百円購入したのかは分からない)。同様に、プライバシに配慮し、試験の点数のようなセンシティブな情報を学級ごとに集団単位で集めた場合も、入力である生徒の属性と出力である点数の対応関係が不明なデータとして表現されます。これまでNTTでは、観測範囲に制限のある軌跡データや群衆単位の位置情報集計データのように現実的に収集可能なデータを用いてヒトの状態や行動の推定・予測・制御を可能とする手法を実現してきました。前述の対応関係の失われたバラバラなデータの分析には、通常の回帰分析の手法を適用することはできないため、分析可能とする手法が望まれていました。

2．研究の成果
　対応関係の失われたデータを分析する従来の手法では、入出力の関係を表す関数は線形(例えば、閲覧時間に比例して購入額が増えるなど)である等という非常に強い制約が成り立つことを仮定していました。そのため、現実の多くのデータに存在する非線形な関係を推定することができず、適用可能なシーンは限定されていました。当該手法により、「万能近似能力」(※１)
を持つ深層学習による高い表現力を活用し、任意の関数を推定することが可能になりました。これにより、ある特定の閲覧時間で購入額がピークとなるような、非線形な関数を推定しデータを分析できるようになります(図２)。

3．データ分析手法のポイント
　今回、従来の手法とは異なる方法で対応関係の失われたデータから回帰関数を推定することを可能としています。ポイントは大きく２つあります。

●入力と出力の対応関係である確率の高い候補の集合を効率的に生成し、目的関数を近似
ありうる対応関係は全部で要素数の階乗個存在するため、これら全ての対応関係を扱うことは困難です。これに対しNTTは、確率の高い候補の集合が要素の大小順序の並べ替え操作等により得られることを示し、各候補が実際の対応関係である確率で重み付けることで、近似的な目的関数(パラメタ推定のために最小化する関数)を導くことに成功しました。

●確率的勾配法を用いた目的関数の最小化
目的関数の最小化にニューラルネットワークのパラメタ推定に広く利用される確率的勾配法(※２)を利用した点です。
これによりパラメタ数が多いニューラルネットワークであっても局所解に陥ることを防ぎ、より優れた解へ到達することが可能になりました。

4. 今後の展開
　今後も引き続きデータ分析の適用領域拡大に向けて、データに偏りや個人差があるなどより現実的な場面におけるヒトを対象としたデータ分析を実現する手法の確立と、応用の検討を進めてまいります。

【用語解説】
※１万能近似能力
ニューラルネットワークを用いることで連続関数のような非常に幅広いクラスに属する任意の関数を任意の精度で近似できる性質のこと）

※２確率的勾配法
Stochastic Gradient DescentやAdamと呼ばれる方法が代表的

その他のリリース

一覧を見る

話題のリリース

一覧を見る

お知らせ

2026年04月06日
ゴールデンウィーク期間の営業について
2026年03月17日
リニューアルに伴うサービス停止期間のお知らせ｜3/31（火）20:00～
2026年02月03日
2/24（火）23:00～メールメンテナンスのお知らせ
2025年11月26日
サーバーメンテナンスのお知らせ｜11/27（木）19:00〜19:10
2025年11月21日
年末年始の営業のお知らせ
2025年10月31日
サーバーメンテナンスのお知らせ｜11/19（水）19:00～20:00
2025年09月01日
9/16（火）23:00～メールメンテナンスのお知らせ
2025年06月25日
サーバーメンテナンスのお知らせ｜7/3（木）19:00～20:00
2025年04月04日
ゴールデンウィーク期間の営業について
2025年02月17日
3/4（火）23:00～メールメンテナンスのお知らせ
2024年11月20日
年末年始の営業のお知らせ
2024年09月25日
10/12（土）19:30～24:00サーバーメンテナンスのお知らせ
2024年08月05日
8/13(火) 19:00～20:00 サーバーメンテナンスのお知らせ
2024年08月05日
8/6（火）23:00～メールメンテナンスのお知らせ
2024年05月24日
サーバーメンテナンスのお知らせ｜6/10（月）19:00～20:00
2024年04月04日
ゴールデンウィーク期間の営業について