NTT LABORATORIES

これが未来創造の最前線だ!

AIが得意なことはAIに任せ、
効率的な社会を実現
「AI (人工知能)」

コミュニケーション科学基礎研究所岩田 具治

私たちの生活にAI(人工知能)を活用しようという試みが本格化しています。
AIの活躍の場は、工業や農業、金融、各種サービスなどビジネスの現場にとどまらず、私たち一般市民の日常生活の場にまで進出を始めています。今後、5Gをはじめとした通信環境の進化や、コンピュータシステムの性能向上に伴って、こうした流れはますます加速していくことでしょう。「AIが得意なことはAIに」「人間は人間の得意なことを」と考える時代が、もう間近に迫っています。
NTTでは、最先端テクノロジーを用いた研究を進め、現代社会、そして来たるべき未来に活用できるAIテクノロジーの開発に取り組んでいます。

「きれいなデータ」ではなくても、高い性能を

囲碁や将棋の例を思い出すまでもなく、私たちはAIが自ら判断し、的確なアウトプットを提示できることを知っている。AIがそんな風に活躍できるのは、その「頭脳」に極めて高度な機械学習・深層学習の技術が用いられているからだ。機械学習は今、さまざまな用途に用いられ始めている。

私はデータを使ってコンピュータを賢くする枠組みである機械学習の研究をしています。機械学習は機械の中でデータの特徴を抽出し、過去に学習したデータを参照しながら、最適な結果をアウトプットしていく仕組みです。そのため現在の機械学習では、性能を上げるために大量のきれいなデータが必要とされます。画像認識では画像に何が写っているか、自動翻訳では英語の文が日本語ではどんな文になるか。

そういった大量のデータを「教師データ」と呼びますが、それらを大量に用意すること、あるいは教師データをコンピュータが扱える形に修正して入力していく作業は非常に大変であり、そのコストが機械学習活用におけるボトルネックになっています。そこで私は、そうしたコストを軽減するため、少量の、しかも整備されていないデータであっても、高い性能を達成しうる機械学習の仕組みを考え、さまざまな場面で価値を提供できる技術に発展させていくための研究を行っています。

教師データを参照しなくても解を導ける人工知能

「汎用的に利用できる機械学習」
岩田は自らがめざす機械学習システムの姿について、そんな風に話す。現在、私たちがビジネスや生活の場で利用するAI(その中身となる機械学習システム)は、ある一定のきれいな教師データによって育て上げられたものであって、決して私たちがビジネスや生活の目的に合わせて最初からつくりあげたものではない。
岩田が取り組む研究は、私たちが少量の、しかもノイズが含まれるような粗悪なデータであっても、それを用意するだけで機械学習システムを利用できるようになる未来を示してくれる。

機械学習は入力するデータと出力される解のペアがたくさんあればあるほど、その性能は向上していきます。もちろん人間を超えるような能力に成長していくこともめずらしくありません。一方で、すべて何でもできるようになるわけではなく、たとえば自由に対話をしたり、適度にあいづちを打ったりといったような作業は、現代の技術ではまだまだ人間でなければできません。コンピュータには得意・不得意があり、人間ほど柔軟にはできていないのです。

私は専門領域である潜在変数モデルを活用し、さまざまなパターンで、機械が教師データを参照せずとも、データ同士の関連性を自動的に推測することによって、適切に解を導き出す仕組みについて研究を重ねています。たとえば自動翻訳システムであれば、現在は「この日本語は英語だとこういう意味」といったように、入力と出力のペアをたくさん教え込まなければいけません。しかし私が考えるシステムであれば、日本語の文章と英語の文章を読ませておいて、それぞれの言語内でクラスタリング(データのグループ化)を行っておけば、単語同士の関連性から自動的に文章が翻訳されるようになります。極端に言えば、未知の言語であっても、大量に文章を読み込ませてクラスタリングさえできれば、自動翻訳できる可能性があります。つまり、少ない情報からより多くの情報を自動的に学習できるようになるのです。

NTTだからこそできる難易度の高い挑戦

機械学習研究の世界には非常にライバルが多い。GoogleやFacebookをはじめ、国内外で一流の研究者がしのぎを削る厳しい世界だ。NTT入社後、ケンブリッジ大へ留学し機械学習の研究を深めた岩田にとっては、かつて大学で共に研究をした仲間がライバル企業に所属し、活発に成果を競い合うような状況にある。
そうした中、岩田は「NTTだからこそ、価値のある研究ができる」と話す。NTT研究所のどういった特徴が岩田の研究を後押しするのだろうか。

私が研究を進めている教師データなしでクラスタをマッチングする研究については、これまでそこをめざそうとする研究者があまりいませんでした。それは、データ同士の関連性を見いだすマッチング技術が難しいだけではなく、クラスタリング技術自体も歴史がある技術ではありますが難しいものであり、両方を合わせることが非常に難度の高い挑戦だったからです。

その点、NTTにはさまざまな分野で高度な研究者が所属しています。機械学習だけではなく、自然言語処理や音声認識、ネットワークなど、ありとあらゆる分野に優れた研究者が所属しており、それぞれの専門分野から多くのヒントを得ることができます。先進的な研究者がそろっているシームレスな環境だからこそ、難易度の高い技術にも挑戦できるのです。
この先、機械学習の汎用化が進めば、あらゆる分野で機械学習を導入できるようになり、より多くの人がAIの恩恵にあずかれるようになります。たとえば化学データベースと身体情報データベースを統合して新しい薬の候補化合物が見つかるなど、さまざまな分野で機械学習が適応され、これまでにない新たな価値が生み出されるようになっていくかもしれません。
AIの得意なことはAIに任せ、人間は人間にしかできない新たな価値創造を。そんな未来をめざし、教師データを必要としない「機械学習の汎用化」に向けて頑張っていきたいと思います。

閉じる