すごいね!クールラボラトリー[研究者紹介]

教授 長谷山 美紀
大学院情報科学研究科 メディアネットワーク専攻
情報メディア学講座 メディアダイナミクス研究室
教授 長谷山 美紀
[プロフィール]
○研究分野/画像・映像・音楽処理、AI、IoT、ビッグデータ解析
○研究テーマ/AI・IoT・ビッグデータ/複雑ネットワーク処理に基づくマルチメディア解析技術の実社会応用

企業との厚い信頼関係をベースに
社会の実態に適応するAI技術を提案

画像や映像を人間のように理解・思考する
「想像力」を持ったAIの開発

長谷山美紀教授がリーダーを務めるメディアダイナミクス研究室では、画像認識、画像検索、映像意味理解などの技術をベースに、画像や映像を人間のように理解する次世代マルチメディアシステムの実現を目指している。「人間のように理解する」とは文字通り人間の認知機能を再現したシステムのことで、従来のAI(人工知能)のメカニズムとは根本的に異なる。脳科学や心理学をもとに人間が何を視聴し、どのように把握・認識しているかを探求することで、それをAIに再現させる技術の開発に取り入れている。

「例えば、既存のAIは人間に『これは猫だ』と教えられなくても、インターネット上から猫に関する画像を抽出することができます。それは、過去に蓄積された情報の中から猫に該当する特徴を自ら学習しているからです。では、もし誰も見たことがない新しい品種が誕生したら、AIはそれを猫と認識することができるでしょうか。あるいは、誰も見たことがない新種の猫を創り出すことができるでしょうか。私たちが目指しているのは、こうした『想像力』を持ったAI、膨大なデータの中から『気づき』を生み出すことができる技術の開発なのです」

AIに想像力を持たせるには、ニューラルネットワークの中に特別な層を埋め込むことが必要になると長谷山教授は語る。ルール通りの思考プロセスにあえて異分子を組み込むことで発想の飛躍や気づきをもたらそうという試みだ。具体的には、ニューラルネットワークの中に、異なる種類のデータの関連性を学習するアルゴリズムを導入するという手法で、導入するアルゴリズムは研究室のメンバーが興味や関心を持つものを自由に選択させている。もちろん思い通りの結果が出るとは限らないが、試行錯誤の蓄積がデータとなり、次のトライアルの手がかりになる。

「大学のメリットは、社会や企業という枠組みにとらわれず自由な発想ができる個性豊かな学生がたくさんいることです。個々の学生が面白いと思ったもの、興味のあることをどんどん取り入れていくと、発想が多様化し、思いがけない広がりが生まれます。加えて、高度な研究環境の中で理論や技術を深めていくことができます。多様性を維持しつつ確実にプロジェクトを前進させていけることが本研究室の特徴であり、多くの企業から注目されている点だと思います」

提案~実施~検証~高度化~再提案のサイクルを
長期間継続できる産学共同研究のあり方

本研究室では、開発したAIを利用してさまざまな企業や研究機関との共同研究を行っている。医療の分野ではピロリ菌感染の有無を自動的に判別するシステム(脚注1)を開発。社会インフラの分野では高速道路の橋や鉄塔等の変状評価を支援するシステム(脚注2)を開発している。どちらも入力された画像に対し、過去のデータの中から学習されたAIを構築することで感染の有無や補修の必要性などを判定する。

判定の正確性は100%には至っていないが、本システムの特筆すべき点は残り数%の誤読をフォローする仕組みを持っていることにある。既存のAIは結果のみを提示し、その根拠については解説しないが、本システムではAIがどこに注目して判別しているか根拠を示すことができる。AIが識別できなかった部分を人間が直接確認したり、あるいは別の方法で判別するなどの方策が可能になるので、システムの精度が100%でなくても十分実用化できると評価されているのだ。

「AIが社会に浸透するためには、多様な産業形態や業務・サービスの実態に適したシステムを提供することが重要です。100%ではなくても50%あれば使える、95%なら導入できるという分野もあるはず。私たちはそのニーズに即した技術を提案することができ、仕様や精度をどこに設定するかを企業と一緒に考えることができる。実際の現場でPDCAを回しながら、その結果をもとに大学で技術を改良・高度化し、利用可能なシステムに育てていく。それが理想的な産学連携のあり方だと思います」

また、近年は河川空間の点検業務における視線データ解析(脚注3)にも取り組んでいる。視点取得装置を装着した技術者に点検を行ってもらい、視線の動きや注目箇所、視線の角度などのデータを測定。若手技術者と熟練技術者との違いなどを分析している。

「熟練技術者の点検ノウハウを画像データとして表現することができれば、経験がない若い技術者でも補修の必要性や緊急度の判定などに利用できます」

本研究室では学部生も含め研究メンバーの全員に徹底した機密保持と情報管理を義務付けている。これにより企業との信頼関係が生まれ、協業先の企業や研究機関が保有するデータを質・量ともに十分確保することができ、現場のニーズに応じたシステム開発に生かされている。


脚注1 判読医のように画像を判断するAI技術の開発
ピロリ菌感染の有無を判読するにはX線で撮影した画像で胃の粘膜に広がるひだの状態等を目視するが、正確に見分けるには経験が必要で、判読医でも正確な判別が容易ではないと言われている。本研究のシステムは、画像データの特徴を過去の類似データと比較することで判別を可能にし、その精度は97%に達している。
脚注2 橋や鉄塔等の点検データを活用したインフラ管理の効率化
現場で撮影した点検箇所の写真と過去に撮影された画像データを比較し、類似した画像を検索すると同時に、過去の補修記録などを表示することで、補修の必要性や緊急度などを判定することができる。

脚注3 点検業務における視線データの取得とその分析
北海道札幌市の河川で、堤防などの点検作業員に視線取得装置を装着し、約1㎞の区間を点検してもらった。測定の結果、若手技術者は視界の広範囲を一様に確認しているのに対し、熟練技術者は視界の一部を集中的に確認していることなどがわかった。

次世代情報推薦AIシステム『KANADE-ICS』は、画面に表示された観光画像にタッチすると、利用者の好みを推定し、好みに合致する観光画像を推薦する。2018年12月にはチ・カ・ホ(札幌駅前通地下歩行空間)北2条広場”Sapporo*north2″で実証実験が行われた。

メディアダイナミクス研究室ではいつも熱いディスカッションが展開されている。長谷山教授は学生たちの個性を尊重すると同時に、社会との関わり方や研究者としての責任を常に自覚するよう指導している。