u++の備忘録

【論文メモ】多様なデータソースを活用するディベート型人工知能のための自然言語を核とするデータ表現

論文名

柳井孝介, 佐藤美沙, 柳瀬利彦: 多様なデータソースを活用するディベート人工知能のための自然言語を核とするデータ表現, The 31st Annual Conference of the Japanese Society for Artificial Intelligence, 2017.
https://kaigi.org/jsai/webprogram/2017/paper-590.html

どんなもの?

多様なデータソースを活用し,多様な機能を実現するためのシステム設計について論じる。本稿では,統一的なシンボルやスキーマ,タクソノミを用いず,自然言語を核とした知識表現に基づいてシステムを構築する方法論を提案する。またプロトシステムを実装し,その効果を検証する。

先行研究と比べてどこがすごい?

これまでは,テキストから根拠を示す文を抽出するための根拠性認識に注力してきたが,本稿では別のアプローチとして,多様な分析機能を持つようにすることを検討する。具体的な例として,「X 社に投資すべきか」という論題を考える。この場合,これまでと同様に,過去のニュース記事や白書を解析して賛否の根拠を出すのに加えて,X 社の売上高のデータを過去10 年分集めて,上昇傾向にあるか下降傾向にあるかを提示することで,より効果的な経営判断の材料になると考えられる。

従来の設計手法の問題点

  • 単語「売上」の同一性
  • 不完全なデータの扱い
  • スキームに関わるコスト

技術や手法のキモはどこ?

本稿では,ロジックを自動的に習得する方法を考える替わりに,最初のステップとして,ロジックは人が考案して実装するものと仮定して,多数の分析ロジックを実装できるようなシステムの設計方針を考察する。

上記の問題点については、下記のように対応する。

  • 同一性に関しては,普遍的に同一かどうかを決めるのではなく,各エージェントが独自の類義辞書を持ち,そのタスクが実行されるコンテクストで同一と見なすかどうかを自然言語の表記で判定する。従って意味を事前に一意に決め,シンボル化するのとは別のアプローチとなる。
  • 不完全なデータも,自然言語で理解できる限りで,推測や補完で補って使う。
  • スキーマはできるだけ使わず,各エージェントが自然言語ベースでその持ち得る意味を推測する。

どうやって有効だと検証した?

プロトシステムの実装

議論はある?

  • 定量的な評価方法の確立
  • 機能数の増加後の提案モデルの検証
  • ロジックを自動で学習できる仕組みの考案

次に読むべき論文は?

アイディアの根幹と思しき書籍
[Minsky 09] Minsky, M.: ミンスキー博士の脳の探検: 常識・感情・自己とは, 共立出版 (2009)