u++の備忘録

【論文メモ】文書分類とのマルチタスク学習による重要文抽出

論文名

磯沼大 et al.: 文書分類とのマルチタスク学習による重要文抽出, 人工知能学会全国大会論文集(第31回), 2017.05.

jsai2017:1J1-4 文書分類とのマルチタスク学習による重要文抽出

どんなもの?

参照要約(人手で作成された要約)が少量の場合においても有効な重要文手法として、文書分類の学習により重要文抽出の学習をサポートするマルチタスク学習モデルを提案する。提案モデルでは、文書分類に各文の分散表現の加重平均を利用し、その重み付けに各文の抽出確率を用いる。即ち、抽出確率の高い文ほど文書分類に大きな影響を与え、文書分類の学習時には、分類に有効な文の抽出確率が高くなるように学習が行われる。

先行研究と比べてどこがすごい?

文書分類及び重要文抽出は様々な既存研究が存在するが、文書分類を重要文抽出のサポートとして利用する手法は提案されていない。本研究ではこれをマルチタスク学習モデルによって実現すると共に、マルチタスク学習を効率的に進めるための新規のカリキュラム学習を提案する。

技術や手法のキモはどこ?

Cheng ら [Cheng 16] の分散表現を用いた一般的な重要文抽出モデルに汎用可能であるLSTM-RNNを用いた重要文抽出モデルに、マルチタスク学習を適用している。

どうやって有効だと検証した?

決算短信New York Times 紙における重要文抽出実験を行い、提案モデルの有効性を検証する。決算短信では売上高変化率及び純利益変化率の正負判定、New York Times 紙では記事のカテゴリ分類を文書分類タスクとして設定し、文書分類とのマルチタスク学習が精度向上に寄与するか検証した。

議論はある?

既存手法に比べ提案手法では、抽出成功した文内容と、ラベルとして用いた純利益変化率や売上高変化率との合致率が向上していた。

次に読むべき論文は?

[Cheng 16] Cheng, J., et al.: Neural Summarization by Extracting Sentences and Words, in ACL, pp. 484-494 (2016)