u++の備忘録

【論文メモ】業績推定とのマルチタスク学習による決算短信からの重要文抽出

論文名

磯沼大 et al.: 業績推定とのマルチタスク学習による決算短信からの重要文抽出, 研究報告情報基礎とアクセス技術(IFAT), 2017-IFAT-124, No. 10, pp. 1-6, 2017.02.

研究会 - 業績推定とのマルチタスク学習による決算短信からの重要文抽出

どんなもの?

重要文抽出の学習に参照要約だけでなく業績情報を用いる。具体的には、業績推定とのマルチタスク学習を導入し、業績を推定可能な文を抽出するように判別器を学習し、参照要約が少量の場合にも汎化性能が高い学習モデルを実現する。

先行研究と比べてどこがすごい?

重要文抽出と業績推定のマルチタスク学習を導入することで、業績情報を擬似的な学習データとして利用し、参照要約が少ない文書においても汎化性能が高い重要文抽出手法を新規に提案している。

技術や手法のキモはどこ?

Chengら [2] の研究をベースにしたモデル構築。

どうやって有効だと検証した?

提案手法をLSTM-RNNに適用し、実際の決算短信と記事を用いた精度検証実験を行った結果、特に訓練データが少量の場合において精度が向上し、かつそれが業績推定の学習によりもたらされたことが確認された。

議論はある?

汎化性能の向上に業績推定が寄与したことは、検出成功した重要文が業績を反映しているか確認することで検証された。既存手法に比べ提案手法の方が検出成功した重要文が業績を反映しており、提案手法が再現率とF値の上昇に寄与したと示唆された。

次に読むべき論文は?

[2] Cheng, J., et al.: Neural Summarization by Extracting Sentences and Words, in ACL, pp. 484-494 (2016)