u++の備忘録

【論文メモ】決算短信から抽出した業績要因文の事業セグメントに基づく分類と業績文の抽出

論文名

村野壮人(成蹊大学), 酒井浩之(成蹊大学), 坂地泰紀(東京大学), 江口潤一(大和証券投資信託委託株式会社): 決算短信から抽出した業績要因文の事業セグメントに基づく分類と業績文の抽出, 第19回人工知能学会金融情報学研究会(SIG-FIN),2017.
http://sigfin.org/019-13/

どんなもの?

企業の決算短信から抽出した業績要因文を企業ごとに定められている事業セグメントに基づく自動分類をする手法と、決算短信から業績文を抽出する手法を提案する。

先行研究と比べてどこがすごい?

抽出された業績要因がどの事業セグメントに属するかを分類し,さらに,事業セグメントごと業績によって重要度を付与できれば,投資判断を行ううえで重要な情報源となる

技術や手法のキモはどこ?

業績要因文の事業セグメントに基づく分類

K近傍法による事業セグメント分類

業績文の自動抽出

深層学習

どうやって有効だと検証した?

事業セグメント名を収集した上場企業の中から選んだ 11 社の企業の決算短信を利用

議論はある?

  • 企業ごとの決算短信の書き方に大きく左右されてしまう
    • 複数の分類法を企業ごとに使い分けることが良い
    • 複数手法の和集合を取ることで精度・再現率の向上をしたい
      • 企業キーワードのスコアを用いた学習データの絞り込みによる誤分類の除去
      • k近傍法と業績文利用

次に読むべき論文は?

酒井浩之,西沢裕子,松並祥吾,坂地泰紀, “企業の決算短信PDFからの業績要因の抽出”, 人工知能学会論文誌, vol.30, no.1, pp.172-182, 2015.