u++の備忘録

【論文メモ】ファクトチェックを必要とするニュース記事の探索の支援

ファクトチェックを必要とするニュース記事の探索の支援

どんなもの?

  • ファクトチェックの必要性を示唆する情報(=「端緒情報」)の探索を自動化し,人手による要検証記事探索作業を技術的に支援する仕組みを構築
    • Twitterの投稿を対象に,そこから端緒情報の可能性が高い投稿を自動抽出し,それらの情報に基づいてニュース記事を検証必要度の観点からランキングする

先行研究と比べてどこがすごい?

インターネット上の誤情報を検出する研究は行われているものの [1, 2, 9],幅広いドメインから端緒情報を抽出し,要検証記事を収集する研究は本研究が初

技術や手法のキモはどこ?

f:id:upura:20180506203932p:plain

どうやって有効だと検証した?

データセット

  • 朝日新聞デジタル,産経ニュース,日経電子版,毎日新聞のニュース・情報サイト,YOMIURI ONLINEのいずれかの媒体の記事 URL を含むツイートを 20,000 件抽出
    • 人手で各ツイートが端緒情報であるか判定
    • 正例:606 件(全体の 3.03%)
    • 負例:正例でなく,bot によるツイートや,記事の本文やタイトルを引用しているだけでないツイートのうち 2,851件

分類器(5種類)

f:id:upura:20180506205124p:plain

議論はある?

f:id:upura:20180506205429p:plain

  1. 単なる皮肉
  2. 指摘の対象が記事でなく政府
  3. 「嘘」は日常で使いやすい

次に読むべき論文は?

NULL