【論文メモ】ファクトチェックを必要とするニュース記事の探索の支援
ファクトチェックを必要とするニュース記事の探索の支援
- 田上翼, 浅野広樹 (東北大), 楊井人文, 山下亮 (日本報道検証機構), 小宮篤史, 藤村厚夫 (スマートニュース), 町野明徳 (フリー), 乾健太郎 (東北大)
- 言語処理学会第24回年次大会(NLP2018)
- http://anlp.jp/proceedings/annual_meeting/2018/pdf_dir/B3-3.pdf
どんなもの?
- ファクトチェックの必要性を示唆する情報(=「端緒情報」)の探索を自動化し,人手による要検証記事探索作業を技術的に支援する仕組みを構築
- Twitterの投稿を対象に,そこから端緒情報の可能性が高い投稿を自動抽出し,それらの情報に基づいてニュース記事を検証必要度の観点からランキングする
先行研究と比べてどこがすごい?
インターネット上の誤情報を検出する研究は行われているものの [1, 2, 9],幅広いドメインから端緒情報を抽出し,要検証記事を収集する研究は本研究が初
技術や手法のキモはどこ?
どうやって有効だと検証した?
データセット
- 朝日新聞デジタル,産経ニュース,日経電子版,毎日新聞のニュース・情報サイト,YOMIURI ONLINEのいずれかの媒体の記事 URL を含むツイートを 20,000 件抽出
- 人手で各ツイートが端緒情報であるか判定
- 正例:606 件(全体の 3.03%)
- 負例:正例でなく,bot によるツイートや,記事の本文やタイトルを引用しているだけでないツイートのうち 2,851件
分類器(5種類)
議論はある?
- 単なる皮肉
- 指摘の対象が記事でなく政府
- 「嘘」は日常で使いやすい
次に読むべき論文は?
NULL