u++の備忘録

大相撲のデータ収集は「Sumo Reference」が便利

8月24日(土)に開催予定の「Sports Analyst Meetup #4」で大相撲関連の分析をするに当たって、まずはデータ収集に取り組んでいます。

spoana.connpass.com

Sumo Reference

筆者は「Sports Analyst Meetup #2」のtomi_ さんのLTで知ったのですが、大相撲のデータ収集は「Sumo Reference」が便利です。

sumodb.sumogames.de

f:id:upura:20190726205258p:plain

収録されている項目

デフォルトは英語のサイトですが、日本語版も公式でサポートしています。

歴代力士

例:横綱一覧表

力士の出世記録検索

例:大関取り

取組検索

例:対戦相手

おわりに

本記事では「Sports Analyst Meetup #4」でのLTに向けて、大相撲のデータを収録している「Sumo Reference」を紹介しました。次回は、収集したデータの簡単な探索的分析・可視化をしていく予定です。