u++の備忘録

スポーツ

「Basketball Behavior Challenge BBC2020」で4チーム中1位に

9月1日まで開催されていた「Basketball Behavior Challenge BBC2020」*1というコンペで1位になりました*2。選手とボールの座標推移からスクリーンプレイの有無を判定するタスクで、分析していて楽しいコンペでした。 解法の概要とスコアの推移は下図の通りで…

「リングフィットアドベンチャー」をクリアした

2月末ごろに完全在宅勤務に移行した後に購入した「リングフィットアドベンチャー」を(一旦)クリアしました。 なんか運よく調達できた(switchがまだ無い) pic.twitter.com/idv0Dk4rmv— u++ (@upura0) March 11, 2020 リングフィットアドベンチャーとは? …

「Sports Analyst Meetup #8」をオンラインで開催しました #spoana

「Sports Analyst Meetup #8」*1を、7月18日に開催しました。昨今の情勢を受け、7回目に引き続きのオンライン開催でした。 資料 spoana.connpass.com togetter togetter.com 発表内容 今回は10名の方にLTをしていただきました。いずれも素敵な内容で、多くの…

東西分割開催のJリーグ各チーム移動距離を可視化

新型コロナウイルス感染症の拡大防止のため第1節を終えた段階で中断していたJ1リーグは、7月4日に一斉再開しました。7月中は移動による感染リスクを避けるため近隣クラブが対戦する方式を採用しており、具体的には全18チームを東西に2分して各グループ内で対…

令和大相撲の暫定王者は誰だ?USWC(非公式相撲世界王者)とともに振り返る

次の記事に影響を受けて、大相撲版をやってみようと思い立ちました。 note.com 概要は次の通りです。 平成最後の「平成31年春場所」で優勝した白鵬を、令和開始時の「王者」とする 令和になってからの取り組みで「王者」に勝利した力士を次の「王者」とする …

「Sports Analyst Meetup #7」を初のオンラインで開催しました #spoana

「Sports Analyst Meetup #7」を、4月16日に開催しました。昨今の情勢を受け、7回目にして初めてのオンライン開催となりました。250名以上の申し込みがあり、だいたい170人程度にご参加いただきました。 spoana.connpass.com 発表内容 今回は4名の方にLTをし…

「Sports Analyst Meetup #6」開催報告&発表まとめ

「Sports Analyst Meetup #6」を開催しました。 新型コロナウイルス感染症の影響を勘案し、直前に懇親会の中止を決定しての開催となりました。参加者の方々にご了承いただいた上、当日は運営に温かいお声がけをいただきましたこと、心よりお礼申し上げます。…

「Sports Analyst Meetup」 #spoana を2019年に5回開催した話

「スポーツアナリティクス Advent Calendar 2019」*1の1日目の記事です。 はじめに 発足の背景 第1回(2月24日) 第2回(5月12日) 第3回(6月30日) 第4回(8月24日) 第5回(11月2日) おわりに はじめに スポーツデータ分析を題材にした「Sports Analyst …

J2降格からJ1復帰にかかった年数をまとめた

諸事情*1でJ2降格に関する情報が気になっている今日このごろ、J2降格からJ1復帰にかかった年数をまとめてみました。降格・昇格チームの一覧*2を見ながら、手作業で処理しました。良い可視化方法が思いつかなかったので、一旦は表形式です。元データはGitHub*…

「Sports Analyst Meetup #5」を開催しました #spoana

はじめに 発表資料 togetter ロングトーク①「batter pitcher 2 vec」 ロングトーク②「野球界でのシステム導入事例~IT企業としてのサポート~」 LT ご協力いただいた企業 おわりに はじめに 「Sports Analyst Meetup #5」を開催しました。spoana.connpass.co…

Poincaré Embeddings でJ1リーグのチーム・選手を可視化

ふと「Poincaré Embeddings」*1で遊んでみたいと思い立ち、サッカーJ1リーグのデータで試してみました。 Poincaré Embeddings gensimでの実装とデータセット Poincaré Embeddingsの学習 活用方法 おわりに Poincaré Embeddings Poincaré Embeddingsに関する…

「Sports Analyst Meetup #4」を開催&LTしました #spoana

はじめに 発表資料 togetter ロングトーク①高久侑也さん(株式会社Sportip) ロングトーク② TKB84さん LT 自分の発表 おわりに 過去の開催 はじめに 「Sports Analyst Meetup #4」を開催しました。前回に引き続き、自分自身もLTで発表しました。spoana.connp…

【特徴量の追加編】機械学習を用いた大相撲千秋楽の勝敗予想

はじめに 「連勝・連敗」特徴量の追加 tsfresh特徴量の追加 おわりに はじめに 前回は、「Sports Analyst Meetup #4」でのLTに向けて、ベンチマークとなる機械学習モデルを構築しました。新しい特徴量を追加することで、予測モデルの性能が向上することも確…

【ベンチマーク編】機械学習を用いた大相撲千秋楽の勝敗予想

はじめに ベンチマークの構築 特徴量 目的変数 機械学習モデル Validation の構築 評価性能 新しい特徴量の追加 追加する特徴量 評価性能(新しい特徴量の追加) おわりに はじめに 前回は、「Sports Analyst Meetup #4」でのLTに向けて、「Sumo Reference」…

【可視化編】機械学習を用いた大相撲千秋楽の勝敗予想

はじめに データの収集 仮説 可視化 おわりに はじめに 前回は、「Sports Analyst Meetup #4」でのLTに向けて、大相撲のデータを収録している「Sumo Reference」を紹介しました。upura.hatenablog.com本記事では、「Sumo Reference」から収集したデータを用…

大相撲のデータ収集は「Sumo Reference」が便利

まだ全然用意してないですが「機械学習を用いた大相撲千秋楽の勝敗予想」でLTしようと思います。LT枠空いているので、気軽に是非!「スポーツ×データ分析」に関係あれば競技問わず何でもOKです。 #spoana pic.twitter.com/9DPdyc9Tu2— u++ (@upura0) July 22…

「Sports Analyst Meetup #3」を開催&LTしました #spoana

はじめに 発表資料 togetter ロングトーク「Jリーグ導入事例から見えてきた、ダイナミックプライシングの未来」 LT 自分の発表 おわりに 過去の開催 はじめに 「Sports Analyst Meetup #3」を開催しました。今回は自分自身もLTで発表しました。spoana.connpa…

「Sports Analyst Meetup #2」を開催しました #spoana

「Sports Analyst Meetup #2」を開催しました。実務でスポーツのデータ分析をしている方のロングトーク2本に加え、LTも10本と盛りだくさんの内容でした。spoana.connpass.com2月末に開催した初回に続く、第2回の開催です。upura.hatenablog.com発表資料はこ…

「Sports Analyst Meetup #1 」を開催&発表しました #spoana

はじめに 開催の背景 当日の発表内容 初心者向けスポーツ分析チュートリアル「目標達成に導くデータ分析」 LT 閉会後も・・・ おわりに はじめに 「Sports Analyst Meetup #1」を昨日2月24日に開催しました。多くの方に「楽しかった」と言っていただき、運営…

初心者向けスポーツ分析チュートリアル「目標達成に導くデータ分析」 | Sports Analyst Meetup #1

2019年2月24日開催「Sports Analyst Meetup #1」の「初心者向けスポーツ分析チュートリアル」を担当します。本記事では、事前に発表資料を公開します。connpass.com「目標達成に導くデータ分析」と題して、スポーツアナリストの定義や分析の基礎的な話をまと…

iOS標準アプリ「ヘルスケア」からデータを書き出しcsvに変換

はじめに データの概要 データの取り出し方 ヘルスケアアプリからXMLファイルを書き出す XMLファイルをcsvファイルに変換する 分析例 おわりに はじめに 本記事では、iOS標準アプリ「ヘルスケア」からデータを書き出し、csvに変換する方法をまとめます。 デ…

第43回阪大AIメディカル研究会にて「野球データ分析ハッカソン準優勝解法と特徴量重要度」の題目で発表しました

はじめに 12月22日に開催された「第43回阪大AIメディカル研究会」にて「野球データ分析ハッカソン準優勝解法と特徴量重要度」の題目で発表しました。下記の記事で取り上げたハッカソンのについての発表です。upura.hatenablog.com12月21〜23日に京都・大阪に…

第74回R勉強会@東京 (#TokyoR) にて「Soccer × Attribution Analysis」の題目で発表しました

本日開催された「第74回R勉強会@東京 (#TokyoR) 」にて「Soccer × Attribution Analysis」の題目でLTをしました。tokyor.connpass.com 発表内容 概要 課題と目的 手法 ケーススタディ 結果と考察 結論 所感 発表内容 概要 マーケティング分析の手法である「…

Jリーグ2018年シーズンの勝ち点推移を可視化 pythonでデータ取得から可視化まで

2018年シーズンのJ1リーグでは、序盤にサンフレッチェ広島が独走していましたが、7月のW杯中断明けごろから失速。後半になって追い上げた昨年王者の川崎フロンターレに首位を譲る展開になっています。川崎フロンターレの驚異的な追い上げがどの程度か気にな…

「ベースボールデータハッカソン」エンジニアリング部門で準優勝しました

昨日と本日の2日間にわたって開催された「パ・リーグ×パーソル ベースボールデータハッカソン」にて、エンジニアリング部門で準優勝しました。techplay.jp賞品として、パリーグ6球団タオルセットを頂きました。ありがとうございました。本記事では、ハッカソ…

阪神タイガース、今季初の八回から逆転勝利 昨日までの「0勝50敗」は他チームと比べ酷い数字か検証する

はじめに データの取得 データの前処理 データの分析 まとめ はじめに 本日朝、サンスポに次の記事が掲載されました。阪神タイガースは今季、「七回終了時にリードを許している試合で0勝50敗」という少し衝撃的なデータです。www.sanspo.comこの記事に刺激さ…

W杯ポーランド戦で起きた「談合」を、経済学の「ナッシュ均衡」の視点で解説する

先ほど終わったロシアW杯の日本VSポーランド戦の終盤、お互いに全く攻撃をしない状況が発生しました。今回はこの現象を、経済学の「ナッシュ均衡」という視点で解説します。 状況の整理 お互いが攻撃する 片方が攻撃する お互いが攻撃しない なぜ「お互いが…

W杯ロシア大会の組み合わせ抽選結果を箱ひげ図で表してみた

グループごとにデータ数が4つしかないので箱ひげ図は不適切なのですが、グループ分けして箱ひげ図を書く練習としてやってみました。ざっくりと、開催国ロシアを含むAグループが比較的FIFAランキングが低めなこと、Cグループが熾烈なことなどが読み取れます。…

【Jリーグ】勝ち点と新聞記事の登場数に相関があるか調べてみた

ふと気になって、勝ち点と新聞記事の登場数に相関があるか調べてみました。勝ち点を取るほど紙面に取り上げられる回数も増えるのではないかという仮説です。 検索対象 朝日新聞オンライン記事データベース「聞蔵(きくぞう)II ビジュアル」*1を用いて、1985…

1試合当たり得点・失点から見る浦和レッズ・ペトロヴィッチ監督の凄さ

浦和レッズの監督を務めていたミハイロ ペトロヴィッチの解任が本日、発表されました*1。 細やかな不満はあるにせよ、5年半もの長きにわたり浦和レッズで魅力的なサッカーを展開してくれたことに深くお礼を申し上げます。 今回の記事では、1試合当たり得点・…