u++の備忘録

確率・統計

W杯ロシア大会の組み合わせ抽選結果を箱ひげ図で表してみた

グループごとにデータ数が4つしかないので箱ひげ図は不適切なのですが、グループ分けして箱ひげ図を書く練習としてやってみました。ざっくりと、開催国ロシアを含むAグループが比較的FIFAランキングが低めなこと、Cグループが熾烈なことなどが読み取れます。…

『画像認識』(機械学習プロフェッショナルシリーズ)第5章まとめ

某所にて、『画像認識』(機械学習プロフェッショナルシリーズ)の勉強会(輪読形式)があり、第5章「分類」を担当しました。参考書の内容に加え、『パターン認識と機械学習 上』の内容も盛り込み、包括的に「分類」を扱いました。www.kspub.co.jp下記の記事…

【Python&遊戯王デュエルリンクス】スクリーンショットから初期手札の「バランス」を自動取得するスクリプト

11月6日のアップデートで、スキル「バランス」に一定のランダム性が付与されたそうです。どの程度のランダム性が付与されたかを調べるため現在、モンスター10枚・魔法5枚・罠5枚デッキで「バランス」を使ってデュエルを始めた際の初期手札のスクリーンショッ…

kmeansのinertiaとは何物か

暇だったのでkmeansのdocumentを読んでいたら、今まで曖昧な理解だった"inertia"という語についてまとまった言及があったので、自分用メモ。2.3. Clustering — scikit-learn 0.19.1 documentation inertiaとは kmeansの最適化において最小化すべき指標で、各…

【論文メモ】乗換案内データを用いた未来の混雑予測の研究

論文名 坪内孝太, 下坂正倫, 小西達也, 丸山三喜也, 山下達雄: 乗換案内データを用いた未来の混雑予測の研究, The 31st Annual Conference of the Japanese Society for Artificial Intelligence, 2017. jsai2017:4I1-4in1 乗換案内データを用いた未来の混雑…

【Jリーグ】勝ち点と新聞記事の登場数に相関があるか調べてみた

ふと気になって、勝ち点と新聞記事の登場数に相関があるか調べてみました。勝ち点を取るほど紙面に取り上げられる回数も増えるのではないかという仮説です。 検索対象 朝日新聞オンライン記事データベース「聞蔵(きくぞう)II ビジュアル」*1を用いて、1985…

【遊戯王デュエルリンクス】メテブラオートの初期手札で融合できる確率をPythonで計算 最適なデッキレシピの推定

遊戯王デュエルリンクス*1におけるレベル上げ*2などで「メテブラオート」*3を使っていますが、スキル「バランス」*4がないキャラクターだと、少なからず手札事故で融合できないまま敗北することがあります。今回は、ランダムで配布される初期手札で融合でき…

1試合当たり得点・失点から見る浦和レッズ・ペトロヴィッチ監督の凄さ

浦和レッズの監督を務めていたミハイロ ペトロヴィッチの解任が本日、発表されました*1。 細やかな不満はあるにせよ、5年半もの長きにわたり浦和レッズで魅力的なサッカーを展開してくれたことに深くお礼を申し上げます。 今回の記事では、1試合当たり得点・…

山本・地方創生相「アメリカのいい大学は田舎にしかない」発言を可視化して検証してみた

背景と目的 朝日新聞デジタルは7月28日、山本幸三地方創生相の発言録として、以下のような内容*1を報じました。 (東京一極集中の是正に向けて東京23区内にある大学の定員を抑制する政府の方針に関連して)アメリカを見てみれば、よい大学は田舎にしかない…

正準相関分析に関する文献

『画像認識』(機械学習プロフェッショナルシリーズ)の第3章「統計的特徴抽出」に登場した正準相関分析について、更なる理解の参考になりそうな文献。以下は書籍における説明を抜粋した。 正準相関分析(canonical correlation analysis, CCA)は,複数の情…

『画像認識』における統計的特徴抽出手法の可視化 Pythonでの実装

『画像認識』(機械学習プロフェッショナルシリーズ)の第3章「統計的特徴抽出」に登場した手法について、Pythonで実装しようと思います。www.kspub.co.jp この章で紹介されている手法は、以下の5つです。 主成分分析 白色化 フィッシャー線形判別分析 正準…

Pythonによる勾配降下法の実装

勾配降下法 目的関数の1次微分を求めて、勾配の逆方向にパラメータを逐次的に更新していく手法。 数式表現 実装 条件 目的関数はに設定。明らかにで最小となる。 コード import numpy as np import matplotlib.pyplot as plt def J(x): return x*(x-4)+5 def…

主成分分析における行列表現

線形次元削減 高次元の訓練入力標本から低次元の表現を求めること。 つまりの埋め込み行列を用いて、としてを求めること。 主成分分析 次元削減後の表現がの正射影であるという制約の下で、がとなるべく近くなる埋め込み行列を決定する。 下線部はと行列を用…

『画像認識』(機械学習プロフェッショナルシリーズ)第1章まとめ

某所にて、『画像認識』(機械学習プロフェッショナルシリーズ)の勉強会(輪読形式)がありました。www.kspub.co.jp 第1章を担当し、以下の資料にまとめました。第1章では画像認識の概要がまとめられており、その後の章で具体的に解説していく構成になって…

PK戦の先行有利は新制度「ABBAルール」で是正されるかモンテカルロシミュレーションで検証してみた

先行有利のPK戦 サッカーのトーナメント制の大会で同点となった場合など、勝敗をつけるために行われるPK戦。当然のように交互にボールを蹴り合っていた制度の変更が、欧州サッカー連盟によって現在議論されているそうです。www.soccer-king.jpその理由は、現…

成功確率1%で繰り返し挑戦してみた

Twitter見てたら、また香ばしいツイートが流れてきた。難しそうだから挑戦しないといつまで経っても達成感の得られることはできません。成功確率1%でも100挑戦し続ければ、できる可能性が100%になります。少しでも可能性のある「できたら面白そう」なこと…