u++の備忘録

python

画像認識におけるKMeansによるBoVW

『画像認識』(機械学習プロフェッショナルシリーズ)*1の第4章pp.92-95に載っていた、KMeansによるBag of Visual Words(BoVW)を実装。 import numpy as np from sklearn.cluster import KMeans ## KMeansによるBoVW def coding(X_ap): bovw = np.zeros((len…

画像データセット「CIFAR-10」からのSIFT特徴量の取得

CIFAR-10とは 以下のブログが詳しい。aidiary.hatenablog.com SIFT特徴量とは 『画像認識』(機械学習プロフェッショナルシリーズ)*1の第2章などを参照のこと。 ライブラリのインストール 以下のライブラリを準備する。 from chainer import datasets impor…

【Python, Gensim】doc2vecで関連記事の見出しを抽出する試み

今回は、過去2回の記事*1*2でも使った日経新聞のツイッター(@nikkei)の投稿文のデータセットを用いて、類似する見出しを抽出しようという話です。とある見出しと類似する見出し、つまり関連記事を取り出す試みになります。 doc2vec この問題に取り組むため、…

『画像認識』における統計的特徴抽出手法の可視化 Pythonでの実装

『画像認識』(機械学習プロフェッショナルシリーズ)の第3章「統計的特徴抽出」に登場した手法について、Pythonで実装しようと思います。www.kspub.co.jp この章で紹介されている手法は、以下の5つです。 主成分分析 白色化 フィッシャー線形判別分析 正準…

matplotlibでラベルの向きを変える

Pythonによる勾配降下法の実装 - u++の備忘録の記事で、以下のような図を作成した。y軸のラベルは横を向いている。これで全く問題ないのだが、ラベルの向きを変えたい場合には、次のように"rotation"のオプションを指定すれば良い。 import numpy as np impo…

Pythonによる勾配降下法の実装

勾配降下法 目的関数の1次微分を求めて、勾配の逆方向にパラメータを逐次的に更新していく手法。 数式表現 実装 条件 目的関数はに設定。明らかにで最小となる。 コード import numpy as np import matplotlib.pyplot as plt def J(x): return x*(x-4)+5 def…

PK戦の先行有利は新制度「ABBAルール」で是正されるかモンテカルロシミュレーションで検証してみた

先行有利のPK戦 サッカーのトーナメント制の大会で同点となった場合など、勝敗をつけるために行われるPK戦。当然のように交互にボールを蹴り合っていた制度の変更が、欧州サッカー連盟によって現在議論されているそうです。www.soccer-king.jpその理由は、現…

PyInstallerでPythonファイルをexe化

先駆者のページから必要部分を抽出。 retrofocus28.blogspot.jp インストール方法 > pip install pyinstaller 一つのファイルに実行時にコマンドプロンプトを表示させない形式でexe化 > pyinstaller hoge.py --onefile --noconsole 公式マニュアル PyInstall…

Nan(不定値)で条件分岐する

if( val != val ): #valがNanだったときの処理を書く PythonではNanとNanを比較するとFalseが返ってくるらしい。【参考】 linux.oboe-gaki.com

ネイピア数への収束を可視化

ネイピア数(ネイピアすう、英: Napier's constant)は数学定数の一つであり、自然対数の底である。 ネイピア数 - Wikipedia このネイピア数は、収束数列により以下のように定義される。 この収束の様子を可視化してみた。 import matplotlib.pyplot as plt …

大相撲の巴戦は最初に戦う2人が有利

9月場所で千秋楽前に豪栄道が優勝を決めました。純粋に嬉しいです。 そういえば先場所の千秋楽、巴戦が発生しそうな状況でした。巴戦は一見平等に見えて、実力が同等の場合、実は最初に戦う2人が有利です。mathtrain.jp 確率的に計算すると、最初に戦う2人が…

PandasでWebスクレイピング

Webページの表からデータを取得する方法。pythonのpandasで簡単にできた。 qiita.com