u++の備忘録

Kaggle

Kaggle APIとLINE APIを用いたKernelの新規投稿を通知する仕組みの構築

はじめに システムの概要 launchdによる定期実行 Kaggle APIの実行 前回実行時からKernelの情報に差分があるか確認 LINE APIでの通知 デモンストレーション おわりに 脚注 はじめに Kaggle*1において、上位の成績を収めるためには日々投稿されるDiscussionや…

KaggleのSantander Value Prediction Challengeで銀メダルを取るためにしたこと(85th place solution)

注釈 初回公開時から89→90→85位に順位変動しました。Santander Value Prediction Challengeが本日終わり、順位は8985位で銀メダルでした。既にdiscussionに解法を投稿していますが、ブログにも日本語で共有します。 85th place solution 主な戦略は、以下の…

「Kaggleとは〇〇である」何と言えば一般の人に通じるのか問題

最近Kaggleにハマっているのですが、非エンジニアの友人に「Kaggleとは何か」を説明するのが難しいと感じています。本記事では、僕の試行錯誤と結果をまとめます。もし良い説明方法をお持ちの方がいたら、ぜひ教えてください。 想定する説明の状況 サイトで…

KaggleのWinner solutionにもなった「K近傍を用いた特徴量抽出」のPython実装

今回は、KaggleのWinner solutionにもなった「K近傍を用いた特徴量抽出」を紹介します。Rでの実装は公開されていますが、Pythonでの実装は確認できなかったので、自前のPython実装も公開しています。github.com アルゴリズムの概要 Pythonでの例 可視化のた…

勾配ブースティング決定木を用いたマーケティング施策の選定

はじめに 勾配ブースティング決定木とは 決定木とは アンサンブルとは バギング ブースティング Pythonでの実装例 データの準備 データの可視化 モデルの構築(クロスバリデーション) テストデータに適用 説明変数の重要度の算出 はじめに 今回は、勾配ブー…

データ分析からの新規施策提案|SF Bay Area Bike Share, Kaggle

はじめに 某イベントにて、「データ分析からの新規施策提案」をテーマに資料を作成したのでブログでも共有します。 題材 SF Bay Area Bike Share | Kaggle 成果物 Speaker Deck Kaggle Kernel GitHub

RBFカーネルのハイパーパラメータは何物か?

はじめに RBFカーネルとは? RBFカーネルを用いたSVM 上の画像を生成したPythonコード おわりに はじめに 今回の記事は、下記の質問に答えるものです。 RBFカーネルとは? RBFカーネル(Radial basis function kernel)は下記のように定義される関数のことです…

kmeansのinertiaとは何物か

暇だったのでkmeansのdocumentationを読んでいたら、今まで曖昧な理解だった"inertia"という語についてまとまった言及があったので、自分用メモ。2.3. Clustering — scikit-learn 0.21.3 documentation inertiaとは kmeansの最適化において最小化すべき指標…

Facebookの時系列解析ライブラリ「Prophet」で日経平均株価の終値を予測

データは、以下の記事と同様に取得しました(2007年〜2017年9月8日)。 upura.hatenablog.com今回は下記の記事に沿って、デフォルト設定で処理してみました。 d.hatena.ne.jp #!/usr/bin/env python3 # -*- coding: utf-8 -*- import pandas as pd from matp…