u++の備忘録

2019-01-01から1ヶ月間の記事一覧

「オレシカナイトデータコンペティションvol.2」で準優勝でした

はじめに コンテストの概要 オレシカナイトとは 競技概要 ビジネス的な意義 既存の説明変数 評価指標 自分の解法 戦略 説明変数 学習モデル 結果 所感 はじめに 1月26日に、AbemaTVの実データを使ったデータ分析のコンテストに参加し、準優勝でした。本記事…

Machine Learning Casual Talks #8 に参加しました&全発表まとめ

はじめに Machine Learning Casual Talksをはじめた理由 発表資料 「エムスリーにおける機械学習活用事例と開発の効率化」 発表資料 概要 所感 「BEDOREにおける対話エンジンの開発と運用」 発表資料 概要 所感 LT「bfloat16について」 発表資料 概要 所感 L…

AtCoder「全国統一プログラミング王決定戦予選」をPythonで解く

atcoder.jpC問題まで普通に解ける問題だったのに、妙な力みから些細なミスでWAを連発しました。猛省せねばです・・・。 A - Subscribers(100点) 最大値は、片方が片方を包含した場合なので、AとBの小さい方 最小値は、両者を完全に分離した場合なので0か、…

【書籍メモ】「ビジネスでインパクトが出せるデータサイエンティストになるためには」

ビジネスでインパクトが出せるデータサイエンティストになるためには はじめに 感想 はじめに データサイエンティストが力を発揮する場 課題設定 解決方法の設計 検証 育成 まとめ おわりに ビジネスでインパクトが出せるデータサイエンティストになるために…

「カンマ区切りで複数要素が入った列」をpandasで集計

本記事では、「カンマ区切りで複数要素が入った列」をpandasで集計する方法を紹介します。「カンマ区切りで複数要素が入った列」とは、下記のような状況です。例えばアンケートの複数選択可の回答などで、行ごとに含まれる要素数も異なる場合が考えられます…

多クラス分類の不均衡データのdownsampling

問題設計 例えば4クラス分類で、比率が[0.5, 0.25, 0.15, 0.10]のような問題を考えます。 from sklearn.datasets import make_classification args = { 'n_samples': 100000, 'n_features': 10, 'n_informative': 3, 'n_redundant': 0, 'n_repeated': 0, 'n_…

Data Driven Developer Meetup #4 で登壇しました&全発表まとめ

はじめに スポンサーセッション 『機械学習を使ったサポート問い合わせ予測』 メインセッション 『機械学習を⽤いた⽇経電⼦版Proのユーザ分析』 『医療用語に注目した文書の類似度計算』 LT 『Bokehではじめるデータビジュアライゼーション』 『SlackへのKP…

Fizz Buzz in PyTorch

In this article, I utilize MLP(Multilayer perceptron) by PyTorch to solve Fizz Buzz problem.This challenge is highly inspired by the following page, and I use the same situation.joelgrus.comYou can see the Japanese version here:upura.haten…

PyTorchでFizzBuzz

本記事では、PyTorchのMLP(Multilayer perceptron)を用いて、FizzBuzzを解いてみます。条件設定は、以前に話題になった下記のサイトに従います。IT会社面接官:「数字を列挙し、3の倍数ならfizz、5の倍数ならbuzz、15の倍数ならfizzbuzzを出力するプログラム…

pd.read_csv()が高速化するmodin.pandas

はじめに GitHubリポジトリ 試してみた インストール ライブラリの読み込み 実験 pandas modin.pandas 未対応機能も おわりに はじめに Twitterで見かけて、全く知らなかったので試してみました。pandasのimportを置き換えるだけで、並列処理にしてくれる、m…

第75回R勉強会@東京 (#TokyoR) にて「17^2+19^2+37^2=2019」の題目で発表しました

本日開催された「第75回R勉強会@東京 (#TokyoR) 」にて「17^2+19^2+37^2=2019」の題目でLTをしました。tokyor.connpass.com2019年初の回ということで、題材は「素数と2019」にしました。primesパッケージを紹介し、2019にまつわる素数の話をしています。Rス…

gitでremote repositoryの特定のbranchをlocalに落とす

自分用のメモ。Pull Requestのレビュー時など、過去のコマンドから都度漁っていたので、まとめておく。 gitコマンド git fetch --prune git branch -r git ch -b local-name origin/remote-name 説明 git fetch --prune remote repositoryからデータを取得 -…

LightGBMでdownsampling+bagging

はじめに データセットの作成 LightGBM downsampling downsampling+bagging おわりに はじめに 新年初の技術系の記事です。年末年始から最近にかけては、PyTorchの勉強などインプット重視で過ごしています。その一環で不均衡データの扱いも勉強しました。ク…

東大の本郷キャンパスから柏キャンパスまで歩いてみた

2019年初挑戦として、東大の本郷キャンパスから柏キャンパスまで歩いてみました。世間では箱根駅伝もやってるし、新年初挑戦として東大の本郷キャンパスから柏キャンパスまで歩いてみようかなと。のんびり頑張ります。 pic.twitter.com/M3LNzO78KW— u++ (@up…