u++の備忘録

2023-01-01から1年間の記事一覧

言語処理100本ノック 2020「62. 類似度の高い単語10件」

問題文 nlp100.github.io 問題の概要 most_similar *1 を使います。topn で上位何件を返すかを指定できます。デフォルトで topn=10 となっていますが、分かりやすさのために敢えて明示的に指定しています。 from gensim.models import KeyedVectors model = …

言語処理100本ノック 2020「61. 単語の類似度」

問題文 nlp100.github.io 問題の概要 コサイン類似度を計算します。 from gensim.models import KeyedVectors model = KeyedVectors.load_word2vec_format('ch07/GoogleNews-vectors-negative300.bin', binary=True) print(model.similarity("United_States",…

言語処理100本ノック 2020「60. 単語ベクトルの読み込みと表示」

問題文 nlp100.github.io 問題の概要 本章では、単語の意味を実ベクトルで表現する単語ベクトル(単語埋め込み)を扱います。最初に、学習済みモデルをダウンロードし、単語ベクトルを表示します。 from gensim.models import KeyedVectors model = KeyedVec…

ニューヨーク & 熊本に行きました

5 月末から 6 月にかけて、ニューヨークと熊本に行ったという事実の備忘録です。 ニューヨーク 書けることが少ないので、業務時間外での観光情報のみです。 熊本 人工知能学会全国大会で 8 日 (木) 13:30-15:10 にポスター発表をしました。 熊本城まで徒歩10…

【書籍メモ】『新しいヒューマンコンピュータインタラクションの教科書』(講談社)

『新しいヒューマンコンピュータインタラクションの教科書』(講談社)を読みました。 人間やコンピュータが交わる「ヒューマンコンピュータインタラクション(HCI)」という研究領域に関する書籍です。 www.kspub.co.jp 現在注目の話題となっている「ChatGP…

【書籍メモ】『ディープフェイクの衝撃 AI技術がもたらす破壊と創造』(PHP 新書)

『ディープフェイクの衝撃 AI技術がもたらす破壊と創造』(PHP 新書)を読みました。 画像・テキストなどを生成する人工知能技術(生成 AI)が急速な発展を遂げる中で、これらの技術が生み出す危険性の側面を理解しておくことは非常に重要です。 本書はデ…

【書籍メモ】『応用基礎としてのデータサイエンス』(講談社)

『応用基礎としてのデータサイエンス』(講談社)を出版社のご厚意でお送りいただきました。 豪華な著者陣による書籍で、データサイエンスに関連する広範な話題を 1 冊にまとめています。 具体的な内容は目次をご参照ください。 www.kspub.co.jp 以前に読ん…

大阪環状線を徒歩で一周した

1 月に国内外の論文投稿の締め切りラッシュがあった影響で、気分転換のために 1 月 28 日〜 2 月 12 日に休暇を取得しました。 愛知・兵庫・京都・大阪などを気ままに転々としています。 今日は、大阪環状線*1を徒歩で一周してみました。 大阪環状線は一周 2…

「Kaggle Days Paris 2022」の講演動画が公開されている

2022 年 11 月に開催された「Kaggle Days Paris 2022」での有識者の講演動画が LogicAI の YouTube チャンネルで公開されています。 現時点で公開されている動画を土日に眺めたので、本記事で概要を紹介します。 Kaggle Days Paris 2022_Walter Reade_A quic…

【Polars版】『PythonではじめるKaggleスタートブック』のサンプルコード

『PythonではじめるKaggleスタートブック』で提供しているサンプルコードを、pandasからPolarsに書き換えた Notebook を作成しました。Polars は、Rustベースの高速なデータ処理ライブラリです。 www.kaggle.com pandas での書き方をコメントで残しているの…

「Weekly Kaggle News」配信プラットフォーム変更

以下の配信でお知らせした通り、Weekly Kaggle News は2023 年 1 月 6 日から「Substack」を用いて配信します。 Weekly Kaggle News は 2019 年 12 月から、メール配信プラットフォームの「Revue」を用いて、 Kaggle をはじめとするデータ分析コンペティショ…