u++の備忘録

【書籍メモ】『データのつながりを活かす技術〜ネットワーク/グラフデータの機械学習から得られる新視点』(技術評論社)

『データのつながりを活かす技術〜ネットワーク/グラフデータの機械学習から得られる新視点』(技術評論社)を、著者の一人である黒木裕鷹さんのご厚意でご恵贈いただきました。本記事では、概要と感想を綴ります。

gihyo.jp

書籍概要

ネットワーク/グラフデータの機械学習を題材とした書籍です。ノード(点)とエッジ(線)の繋がりから構成されるネットワーク/グラフについて、性質や特徴を測る方法、構造を考慮した機械学習の手法などを紹介しています。各手法の概要の解説に加え、Python によるコード例が掲載されています。著者は、Sansan 株式会社に所属する 2 名です。

感想

Sansan 株式会社 x 機械学習と言えば、個人的には 2020 年に開催された「Sansan × atmaCup #6」が思い起こされます(開催報告記事)。このコンペでは、企業間の名刺交換というネットワーク構造を対象に機械学習モデルを構築しました。

本書は、このコンペに参加する際に読みたかった書籍です。ネットワーク構造を含むデータをどのような観点で分析するか、どのような機械学習モデルに投入するかの概論を平易な文章で学べます。論文では割愛されがちな基礎的な分析の流れや流用可能な Python のコードが提供されているのも有用です。

ネットワーク構造を含むデータは、その構造を無視して独立で分析することも可能です。時に、意図せず構造を無視して分析してしまうこともあるかもしれません。本書を通じてネットワーク構造ならではの利点や扱い方を頭の片隅の留めておくことで、データに潜在する特徴を踏まえた分析が実現できるように感じました。