u++の備忘録

「AutoGluon-Tabular」を試してみる

AutoML「AutoGluon-Tabular」が、少なくとも私の観測範囲の中で局所的に話題になっています。

本記事では、この「AutoGluon-Tabular」を取りあえず恒例のTitanicで試してみました。なおコードの全体像はKaggleのNotebook*1にて公開しています。

インストール

公式ページ*2の指示に従います。

!pip install --upgrade mxnet
!pip install autogluon

学習・予測

あとはREADME*3の指示に従い、直接学習・予測が実行できます。TitanicのデータセットにはNameなど文字列型のカラムも存在している中で、前処理などもせずファイルパスを指定するだけです。

from autogluon import TabularPrediction as task


train_data = task.Dataset(file_path='../input/titanic/train.csv')
test_data = task.Dataset(file_path='../input/titanic/test.csv')
predictor = task.fit(train_data=train_data, label='Survived')
y_pred = predictor.predict(test_data)

Titanicでスコア議論するのは野暮ですが、0.77990とそこそこな値が出ています。

おわりに

本記事では、AutoML「AutoGluon-Tabular」を紹介しました。前処理不要でファイルパスを渡すだけで学習・予測が完了するのは非常に便利だなと感じました。