u++の備忘録

言語処理100本ノック 2020「52. 学習」

問題文

nlp100.github.io

問題の概要

用意した特徴量と予測の対象のペアから、機械学習アルゴリズムを用いて予測器を学習させましょう。

f:id:upura:20200726000350p:plain

import pandas as pd
import joblib
from sklearn.linear_model import LogisticRegression


X_train = pd.read_table('ch06/train.feature.txt', header=None)
y_train = pd.read_table('ch06/train.txt', header=None)[1]

clf = LogisticRegression(penalty='l2', solver='sag', random_state=0)
clf.fit(X_train, y_train)
joblib.dump(clf, 'ch06/model.joblib')