u++の備忘録

言語処理100本ノック 2020「53. 予測」

問題文

nlp100.github.io

問題の概要

学習を終えたモデルは、予測値が未知の特徴量(X_test)を与えて予測させることができます。

import pandas as pd
from sklearn.linear_model import LogisticRegression


X_train = pd.read_table('ch06/train.feature.txt', header=None)
y_train = pd.read_table('ch06/train.txt', header=None)[1]

clf = LogisticRegression(penalty='l2', solver='sag', random_state=0)
clf.fit(X_train, y_train)
y_train = clf.predict(X_train)