u++の備忘録

2017-10-24から1日間の記事一覧

python-mecab+sklearnを用いて、文章を分かち書きしてTF-IDFでベクトル化する

#!/usr/bin/env python3 # -*- coding: utf-8 -*- import MeCab from sklearn.feature_extraction.text import TfidfVectorizer # Initial settings vectorizer = TfidfVectorizer(use_idf=True, token_pattern=u'(?u)\\b\\w+\\b') # Global variables docs …

Macにpython-mecab導入(2017年10月)

自分用メモWindows版はこちら Windowsにpython-mecab導入(2017年11月) - u++の備忘録 端末 macOS Sierra, version 10.12.6 Python環境 Python 3.6.2 | Anaconda ※下記サイトに沿って構築 qiita.com python-mecab導入 mecab本体のインストール brew install m…