u++の備忘録

「言語処理100本ノック 2020」をPythonで解く

「言語処理100本ノック 2020」が4月6日に公開されました。2015年以来、5年ぶりの改訂です。昨今の自然言語処理の研究動向を鑑み、深層ニューラルネットワークに関する問題追加などの変更があります。

nlp100.github.io

実装のためのプログラミング言語としては、Python3系を利用します。バージョンは初公開時は3.6.8で、2023年11月に3.11.3に更新しました。ソースコードは、GitHubで公開しています。

github.com

第1章: 準備運動

第2章: UNIXコマンド

第3章: 正規表現

第4章: 形態素解析

第5章: 係り受け解析

第6章: 機械学習

第7章: 単語ベクトル

第8章: ニューラルネット

第9章: RNN, CNN

第10章: 機械翻訳

OpenNMT-py での実装