u++の備忘録

言語処理100本ノック 2020「03. 円周率」

自然言語処理 python

問題文

nlp100.github.io

問題の概要

①文を単語に分割する②各単語の文字数を数えるーーの2段階で処理します。

①の処理には、文字列を特定の区切り文字で分割する「split()」が利用できます。引数に何も指定しない場合は、半角スペースで分割します。

半角コンマと半角ピリオドは今回の処理に不要なので「replace('置換前', '置換後')」で削除しておきます。

各単語の文字数は「len(文字列)」で数えられます。

raw_text = 'Now I need a drink, alcoholic of course, after the heavy lectures involving quantum mechanics.'
text = raw_text.replace('.', '').replace(',', '')
ans = [len(w) for w in text.split()]
print(ans)