u++の備忘録

言語処理100本ノック 2020「10. 行数のカウント」

問題文

nlp100.github.io

問題の概要

第2章では、表形式のデータを扱います。筆者がKaggleなどで使い慣れているpandas*1を利用します。

pandasでデータを読み込み「len()」で行数を取得します。読み込み時にはファイル形式に応じて「sep='\t', header=None」などのオプションを指定しています。

import pandas as pd


df = pd.read_csv('ch02/popular-names.txt', sep='\t', header=None)
print(len(df))