python – 从文件中随机抽样

python – 从文件中随机抽样

我有一个大约40gb和1800000行的csv文件. 我想随机抽样10,000行并将它们打印到一个新文件. 现在,我的方法是使用sed作为: (sed -n $vars input.txt) output.txt 其中$vars是随机生成的行列表. (例如:1p; 14p; 1700p; ……; 10203p) 虽然这有效,但每次执行大约