
python – PyTables读取随机子集
是否可以从HDF5中读取行的随机子集(通过pyTables,或者最好是pandas)?我有一个非常大的数据集,有数百万行,但只需要几千个样本进行分析.从压缩的HDF文件中读取怎么样? 使用HDFStore文档是 here,压缩文档是 here 0.13支持通过构造索引进行随机访问 In [26]: df

python字符串子集的所有组合
我需要字符串子集的所有组合.另外,长度为1的子集之后只能是长度 1的子集.例如对于字符串4824,结果应该是: [ [4, 824], [4, 82, 4], [48, 24], [482, 4], [4824] ] 到目前为止,我设法检索所有可能的子集: length = len(number) ss = [] for i in xrange(leng