
python – PyTables批量获取和更新
我有每日库存数据作为使用PyTables创建的HDF5文件.我想获得一组行,将其作为一个数组处理,然后使用PyTables将其写回磁盘(更新行).我无法想办法干净利落地做到这一点.能不能让我知道最好的方法是什么? 我的数据: Symbol, date, price, var1, var2abcd, 1, 2.5

python – PyTables读取随机子集
是否可以从HDF5中读取行的随机子集(通过pyTables,或者最好是pandas)?我有一个非常大的数据集,有数百万行,但只需要几千个样本进行分析.从压缩的HDF文件中读取怎么样? 使用HDFStore文档是 here,压缩文档是 here 0.13支持通过构造索引进行随机访问 In [26]: df