pandas – 第 2 页 – 金华站长网

python – Pandas concat：ValueError：传递值的形状是blah,indices表示blah2

我正在尝试合并一个(熊猫14.1)数据帧和一系列数据.该系列应该与一些NAs(因为系列的索引值是数据帧的索引值的子集)形成一个新的列. 这适用于玩具示例,但不适用于我的数据(详见下文). 例： import pandas as pdimport numpy as npdf1 = pd.DataFrame(np.random.

Python 2020年12月15日

python – Pandas列重新格式化

有没有快速实现以下输出的方法？输入： Code Items123 eq-hk456 ca-eu; tp-lbe789 ca-us321 go-ch654 ca-au; go-au987 go-jp147 co-ml; go-ml258 ca-us369 ca-us; ca-my741 ca-us852 ca-eu963 ca-ml; co-ml; go-ml 输出： Co

Python 2020年12月15日

Pythonic计算pandas数据帧条纹的方法

给定df df = pd.DataFrame([[1, 5, 2, 8, 2], [2, 4, 4, 20, 2], [3, 3, 1, 20, 2], [4, 2, 2, 1, 3], [5, 1, 4, -5, -4], [1, 5, 2, 2, -20], [2, 4, 4, 3, -8], [3, 3, 1, -1, -1], [4, 2, 2, 0, 12]

Python 2020年12月15日

python – pandas链索引的替代方法是什么？

我正在上网学习 python,讲师告诉我们链式索引不是一个好主意.但是,他没有说出是适当的替代方案. 假设我有一个Pandas数据框,行的索引为[‘1′,’2′,’3’],列为[‘a’,’b’,’c’]. 使用命令df [‘1’] [‘a’]提取第一行和第一列中找到的值的适当替代方法是

Python 2020年12月4日

python – 大型Pandas Dataframe并行处理

我正在访问一个非常大的Pandas数据帧作为全局变量.通过 joblib并行访问此变量. 例如. df = db.query(select id, a_lot_of_data from table)def process(id): temp_df = df.loc[id] temp_df.apply(another_function)Parallel(n_jobs=8)

Python 2020年12月4日

python – 使用pandas返回hdf文件中所有数据集的列表

这可能是一个愚蠢的问题,但我还没有在熊猫文档或其他地方找到答案.在 here之前已经提出了同样的问题.但唯一的答案是看看大熊猫文档,正如我所说的那样,没有提供这个问题的答案. 我希望能够构建一个包含多个数据集的hdf文件.一旦关闭了这个hdf,我希望能够列出其

Python 2020年11月18日

python – Pandas Dataframe查找所有列等于的行

我有一个包含字符的数据帧 – 我想要一个布尔结果的行,告诉我该行的所有列是否具有相同的值. 例如,我有 df = [ a b c d0 C C C C 1 C C A A2 A A A A ] 我想要的结果是 0 True1 False2 True 我已经尝试了,但似乎

Python 2020年11月18日

python – pandas数据框 – 选择行和清除内存？

我有一个大型的pandas数据帧(大小= 3 GB)： x = read.table(‘big_table.txt’, sep=’t’, header=0, index_col=0) 因为我在内存限制下工作,所以我对数据帧进行了子集化： rows = calculate_rows() # a function that calculates what rows I need cols = ca

Python 2020年11月18日

python – 如何在没有带有pandas的“未命名”行的情况下读取csv文件？

参见英文答案 Pandas: how to get rid of `Unnamed:` column in a dataframe2个我正在写一个.csv文件： my_data_frame.to_cav(some_path) 尝试使用以下内容读取文件时： pd.read_csv(some_path) 我可以说,添

Python 2020年11月18日

python-2.7 – Pandas：基于空行拆分数据框

我有以下数据框架. id A B C 1 34353 917998 x 2 34973 980340 x 3 87365 498097 x 4 98309 486547 x 5 87699

Python 2020年11月18日

标签： pandas