繁体   English   中英

如何用每个数据点作为新列创建一个新数据框?

[英]How to create a new data frame with each data point as a new column?

我正在尝试从网页上抓取表格。 该网页包含表中数据的链接。 基本上,我正在编写一个for循环,以从每个链接获取表并与另一个表连接。 为此,我需要将每个数据点转置为一列。

df= 2004 | 2006 | 2007 | 2008 ------------------------ GrowthRate 5% | 7% |-5% | 5% Earnings 234 | 449 | -300 | 448 EPS 17.6 |11.8 | 16.8 | 500 P\\E 14.08|12.04 |11.37 | 348

我想做到

df = GrowthRate_2004 GrowthRate_2006 GrowthRate_2007 GrowthRate_2008 Earnings_2004 Earnings_2006 Earnings_2007 Earnings_2008 EPS_2004 EPS_2006 EPS_2007 EPS_2008 P/E_2004 P/E_2006 P/E_2007 P/E_2008 5% 7% -5% 5% 234 449 -300 448 17.6 11.8 16.8 500 14.08 12.04 11.37 348

在此处输入图片说明 有没有简单的方法可以做到这一点?

答案的草图(对于python)将是:

  • 将数据读入pandas.DataFrame
  • 使用df.unstack()您将获得所需的表单

也许不是那么优雅的解决方案,但是可以工作:

df_ = pd.DataFrame(data = np.broadcast_to(df.columns.values.reshape(-1, 1).astype(str), df.shape), index = df.columns.values, columns = df.index.values)
df_ = pd.get_dummies(df_)
df_ = pd.DataFrame(data = df.values.flatten().reshape(1, -1), columns=df_.columns)
df_ = pd.DataFrame(data = np.broadcast_to(df.index.values.reshape(-1, 1), df.shape), columns = df.columns)

df是您要转换的数据帧。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM