繁体   English   中英

Python整理DataFrame中的列以进行OLS回归

[英]Python sort out columns in DataFrame for OLS regression

我有一个包含以下各列的csv文件:

日期| MKT-RF | SMB | HML | RF | C | AIG-RF |福特RF | IBM-RF | XOM-RF |

我试图在python中运行多个OLS回归,例如在“ aig-RF”上回归“ Mkt-RF”,“ SMB”和“ HML”。

似乎我需要首先从数组中筛选出DataFrame,但我似乎无法理解如何:

  

完整的代码是:

  

  

  

  

为了获得多个OLS回归表,我到底需要在pd.DataFrame中进行哪些修改?

我建议将代码的第一部分更改为以下内容(主要是交换订单):

# add constant column to the original dataframe
df['constant'] = 1

# define x as a subset of original dataframe
x = df[['Mkt-RF', 'SMB', 'HML', 'constant']]

# define y as a series
y = df['aig-RF']

# pass x as a dataframe, while pass y as a series
sm.OLS(y, x).fit().summary()

希望这可以帮助。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM