[英]Why doesn't a quartic linear regression in statsmodels' OLS match LibreOffice Calc?
[英]Why does Statsmodels OLS doesn't support reading in columns with multiple words?
我一直在尝试使用Seaborn的lmplot()和Statsmodels .ols()函数来处理简单的线性回归图及其相关的p值,r平方等。
我注意到当我指定要用于lmplot的列时,我可以指定一个列,即使它有多个单词:
import seaborn as sns
import pandas as pd
input_csv = pd.read_csv('./test.csv',index_col = 0,header = 0)
input_csv
sns.lmplot(x='Age',y='Count of Specific Strands',data = input_csv)
<seaborn.axisgrid.FacetGrid at 0x2800985b710>
但是,如果我尝试使用ols,我输入“特定链的数量”作为我的因变量时输入错误(我只列出了错误中的最后几行):
import statsmodels.formula.api as smf
test_results = smf.ols('Count of Specific Strands ~ Age',data = input_csv).fit()
File "<unknown>", line 1
Count of Specific Strands
^
SyntaxError: invalid syntax
相反,如果我指定如下所示的“特定链的计数”,则回归起作用:
test_results = smf.ols('input_csv.iloc[:,1] ~ Age',data = input_csv).fit()
test_results.summary()
有人知道为什么吗? 是不是因为Statsmodels是如何写的? 是否有替代方法可以为不涉及iloc或loc的回归分析指定因变量?
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.