繁体   English   中英

如何使用旧数据框中的信息预测新Python数据框中的列值

[英]How to predict values of column in new Python data frame using info from the old data frame

假设我有两个数据帧df1和df2。 在df1中,我有几个列,例如userid,sexid,location等。在df2中,我有与df1中相同的列,除了sexid,我需要使用一些预测算法来填充。 我只是一个初学者,我尝试了另一种问题。 因此,欢迎任何可能帮助我破解它的建议或有用的参考资料。

一个最小的例子:

import pandas as pd
from sklearn.linear_model import LogisticRegression

df1 = pd.DataFrame({'sexid': list('MMFFMFFMMF'), 'x1': [0, 12, 2, 3, 4, 2, 0, 12, 12, 12], 'x2': [0, 1, 1, 1, 0, 1, 1, 0, 0, 1]})

df2 = pd.DataFrame({'x1': [0, 12, 2, 3, 4, 2, 0, 12, 12, 12], 'x2': [0, 1, 1, 1, 0, 1, 1, 0, 0, 1]})

X = df1[['x1', 'x2']]
y = df1['sexid']

model = LogisticRegression()

model.fit(X, y)

model.predict(df2)

哪个回报:

array(['F', 'M', 'F', 'F', 'M', 'F', 'F', 'M', 'M', 'M'], dtype=object)

我强烈建议你读这个

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM