[英]ValueError: Found input variables with inconsistent numbers of samples: [15996, 8]
我已经使用熊猫加载了数据集并打印了前5行
df = pd.read_csv(r'filename')print(df.shape)
print(df.shape)
打印出数据集中的行数和列数
(15997,8)
print(df.head(5))
然后,如果我拆分数据集
X = df.iloc[1:].values
y = df.iloc[0].values
from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.4,random_state=42, stratify=y)
我得到这个错误
ValueError:找到样本数量不一致的输入变量:[15996,8]
我需要X值从数据集中排除第一行,而y值仅包括第一行
对于df.iloc,第一个索引用作键,因此您正在按行拆分。 第二个索引用于列。 尝试这个:-
X = data.iloc[:,1:]
Y = data.iloc[:,0]
尝试。
X = data.iloc[:,1:]
y = data.iloc[:,0]
由于您的数据框具有两个维度,因此您必须在两个维度上进行切片才能创建子帧。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.