[英]Converting a numpy ndarray to 1 dataframe column
我有一个文本特征,我使用 tfidf Vectorizer 将其转换为数字。 complaint
文本栏转换如下
tfidf = TfidfVectorizer(sublinear_tf=True, min_df=5,ngram_range=(1, 2), stop_words='english')
complain_features = tfidf.fit_transform(df.complaint.values.astype('str')).toarray()
complain_features
是一个二维 numpy 数组。 我使用下面的方法将其转换为数据框
complain_df = pd.DataFrame(complain_features, index=range(complain_features.shape[0]),
columns=range(complain_features.shape[1]))
正如您在下面的附图中看到的那样。 complain_df
是 39 列 df 但我需要它是 1 列。 我怎么做? 请建议。
尝试:
complain_df['Column1'] =complain_df[complain_df.columns[1:]].apply(
lambda x: ','.join(x.dropna().astype(str)),
axis=1
)
complain_df
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.