[英]Multiple splits in pandas string
name reviews_list
Jalsa [('Rated 4.0', 'RATED\n A beautiful place to ...
Spice Elephant [('Rated 4.0', 'RATED\n Had been here for din...
San Churro Cafe [('Rated 3.0', "RATED\n Ambience is not that ...
上面是我的数据reviews_list
的head()
,有 2 个特征name
和reviews_list
。 我想将功能reviews_list
分成两个功能:
从您的示例中,您的reviews_list
列中似乎有一个 CSV。 因此,假设您已将数据读入名为frame
的 DataFrame 中,类似的东西应该可以工作:
import csv
RATED_INDEX, TEXT_INDEX = 0, 1
reader = csv.reader(frame.reviews_list.values)
next(reader)
good_list = [[float(r[RATED_INDEX].split(' ')[1]), '\n'.join(r[TEXT_INDEX].split('\n')[1:])] for r in reader]
它适用于您所展示的内容。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.