繁体   English   中英

熊猫字符串中的多个拆分

[英]Multiple splits in pandas string

将 review_list 功能拆分为两个功能

name            reviews_list
Jalsa           [('Rated 4.0', 'RATED\n A beautiful place to ...
Spice Elephant  [('Rated 4.0', 'RATED\n Had been here for din...
San Churro Cafe [('Rated 3.0', "RATED\n Ambience is not that ...

上面是我的数据reviews_listhead() ,有 2 个特征namereviews_list 我想将功能reviews_list分成两个功能:

  1. 只有评分 (4.0, 3.0)
  2. 只有来自客户的评论,即(一个美丽的地方......,曾经在这里吃饭......,氛围不是......)
  3. 删除 : [('评级 , '评级\\n

从您的示例中,您的reviews_list列中似乎有一个 CSV。 因此,假设您已将数据读入名为frame的 DataFrame 中,类似的东西应该可以工作:

import csv
RATED_INDEX, TEXT_INDEX = 0, 1

reader = csv.reader(frame.reviews_list.values) 
next(reader)
good_list = [[float(r[RATED_INDEX].split(' ')[1]), '\n'.join(r[TEXT_INDEX].split('\n')[1:])] for r in reader]

它适用于您所展示的内容。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM