[英]Data Cleaning using Python
我有一个非统一数据集,我想消除以 $ 符号开头的单词,并代替已删除的单词,我想在删除的单词后保留下一个单词。 如何处理这个问题。
DAY1 苹果香蕉土豆$aarb 葡萄菠萝
DAY2 苹果 香蕉 $aarb 土豆 葡萄 菠萝
第3天苹果香蕉$aarb土豆葡萄
例如:如果我从第一行中删除 $aarb,下一个单词 GRAPES 必须代替 $aarb,PINEAPPLE 必须代替 GRAPES。
请任何人帮助我。 提前致谢。
import csv
import re
with open('test.csv') as csvfile:
readCSV = csv.reader(csvfile,delimiter=',')
for row in readCSV:
r = re.compile('[^$]')
newlist = list(filter(r.match,row))
print(newlist)
随意替换任何您想用print(newlist)
做的事情,您可以写入文件或将其输出到其他地方。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.