繁体   English   中英

Python 列表中的奇怪行为

[英]Weird Behaviour in a Python List

无法完全清理单词列表。 我已经竭尽全力使用以下内容去除特殊字符,但是当遇到以下形式的列表项时,后续循环会中断: "['" - 请参阅随附的屏幕截图。 我无法以某种方式剥离这个小精灵......感谢建议。 谢谢。

df.to_csv('bodies', encoding='utf-8')
uni = pd.read_csv('bodies', index_col = [0], encoding='utf-8')
uni.dropna(inplace = True)
uni = uni.replace({r'\'': ''}, regex=True)
uni = uni.replace({r'\"': ''}, regex=True)
uni = uni.replace({r'\[\'': ''}, regex=True)
uni = uni.replace({r'\(': ''}, regex=True)
uni = uni.replace({r'\)': ''}, regex=True)
uni = uni.replace({r'\}': ''}, regex=True)
uni = uni.replace({r'\{': ''}, regex=True)
uni = uni.replace({r'\}': ''}, regex=True)
uni = uni.replace({r'\]': ''}, regex=True)
uni = uni.replace({r'\[': ''}, regex=True)
uni = uni.replace({r'\>': ''}, regex=True)
uni = uni.replace({r'\<': ''}, regex=True)
uni = uni.replace({r'\,': ''}, regex=True)
uni = uni.replace({r'\.': ''}, regex=True)
uni = uni.replace({r'\t': ''}, regex=True)
uni = uni.replace({r'\•': ''}, regex=True)
uni = uni.replace({r'\+': ''}, regex=True)
uni = uni.replace({r'\-': ''}, regex=True)
uni = uni.replace({r'\*': ''}, regex=True)
uni = uni.replace({r'\\': ''}, regex=True)    
uni = uni.replace({r'\/': ''}, regex=True)
uni = uni.replace({r'\:': ''}, regex=True)
uni = uni.replace({r'\;': ''}, regex=True)
uni = uni.replace({r'\r\n': ''}, regex=True)
uni = uni.replace({r'\n': ''}, regex=True)

在此处输入图像描述

我建议使用三引号,如下所示:

uni = uni.replace('''"['"''', '')

Apols 的延误,病得很重。 无论如何,这是解决方案-似乎正则表达式不起作用,直接替换就可以了,这是解决此问题的行:

l = [w.replace("[", "") for w in l]

其中 l 是一元组列表

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM