[英]Weird Behaviour in a Python List
无法完全清理单词列表。 我已经竭尽全力使用以下内容去除特殊字符,但是当遇到以下形式的列表项时,后续循环会中断: "['"
- 请参阅随附的屏幕截图。 我无法以某种方式剥离这个小精灵......感谢建议。 谢谢。
df.to_csv('bodies', encoding='utf-8')
uni = pd.read_csv('bodies', index_col = [0], encoding='utf-8')
uni.dropna(inplace = True)
uni = uni.replace({r'\'': ''}, regex=True)
uni = uni.replace({r'\"': ''}, regex=True)
uni = uni.replace({r'\[\'': ''}, regex=True)
uni = uni.replace({r'\(': ''}, regex=True)
uni = uni.replace({r'\)': ''}, regex=True)
uni = uni.replace({r'\}': ''}, regex=True)
uni = uni.replace({r'\{': ''}, regex=True)
uni = uni.replace({r'\}': ''}, regex=True)
uni = uni.replace({r'\]': ''}, regex=True)
uni = uni.replace({r'\[': ''}, regex=True)
uni = uni.replace({r'\>': ''}, regex=True)
uni = uni.replace({r'\<': ''}, regex=True)
uni = uni.replace({r'\,': ''}, regex=True)
uni = uni.replace({r'\.': ''}, regex=True)
uni = uni.replace({r'\t': ''}, regex=True)
uni = uni.replace({r'\•': ''}, regex=True)
uni = uni.replace({r'\+': ''}, regex=True)
uni = uni.replace({r'\-': ''}, regex=True)
uni = uni.replace({r'\*': ''}, regex=True)
uni = uni.replace({r'\\': ''}, regex=True)
uni = uni.replace({r'\/': ''}, regex=True)
uni = uni.replace({r'\:': ''}, regex=True)
uni = uni.replace({r'\;': ''}, regex=True)
uni = uni.replace({r'\r\n': ''}, regex=True)
uni = uni.replace({r'\n': ''}, regex=True)
我建议使用三引号,如下所示:
uni = uni.replace('''"['"''', '')
Apols 的延误,病得很重。 无论如何,这是解决方案-似乎正则表达式不起作用,直接替换就可以了,这是解决此问题的行:
l = [w.replace("[", "") for w in l]
其中 l 是一元组列表
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.