如何在不删除空格的情况下删除 python 字符串中的特殊字符“^”

Question

我一直想知道如何删除 python 字符串中的特殊字符“^”，它似乎不像其他特殊字符那样计数。

实际上，我试图通过使用以下代码删除 dataframe 中的一些特殊字符：

def remove_special_characters(text, remove_digits=True):
    text=re.sub(r'[^a-zA-z0-9\s]+','',text)
    
    return text


df['review']=df['review'].apply(remove_special_characters)

但是符号'^'仍然出现在我的数据中，你知道一些代码来删除它吗？

Answer 1

您正在处理的用例已由 translate() 解决，无需求助于正则表达式等强大工具。

https://docs.python.org/3/library/stdtypes.html#str.maketrans

但是假设您真的想使用正则表达式。 这个单元测试工作正常。

    def test_battle(self):

        def remove(text):
            return non_alnum.sub("", text)

        non_alnum = re.compile(r"[^a-zA-Z0-9]")
        d = dict(word="Bat^tle", definition="Combat between opponents,")
        df = pd.DataFrame([d])
        self.assertEqual(["Bat^tle"], list(df.word))
        df["word"] = df.word.apply(remove)
        self.assertEqual(["Battle"], list(df.word))

根据您的用例的具体情况，此代码可能更可取：

        non_alnum = re.compile(r"[^\w]")  # We choose to ignore the "_" underscore detail.
        b = dict(word="Bat^tle", definition="Combat between opponents,")
        c = dict(word="Coup d'état", definition="Diplomacy through other means")
        df = pd.DataFrame([b, c])
        self.assertEqual(["Bat^tle", "Coup d'état"], list(df.word))
        df["word"] = df.word.apply(remove)
        self.assertEqual(['Battle', 'Coupdétat'], list(df.word))

如何在不删除空格的情况下删除 python 字符串中的特殊字符“^”

问题描述

1 个解决方案

解决方案1
1 2022-11-30 23:55:24

如何在不删除空格的情况下删除 python 字符串中的特殊字符“^”

问题描述

1 个解决方案

解决方案1 1 2022-11-30 23:55:24

解决方案1
1 2022-11-30 23:55:24