如何將我的函數應用於DataFrame列？

Question

我定義了以下函數：

def clearString(myString):
    forbidden = r'/\:*?"<>|'
    for character in forbidden:
        if character in myString:
           myString = myString.replace(character,'')
    return myString

刪除文件名中不需要的字符。 我有一列中包含書名的數據框，並且試圖將函數應用於所有字符串，以清除它們，但是一直無法，我一直使用未修改的數據來恢復DataFrame。

我已經在單獨的列和整個DataFrame中嘗試了apply函數，但是都沒有產生積極的結果，因為它是將DataFrame自身分配回去，如下所示：

df = df.apply(clearString)
#Or even
df = clearString(df)

甚至定義一個新的：

df_new = df.apply(clearString)
#Or even
df_new = clearString(df)

我的函數可能有問題，例如未正確處理DataFrames或其他問題？

Answer 1

apply不起作用，因為默認情況下，它將給定的函數應用於每一列（而不是應用於每個元素）。 在給定的示例中， clearString將接收Series參數，而不是str 。

要將函數應用於DataFrame的所有元素，可以使用applymap方法（ docs ）。

例子：

# if you wanna replace the old dataframe
df = df.applymap(clearString)

# if you wanna keep the old dataframe
new_df = df.applymap(clearString)

Answer 2

您可以使用地圖，甚至可以應用和地圖組合。

Answer 3

如果要修改單個列，可以嘗試以下方法：

df = pd.DataFrame({"Title": ["one ", "two", "three", "four"]})
def clean(title):
    return title.upper()
df["Title"] = df["Title"].apply(lambda x: clean(x))
# OR 
df["Modified_Title"] = df["Title"].apply(lambda x: clean(x))
# OR 
df["Modified_Title1"] = df.apply(lambda x: clean(x["Title"]), axis=1)
# OR 
new_df = df.applymap(lambda x: clean(x))

如何將我的函數應用於DataFrame列？

問題描述

3 個解決方案

解決方案1
1 已采納 2019-04-29 03:34:15

解決方案2
0 2019-04-29 03:36:57

解決方案3
0 2019-04-29 03:46:56

如何將我的函數應用於DataFrame列？

問題描述

3 個解決方案

解決方案1 1 已采納 2019-04-29 03:34:15

解決方案2 0 2019-04-29 03:36:57

解決方案3 0 2019-04-29 03:46:56

解決方案1
1 已采納 2019-04-29 03:34:15

解決方案2
0 2019-04-29 03:36:57

解決方案3
0 2019-04-29 03:46:56