簡體   English   中英

有沒有辦法在數據框列中混淆或掩蓋值?

[英]Is there a way to Obfuscate or Mask values in a Data Frame column?

我正在嘗試屏蔽DataFrame列中的所有IP。 我有一個包含IP地址的列的DataFrame。 出於隱私和安全原因,當DataFrame顯示為表格或使用Plotly繪制時,我需要隱藏\\掩蓋前兩個八位字節。 你認為哪種方法最好? 我能想到的唯一方法是創建一個額外的列並使用apply函數將IP處理為XX1.1格式。

你的approch似乎沒有錯。 您還可以復制數據集並加密副本(如果要保存新數據集)。

或者,如果您只想保留隱私,則可以使用匿名技術。 當你想要保密時,它會幫助你做更大的項目,這里有一些鏈接

https://en.wikipedia.org/wiki/Data_anonymization https://iapp.org/resources/article/guide-to-basic-data-anonymization-techniques/

import pandas as pd
from pandas.compat import StringIO

print(pd.__version__)

csvdata = StringIO("""IP
192.168.1.10
192.168.1.11
192.168.1.12
192.168.1.13""")

df = pd.read_csv(csvdata)
df['IP'] = df['IP'].apply(lambda x: "X.X."+".".join(x.split('.')[2:4]))
print(df)

會生產

0.24.2
         IP
0  X.X.1.10
1  X.X.1.11
2  X.X.1.12
3  X.X.1.13

並且可能是在DataFrame “編輯”數據的最佳方式

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM