如果熊貓數據框列中存在列表值列表，請用另一個熊貓列中的值替換它們

Question

我有一個列表列表，其中包含以下類型的單詞tockens：

[['java_developer'],
['ETL', 'database_administrator'],
...
['web-developer', 'c#', 'ms_sql']]

我也有一個鍵值熊貓數據框，其中第一列鍵和第二列是值。 例如：

     Key                      Value
0    java_developer           java
1    web-developer            web
2    database_administrator   database
3    ETL                      ETL
4    ms_sql                   database
... ... ...
100  c#                       c#

我想收到以下類型的列表：

[['java'],
['ETL', 'database'],
...
['web', 'c#', 'database']]

如何實施？

Answer 1

使用get為DataFrame缺失值添加一些值，例如None ：

#added val to last sublist for better sample
L = [['java_developer'],
['ETL', 'database_administrator'],
['web-developer', 'c#', 'ms_sql', 'val']]

#create dictionary from DataFrame
d = df.set_index('Key')['Value'].to_dict()
print (d)
{'java_developer': 'java', 'web-developer': 'web', 
 'database_administrator': 'database', 'ETL': 'ETL', 
 'ms_sql': 'database', 'c#': 'c#'}

#in nested list comprehension repalce by dict
L1 = [[d.get(y, None) for y in x] for x in L]
print (L1)
[['java'], ['ETL', 'database'], ['web', 'c#', 'database', None]]

或刪除不匹配的值添加過濾：

L1 = [[d.get(y) for y in x if y in d] for x in L]
print (L1)
[['java'], ['ETL', 'database'], ['web', 'c#', 'database']]

如果字典中不存在相同的值：

L1 = [[d.get(y, y) for y in x] for x in L]
print (L1)
[['java'], ['ETL', 'database'], ['web', 'c#', 'database', 'val']]

如果熊貓數據框列中存在列表值列表，請用另一個熊貓列中的值替換它們

問題描述

1 個解決方案

解決方案1
3 已采納 2018-08-17 05:20:35

如果熊貓數據框列中存在列表值列表，請用另一個熊貓列中的值替換它們

問題描述

1 個解決方案

解決方案1 3 已采納 2018-08-17 05:20:35

解決方案1
3 已采納 2018-08-17 05:20:35