[英]In Python, how do I join two arrays by key column?
假設我有兩個數組(在導入numpy之后為np),
a=np.array([['a',1],['b',2]],dtype=object)
和
b=np.array([['b',3],['c',4]],dtype=object)
如何得到:
c=np.array([['a',1,None],['b',2,3],['c',None,4]],dtype=object)
基本上,使用第一列作為鍵的連接。
謝謝
這樣做的純Python方法就是
da = dict(a)
db = dict(b)
c = np.array([(k, da.get(k), db.get(k))
for k in set(da.iterkeys()).union(db.iterkeys())])
但是如果您使用的是NumPy,那么您的陣列可能很大,並且您正在尋找具有更好性能的解決方案。 在這種情況下,我建議使用一些真正的數據庫來執行此操作,例如Python附帶的sqlite3
模塊 。
我找到的最佳解決方案是使用pandas,它可以很好地處理連接,並且pandas對象可以輕松地轉換為numpy數組。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.