將非數字元組轉換為numpy矩陣

Question

我試圖通過一個很大的元組列表來表示一個鄰接矩陣。 我將如何以numpy矩陣或scipy.sparse矩陣表示此列表，以便使用像igraph或networkx這樣的包？

[('b', 'c'),
 ('b', 'a'),
 ('c', 'd'),
 ('c', 'a'),
 ('c', 'b'),
 ('a', 'b'),
 ('a', 'c')]

如果這是重復的，我深表歉意，但是我找不到任何有關如何將非數字元組轉換為鄰接矩陣的文檔。

Answer 1

您可以使用np.unique將節點轉換為索引：

>>> adj = [('b', 'c'),
...        ('b', 'a'),
...        ('c', 'd'),
...        ('c', 'a'),
...        ('c', 'b'),
...        ('a', 'b'),
...        ('a', 'c')]
>>> node_names, adj_idx = np.unique(adj, return_inverse=True)
>>> node_names
array(['a', 'b', 'c', 'd'], 
      dtype='|S1')
>>> adj_idx = adj_idx.reshape(-1, 2)
>>> adj_idx
array([[1, 2],
       [1, 0],
       [2, 3],
       [2, 0],
       [2, 1],
       [0, 1],
       [0, 2]])

由此，您可以將密集鄰接矩陣構造為：

>>> adj_matrix = np.zeros((len(node_names),)*2)
>>> adj_matrix[adj_idx[:, 0], adj_idx[:, 1]] = 1
>>> adj_matrix
array([[ 0.,  1.,  1.,  0.],
       [ 1.,  0.,  1.,  0.],
       [ 1.,  1.,  0.,  1.],
       [ 0.,  0.,  0.,  0.]])

或稀疏格式為：

>>> sps_adj_mat = sps.coo_matrix((np.ones(shape=(len(adj_idx),)),
...                               (adj_idx[:, 0], adj_idx[:, 1])),
...                              shape=(len(node_names),)*2)
>>> sps_adj_mat
<4x4 sparse matrix of type '<type 'numpy.float64'>'
    with 7 stored elements in COOrdinate format>
>>> sps_adj_mat.A
array([[ 0.,  1.,  1.,  0.],
       [ 1.,  0.,  1.,  0.],
       [ 1.,  1.,  0.,  1.],
       [ 0.,  0.,  0.,  0.]])

Answer 2

NetworkX可以具有非數字節點。 如果我正確理解了您的問題，則可以像下面這樣輕松地在networkx圖形中使用它：

import networkx as nx
g = nx.Graph([('a', 'b'), ('c', 'd'), ...])

您是否在問如何將其轉換為scipy.sparse或numpy矩陣？ 還是您想將其與graph和networkx一起使用？

將非數字元組轉換為numpy矩陣

問題描述

2 個解決方案

解決方案1
4 2014-01-24 06:27:02

解決方案2
2 已采納 2014-01-24 05:16:17

將非數字元組轉換為numpy矩陣

問題描述

2 個解決方案

解決方案1 4 2014-01-24 06:27:02

解決方案2 2 已采納 2014-01-24 05:16:17

解決方案1
4 2014-01-24 06:27:02

解決方案2
2 已采納 2014-01-24 05:16:17