簡體   English   中英

Python中的嵌套列表理解

[英]Nested list comprehension in Python

我有一個列表理解我正試圖讓我的頭腦,我似乎無法得到我想要的東西,並認為我會看到其他人是否知道如何!

我的基本數據結構如下:

structure = [[np.array([[1,2,3],[4,5,6]]), np.array([[7,8,9],[10,11,12]])], [np.array([[13,14,15],[16,17,18]]), np.array([[19,20,21],[22,23,24]])]]

所以我有一個包含numpy數組子列表的整體列表,我想要的輸出是某種分組(不管它是列表還是數組),並且配對了以下元素:

[1, 13]
[4, 16]
[2, 14]
[5, 17]
[3, 15]
[6, 18]

我以為我會用以下樣式構造得到它:

output = [structure[i][0][j] for j in range(9) for i in range(len(structure))]但是,沒有快樂。

我不介意它是否需要不止一個階段 - 只是想將這些元素組合在一起!

(作為一些背景 - 我有各種模型輸出的概率列表,在這些模型中我有一個訓練列表和一個驗證列表:

[[model_1], [model_2], ..., [model_n]]

其中[model_1][[training_set], [validation_set], [test_set]]

[training_set]np.array([p_1, p_2, ..., p_n],[p_1, p_2, ..., p_n],...])

我想將每個模型的項目1的預測組合在一起,並創建一個長度等於我得到的模型數量的訓練向量。 然后我想做同樣的事情,但是對於[training_set]的第二行。

如果這沒有意義,請告訴我!

由於structure中的所有數組(和子列表)大小相同,因此您可以將其轉換為一個更高維的數組:

In [189]: A=np.array(structure)
Out[189]: 
array([[[[ 1,  2,  3],
         [ 4,  5,  6]],

        [[ 7,  8,  9],
         [10, 11, 12]]],


       [[[13, 14, 15],
         [16, 17, 18]],

        [[19, 20, 21],
         [22, 23, 24]]]])

In [190]: A.shape
Out[190]: (2, 2, 2, 3)

重塑和交換方式可以為您提供各種組合。

例如,可以使用以下選項選擇樣本子列表中的值:

In [194]: A[:,0,:,:]
Out[194]: 
array([[[ 1,  2,  3],
        [ 4,  5,  6]],

       [[13, 14, 15],
        [16, 17, 18]]])

並重塑得到

In [197]: A[:,0,:,:].reshape(2,6)
Out[197]: 
array([[ 1,  2,  3,  4,  5,  6],
       [13, 14, 15, 16, 17, 18]])

並轉置以獲得6對對:

In [198]: A[:,0,:,:].reshape(2,6).T
Out[198]: 
array([[ 1, 13],
       [ 2, 14],
       [ 3, 15],
       [ 4, 16],
       [ 5, 17],
       [ 6, 18]])

為了讓他們進入1,4,2,5..順序,我可以先轉換

In [208]: A[:,0,:,:].T.reshape(6,2)
Out[208]: 
array([[ 1, 13],
       [ 4, 16],
       [ 2, 14],
       [ 5, 17],
       [ 3, 15],
       [ 6, 18]])

不確定你想要的完整輸出,但這可能會有所幫助:

imort numpy as np

structure = [[np.array([[1, 2, 3], [4, 5, 6]]), np.array([[7, 8, 9], [10, 11, 12]])],
             [np.array([[13, 14, 15], [16, 17, 18]]), np.array([[19, 20, 21], [22, 23, 24]])]]

from itertools import chain

zipped = (zip(*ele) for ele in zip(*next(zip(*structure))))

print (list(chain.from_iterable(zip(*zipped))))
[(1, 13), (4, 16), (2, 14), (5, 17), (3, 15), (6, 18)]

好了巫術的崩潰:

# transpose sub arrays so column 0 is the first two sub elements from 
# each sub array
In [4]: start = zip(*structure)

In [5]: start
Out[5]: 
[(array([[1, 2, 3],
         [4, 5, 6]]), array([[13, 14, 15],
         [16, 17, 18]])), (array([[ 7,  8,  9],
         [10, 11, 12]]), array([[19, 20, 21],
         [22, 23, 24]]))]

# our interesting sub array's i.e colunm[0]
In [6]: first_col = next(start)

In [7]: first_col
Out[7]: 
(array([[1, 2, 3],
        [4, 5, 6]]), array([[13, 14, 15],
        [16, 17, 18]]))

# pair up corresponding sub array's
In [8]: intersting_pairs = zip(*first_col)

In [9]: intersting_pairs
Out[9]: 
[(array([1, 2, 3]), array([13, 14, 15])),
 (array([4, 5, 6]), array([16, 17, 18]))]

# pair them up (1, 13), (2, 14) ...
In [10]: create_final_pairings = [zip(*ele) for ele in intersting_pairs]

In [11]: create_final_pairings
Out[11]: [[(1, 13), (2, 14), (3, 15)], [(4, 16), (5, 17), (6, 18)]]

最后將all鏈接到一個單獨的平面列表中並獲得正確的順序:

In [13]: from itertools import chain
# create flat list 
In [14]: flat_list = list(chain.from_iterable(zip(*create_final_pairings))

In [15]: flat_list
Out[15]: [(1, 13), (4, 16), (2, 14), (5, 17), (3, 15), (6, 18)]

使用zip轉置的簡單示例可能會有所幫助:

In [17]: l = [[1,2,3],[4,5,6]]

In [18]: zip(*l)
Out[18]: [(1, 4), (2, 5), (3, 6)]

In [19]: zip(*l)[0]
Out[19]: (1, 4)

In [20]: zip(*l)[1]
Out[20]: (2, 5)

In [21]: zip(*l)[2]
Out[21]: (3, 6)

對於python2,您可以使用itertools.izip

from itertools import chain, izip


zipped = (izip(*ele) for ele in izip(*next(izip(*structure))))
print (list(chain.from_iterable(izip(*zipped))))

[(1, 13), (4, 16), (2, 14), (5, 17), (3, 15), (6, 18)]

我必須首先編寫非列表理解版本來解決這個問題:

new_training_vector = []
for m1, m2 in zip(structure[0], structure[1]):
    for t1, t2 in zip(m1, m2):
        for d1, d2 in zip(t1, t2):
            new_training_vector.append([d1, d2])

它的工作方式是創建兩個並行迭代器(使用zip ),每個模型一個,然后為每個訓練集創建兩個並行迭代器,依此類推,直到我們得到實際數據並且可以將它們粘在一起。

一旦我們擁有了它,就不難將其折疊成列表理解:

new_training_vector = [[d1, d2]
                       for m1, m2 in zip(structure[0], structure[1])
                       for t1, t2 in zip(m1, m2)
                       for d1, d2 in zip(t1, t2)]

您也可以使用字典執行此操作,如果由於某種原因更好。 你會丟失訂單:

import collections
d = collections.defaultdict(list)
for model in structure:
    for i, training_set in enumerate(model):
        for j, row in enumerate(training_set):
            for k, point in enumerate(row):
                d[(i, j, k)].append(point)

這個的訣竅是我們只是跟蹤我們看到每個點的位置(模型級別除外),因此它們會自動進入同一個dict項目。

我認為這就是你想要的格式,它使用生成器:

 import numpy as np structure = [[np.array([[1,2,3],[4,5,6]]), np.array([[7,8,9],[10,11,12]])], [np.array([[13,14,15],[16,17,18]]), np.array([[19,20,21],[22,23,24]])]] struc = structure my_gen = ([struc[i][j][k][l], struc[i+1][j][k][l]] for i in range(len(struc)-1) for j in range(len(struc[i])) for k in range(len(struc[i][j])) for l in range(len(struc[i][j][k]))) try: val = my_gen.next() while val != None: print val val = my_gen.next() except: pass 

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM