使用生成器理解與列表理解從文件中讀取行

Question

以下代碼來自 Jake VanderPlas 的 Python 數據科學手冊的第 3 章。 文件中的每一行都是有效的 JSON。 雖然我認為文件的細節對於回答這個問題並不重要，但文件的 url 是https://github.com/fictivekin/openrecipes 。

# read the entire file into a Python array        
with open('recipeitems-latest.json', 'r') as f:            
    # Extract each line            
    data = (line.strip() for line in f)            
    # Reformat so each line is the element of a list            
    data_json = "[{0}]".format(','.join(data))        
# read the result as a JSON        
recipes = pd.read_json(data_json)

兩個問題：

為什么在代碼的第二行使用生成器推導而不是列表推導？ 由於所需的最終數據結構是一個列表，我想知道為什么不只使用列表而不是先使用生成器然后使用列表？
是否可以使用列表理解代替？

Answer 1

你在這里有兩個問題：

為什么發電機補償？ 因為你事先不知道JSON的尺寸。 所以最好是安全的，不要在 memory 中加載整個文件。
是的，可以使用列表理解。 只需將括號替換為方括號即可。

>>> f = open('things_which_i_should_know')
>>> data = (line.strip() for line in f)
>>> type(data)
<class 'generator'>
>>> data = [line.strip() for line in f]
>>> type(data)
<class 'list'>
>>>

請參閱官方文檔了解更多信息。

通過列表理解，您將返回 Python 列表； stripped_list 是包含結果行的列表，而不是迭代器。 生成器表達式返回一個迭代器，它根據需要計算值，而不需要一次實現所有值。 這意味着如果您正在使用返回無限 stream 或大量數據的迭代器，列表推導式就沒有用了。 在這些情況下，生成器表達式更可取。

使用生成器理解與列表理解從文件中讀取行

問題描述

1 個解決方案

解決方案1
0 已采納 2021-02-12 04:44:34

使用生成器理解與列表理解從文件中讀取行

問題描述

1 個解決方案

解決方案1 0 已采納 2021-02-12 04:44:34

解決方案1
0 已采納 2021-02-12 04:44:34