簡體 English 中英

Python / Jupyter Notebook：將一個包含多組數據的文本文件解析為 pandas dataframe

[英]Python / Jupyter Notebook: Parsing one text file with multiple sets of data into a pandas dataframe

原文 2021-06-12 00:29:27 3 1 python/ pandas/ import

我是一個相當新的 Python 用戶，並且一直在使用 pandas 和 matplotlib 為我的研究做一些數據分析。 特別是，我有一個包含 3 組數據的數據文件：2 個列向量和一個數組（請參閱此處的鏈接到谷歌驅動器以獲取相同格式的簡單 3x3 示例：示例數據。最后，我需要 plot 這個作為二維熱圖，列向量指定 x 和 y 軸，數組填充我的熱點。

我可以使用 pandas.read_csv() 和 skiprows 來為一個文件執行此操作，但是每個向量和數組的維度在我運行的所有模擬中都不同。 因此，我必須為每個不同的文件找到每組數據的開始和結束。 我擁有的最大文件是 (229, 1), (229, 1), (229, 229)。

我的問題是：有沒有辦法根據我的 output 文件具有的格式化方法來指定每組數據的開始和結束？ 這可以在 pandas dataframe 或 arrays 中完成。 我更喜歡數據框，只是為了便於在繪圖之前執行計算。

任何幫助將非常感激！

1 個解決方案

有很多方法可以做到這一點，我認為這都是關於數據預處理或清理的。

這里有一些提示：

您在 1 個文件中的 3 個數據集由 '\n\n' （兩個連續的 \n）拆分，您可以open()它，然后.read()所有內容，然后.split('\n\n')首先.
對於每個拆分數據集，第一行並不重要（或者只是有一些名稱或（行，列）信息），如果他們有一些排序規則，你可以簡單地跳過它（也許.split('\n')[1:] )。
對於每個拆分數據集，其他行是數據內容，您可以將其傳遞給pd._read_csv或類似的東西。

希望這些提示可以幫助你。

Jupyter Notebook：無效的文件路徑或緩沖區 object 類型：<class 'pandas.core.frame.dataframe'> Python</class>

[英]Jupyter Notebook: Invalid file path or buffer object type: <class 'pandas.core.frame.DataFrame'> Python

InstagramAPI-如何將JSON Python數據解析為Pandas DataFrame（iPython，Jupyter Notebook）

[英]InstagramAPI - How to Parse JSON Python Data into Pandas DataFrame (iPython, Jupyter Notebook)

Jupyter Notebook中的Pandas DataFrame顯示

[英]Pandas DataFrame Display in Jupyter Notebook

在 Jupyter Notebook 上的 Pandas Dataframe 中顯示多個空格的方法

[英]Way to show multiple spaces in Pandas Dataframe on Jupyter Notebook

使用Python將Pandas Dataframe插入SQL Server-Jupyter Notebook

[英]INSERT Pandas Dataframe to SQL-Server using Python - Jupyter Notebook

有沒有辦法在python3 jupyter筆記本中取消嵌套熊貓數據框？

[英]Is there a way to un-nesting a pandas dataframe in a python3 jupyter notebook?

復制 Jupyter Notebook Pandas 數據幀 HTML 打印輸出

[英]Replicating Jupyter Notebook Pandas dataframe HTML printout

Pandas 數據框樣式不適用於 Jupyter Notebook

[英]Pandas Dataframe Styles are not working with Jupyter Notebook

Pandas Dataframe 顯示缺失的網格線（Jupyter Notebook）

[英]Pandas Dataframe Display missing gridlines (Jupyter Notebook)

在 jupyter notebook 中顯示 pandas dataframe 字體較大

[英]Display pandas dataframe with larger font in jupyter notebook

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 Jupyter Notebook：無效的文件路徑或緩沖區 object 類型：<class 'pandas.core.frame.dataframe'> Python</class> InstagramAPI-如何將JSON Python數據解析為Pandas DataFrame（iPython，Jupyter Notebook） Jupyter Notebook中的Pandas DataFrame顯示在 Jupyter Notebook 上的 Pandas Dataframe 中顯示多個空格的方法使用Python將Pandas Dataframe插入SQL Server-Jupyter Notebook 有沒有辦法在python3 jupyter筆記本中取消嵌套熊貓數據框？復制 Jupyter Notebook Pandas 數據幀 HTML 打印輸出 Pandas 數據框樣式不適用於 Jupyter Notebook Pandas Dataframe 顯示缺失的網格線（Jupyter Notebook）在 jupyter notebook 中顯示 pandas dataframe 字體較大

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM