簡體   English   中英

如何從位於指定文件夾中的一個文件(具有任何文件名)創建一個 Pandas 數據框?

[英]How to create a pandas dataframe from one file (with any file name) located in a specified folder?

從位於指定文件夾中的任何文件名的文件創建 Pandas 數據框的最佳方法是什么?

我使用了 pathlib 並且它不太工作,因為輸出數據框沒有給我任何東西。

from pathlib import Path
import pandas as pd

pth = r'C:\Users\HP\Desktop\IBM\New folder'
fle = Path(pth).glob('*.tsv')

someDf = pd.DataFrame(fle)
someDf

編輯:

我也嘗試執行以下操作,但輸出數據幀將所有列合並為一列,以反斜杠分隔。 我該如何解決?

from pathlib import Path
import pandas as pd

pth = r'C:\Users\HP\Desktop\IBM\New folder'
fle = Path(pth).glob('*.tsv')

dfs = []
for filename in fle:
    dfs.append(pd.read_csv(filename))

dfs1 = pd.concat(dfs)
dfs1.head()

在此處輸入圖片說明

我這樣做的方式似乎很復雜。 有沒有更簡單的方法來做到這一點?

請嘗試:

from pathlib import Path
import pandas as pd
import os
pth = r'C:\Users\HP\Desktop\IBM\New folder'
for file_ in os.listdir(pth):
    h=os.path.join(pth, file_)
    #print (h)
someDf = pd.read_csv(h)
someDf

嘗試

from glob import glob
files = glob('C:\Users\HP\Desktop\IBM\New folder\*.tsv')
if len(files) == 1:
    dfs = pd.read_csv(files[0], sep='\t')
else:
    dfs = pd.concat([pd.read_csv(file, sep='\t') for file in files])

我為此找到的解決方案如下。 我錯過了pd.read_csv()sep參數。

from pathlib import Path
import pandas as pd

pth = r'C:\Users\HP\Desktop\IBM\New folder'
fle = Path(pth).glob('*.tsv')

dfs = []
for filename in fle:
    dfs.append(pd.read_csv(filename, sep='\t'))

dfs1 = pd.concat(dfs)
dfs1.head()

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM