簡體   English   中英

從現有的 csv 文件 python pandas 創建多個 csv 文件

[英]Creating multiple csv files from existing csv file python pandas

我正在嘗試獲取一個大的 csv 文件並為兩列的排序編寫一個 csv 文件。 我能夠從文件中獲取兩個單獨的唯一值,以便能夠知道需要創建哪些 csv 文件。
防爆數據:

1,224939.203,1243008.651,1326.774,F,C-GRAD-FILL,09/22/18 07:24:34,
1,225994.242,1243021.426,1301.772,BS,C-GRAD-FILL,09/24/18 08:24:18,
451,225530.332,1243016.186,1316.173,GRD,C-TOE,10/02/18 11:49:13,
452,225522.429,1242996.017,1319.168,GRD,C-TOE KEY,10/02/18 11:49:46,

我想創建一個 csv 文件“C-GRAD-FILL 09-22-18.csv”,其中包含與兩個值匹配的所有數據。 我無法決定如何遍歷兩個值的數據。

def readData(fileName):
    df = pd.read_csv(fileName,index_col=False, names+['Number','Northing','Easting','Elevation','Description','Layer','Date'],parse_dates=['Date'] )
    ##Layers here!!!
    layers = df['Layer'].unique()
    ##Dates here!!! AS DATETIME OBJECTS!!!!
    dates = df['Date'].map(lambda t: t.date()).unique()
    ##Sorted in order
    sortedList = df.sort_values(by=['Layer','Date'])

您可以使用GroupBy對象。 首先確保您的日期采用正確的字符串格式:

df['Date'] = pd.to_datetime(df['Date']).dt.strftime('%m-%d-%y')

要輸出所有文件,請迭代GroupBy對象:

for (layer, date), group in df.groupby(['Layer', 'Date']):
    group.to_csv(f'{layer} {date}.csv', index=False)

或者,對於一種特定的組合:

layer = 'C-GRAD-FILL'
date = '09-22-18'
g = df.groupby(['Layer', 'Date'])

g.get_group((layer, date)).to_csv(f'{layer} {date}.csv', index=False)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM