簡體   English   中英

Python讀取多個.txt文件並使用pandas行綁定

[英]Python read in multiple .txt files and row bind using pandas

我來自R(和SAS),在讀取大量.txt文件(都存儲在同一目錄中)並在熊貓中創建一個大數據框時遇到問題。 到目前為止,我已經嘗試過合並代碼-所有這些都不幸失敗了。 我認為這是一個簡單的任務,但缺乏python的經驗...

如果有幫助,我將使用以下數據創建一個大型數據框: http ://www.ssa.gov/oact/babynames/limits.html-特定於狀態的集合(總共50個,以其狀態縮寫命名)。文本)

請幫忙!

import pandas as pd

import glob

filelist = glob.glob("C:\Users\Dell\Downloads\Names\*.txt")

names = ['state', 'gender', 'year', 'name', 'count']

然后,我正在考慮使用pd.concat,但是不確定-本質上我想讀取每個數據集,然后將它們綁定在一起(假設它們都具有相同的列)。

concat很不錯,因為默認情況下“ join”設置為“ outer”(即索引的並集)。 您可以輕松地使用df.join(),但必須將“如何”指定為“外部”。 無論哪種方式,都可以非常簡單地構建數據框:

import pandas as pd
from glob import glob as gg

data = pd.DataFrame()
names = ['state', 'gender', 'year', 'name', 'count']

for f in gg('*.txt'):
    tmp = pd.read_csv(f,columns=names)

    data = pd.concat([data,tmp],axis=0,ignore_index=True)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM