![](/img/trans.png)
[英]Read single varible from txt file each time processing multiple files using pandas and python
[英]Python read in multiple .txt files and row bind using pandas
我來自R(和SAS),在讀取大量.txt文件(都存儲在同一目錄中)並在熊貓中創建一個大數據框時遇到問題。 到目前為止,我已經嘗試過合並代碼-所有這些都不幸失敗了。 我認為這是一個簡單的任務,但缺乏python的經驗...
如果有幫助,我將使用以下數據創建一個大型數據框: http ://www.ssa.gov/oact/babynames/limits.html-特定於狀態的集合(總共50個,以其狀態縮寫命名)。文本)
請幫忙!
import pandas as pd
import glob
filelist = glob.glob("C:\Users\Dell\Downloads\Names\*.txt")
names = ['state', 'gender', 'year', 'name', 'count']
然后,我正在考慮使用pd.concat,但是不確定-本質上我想讀取每個數據集,然后將它們綁定在一起(假設它們都具有相同的列)。
concat很不錯,因為默認情況下“ join”設置為“ outer”(即索引的並集)。 您可以輕松地使用df.join(),但必須將“如何”指定為“外部”。 無論哪種方式,都可以非常簡單地構建數據框:
import pandas as pd
from glob import glob as gg
data = pd.DataFrame()
names = ['state', 'gender', 'year', 'name', 'count']
for f in gg('*.txt'):
tmp = pd.read_csv(f,columns=names)
data = pd.concat([data,tmp],axis=0,ignore_index=True)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.