簡體   English   中英

如何從pandas.DataFrame()連接特定列?

[英]How to concatenate a specific column from a pandas.DataFrame()?

我有一個文件列表,我想為我的所有文件合並一個特定的列,以運行一些累積分析。

import pandas as pd
import numpy as np
all_data_sets = pd.DataFrame([])
for file_name in file_list:
    my_data = pd.DataFrame([])
    my_data = pd.read_csv(file_name, delimiter=',', names=header_row)
    my_data = my_data.reset_index()
    all_data_sets.append(my_data['sales'])

#np.mean(all_data_sets['sales'])
np.mean(all_data_sets)

您可以使用concat串聯一個DataFrames列表

 df_list = [pd.read_csv(file_name, delimiter=',', names=header_row) for file_name in file_list] #opens your csv

 df = pd.concat(df_list)

然后您通過計算平均值

 df.sales.mean()

一個小例子

 a = pd.DataFrame({'sales' : [2,4,6] , 'other' : [1,2,1]})
 b = pd.DataFrame({'sales' : [7,4,7] , 'other' : [9,2,1]})

 df = pd.concat([a,b])

數據框是

      other  sales
  0      1      2
  1      2      4
  2      1      6
  0      9      7
  1      2      4
  2      1      7

和平均值

 df.sales.mean()
    5.0

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM