簡體   English   中英

如何使用重復的字符串值創建數據框列?

[英]How to create a dataframe column with repeated string value?

我正在從一堆文件中讀取數據並將其存儲在數據框中。 我想要一列數據框來指示數據來自哪個文件。 如何創建一個具有相同字符串的列,而不是手動輸入?

我正在讀的每個文件有大約100個數據點(但每次都不是相同的數字)。 當我讀到每一個時,我將沿軸= 0連接到數據幀。 它看起來應該是這樣的。

import numpy as np
import pandas as pd
numbers = np.random.randn(5) # this data could be of any length, ~100
labels = np.array(['file01','file01','file01','file01','file01']) 
tf = pd.DataFrame()
tf['labels'] = labels
tf['numbers'] = numbers

In [8]: tf
Out[8]: 
   labels   numbers
0  file01 -0.176737
1  file01 -1.243871
2  file01  0.154886
3  file01  0.236653
4  file01 -0.195053

(是的,我知道我可以使'file01'成為一個列標題並沿軸= 1追加每一個,但我有理由不這樣做。)

你去,你的代碼是固定的! 實際上,您可以在DataFrame構造函數中使用的dict中放置一個值:)。

import numpy as np
import pandas as pd
filename = 'file01'
numbers = np.random.randn(5) # this data could be of any length, ~100
tf = pd.DataFrame({'labels': filename , 'numbers': numbers})

In [8]: tf
Out[8]: 
   labels   numbers
0  file01 -0.176737
1  file01 -1.243871
2  file01  0.154886
3  file01  0.236653
4  file01 -0.195053

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM