[英]How do I index os.walk into a dataframe?
我試圖將目錄映射到pandas數據框中,但自動索引始終為0。最終,我想創建一個將MD5作為文件路徑的列。 我知道還有其他選擇,但我正在嘗試在熊貓中做。 這是我的代碼:
for path, subFolders, files in os.walk(targetdir):
for file in files:
nm, ext = os.path.splitext(file)
if ext.lower().endswith(('.xlsx','.m4v','mov')): #this is so i filter only what I want
filepaths = os.path.join(os.path.abspath(path),file)
df1 = pd.DataFrame({'filename': pd.Series(file),
'fullpath': pd.Series(filepaths,)
})
print df1
謝謝!
收集列表中的數據,然后在循環完成后創建一個DataFrame:
data = list()
for root, dirs, files in os.walk(targetdir):
for filename in files:
nm, ext = os.path.splitext(filename)
if ext.lower().endswith(('.xlsx', '.m4v', 'mov')):
fullpath = os.path.join(os.path.abspath(root), filename)
data.append((filename, fullpath))
df1 = pd.DataFrame(data, columns=['filename', 'fullpath'])
print(df1)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.