[英]Using pandas, how do I loop through a dataframe row by row but with each row being its own dataframe
[英]How to loop through each row in a column in a pandas dataframe
我有一個 excel 文件,如下所示,其中包含一組名稱及其谷歌學者鏈接。
ID Name Link
1 A www.abc.com
2 B www.def.com
3 C www.ghi.com
我編寫了一個代碼來讀取 excel 文件,使用 for 循環瀏覽每個鏈接,在每個循環中 - 從每個鏈接中抓取信息並將其寫入一個新文件。 代碼如下。
File=[]
for i in arr:
driver.get(i)
columns={}
columns['Name'] = driver.find_element_by_id()
columns['Citations'] = driver.find_element_by_id()
File.append(columns)
我的問題是我想在我的新文件中包含一個列“ID”,它與我的 excel 文件中的列“ID”相同。 本質上,我想要 for 循環的第一次迭代中列“ID”的第一行,循環的第二次迭代中列“ID”的第二行,依此類推。 有人可以幫忙嗎? 謝謝!
與其將它們保存為字典,不如將它們保存為 DataFrame 並分配一個名為 source 的新列,其 id 為:
File=[]
for i in arr:
driver.get(i)
columns={}
columns['Name'] = driver.find_element_by_id()
columns['Citations'] = driver.find_element_by_id()
File.append(pd.DataFrame(columns).assign(source=i))
要從中僅獲取一個 dataframe ,您可以使用:
pd.concat(File)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.