使用來自 bs4 的文件名創建多個文件

Question

如何將每個<a>行寫入它自己的文件並使用 H2 作為文件名？？？

import re
import requests
from bs4 import BeautifulSoup
import os

data = '<html><div class="colors"> <a href="/green"> <div class="values"> GRN <h2 class="tester"> Green </h2> </div> </a> <a href="/purple"> <div class="values"> PURP <h2 class="tester"> Purple </h2> </div> </a> <a href="/orange"> <div class="values"> ORNG <h2 class="tester"> Orange </h2> </div> </a> </div><html>'
soup = BeautifulSoup(data, "html.parser")

colors = soup.find("div", {"class": "colors"})

for lines in colors:
    docs = lines.find("h2").text.strip()
    file = open('C:/Users/Admin/Desktop/'+str(doc)+'.txt', 'a', encoding='utf-8')
    file.write(str(lines))
    file.close()

查找包含文件名和 html 內容的結果。

Green.txt <a href="/green"> <div class="values"> GRN <h2 class="tester"> Green </h2> </div> </a>

Purple.txt <a href="/purple"> <div class="values"> PURP <h2 class="tester"> Purple </h2> </div> </a>

Orange.txt <a href="/orange"> <div class="values"> ORNG <h2 class="tester"> Orange </h2> </div> </a>

Answer 1

希望我做對了你必須用 class colors迭代<a>而不是<div>來實現你的目標：

for e in soup.select('.colors a'):
    name = e.h2.get_text(strip=True)
    html = str(e)
    file = open(name+'.txt', 'a', encoding='utf-8')
    file.write(html)
    file.close()

例子

from bs4 import BeautifulSoup
import os

data = '<html><div class="colors"> <a href="/green"> <div class="values"> GRN <h2 class="tester"> Green </h2> </div> </a> <a href="/purple"> <div class="values"> PURP <h2 class="tester"> Purple </h2> </div> </a> <a href="/orange"> <div class="values"> ORNG <h2 class="tester"> Orange </h2> </div> </a> </div><html>'
soup = BeautifulSoup(data, "html.parser")
    
for e in soup.select('.colors a'):
    name = e.h2.get_text(strip=True)
    html = str(e)
    file = open(name+'.txt', 'a', encoding='utf-8')
    file.write(html)
    file.close()

Answer 2

您可以使用find_all方法提取以獲取所有標簽並迭代a從h2標簽中獲取文件名，您可以獲得所需的 output：

links=colors.find_all("a")
for link in links:
    fname=link.find("h2").get_text(strip=True)
     with open(fname+".txt","w") as wr:
        wr.write(str(link))

使用來自 bs4 的文件名創建多個文件

問題描述

2 個解決方案

解決方案1
0 2022-08-16 07:14:57

例子

解決方案2
0 2022-08-16 07:23:55

使用來自 bs4 的文件名創建多個文件

問題描述

2 個解決方案

解決方案1 0 2022-08-16 07:14:57

例子

解決方案2 0 2022-08-16 07:23:55

解決方案1
0 2022-08-16 07:14:57

解決方案2
0 2022-08-16 07:23:55