我正在尝试使用 python 从 html 网站中提取一些数据

Question

我试图从这个页面中提取一些数据。 我得到了我想要的数据，但我想把它分开。 我得到它们是这样的：地址：Veteranenstr。 21, 10119 Berlin - Mitte 我想得到地址和门牌号码，例如 Veteranenstr 和 21 分开。 与该地方分开的灯柱也是如此。 有人知道如何将它们分开吗？

<div class="article-attributes">
        <h4 class="heading">Kinodetails</h4>
        <ul>
            <li>
                <span class="title">Adresse:</span>
                <span class="text">
                    <div class="first">
                        <span class="street-address">Veteranenstr. 21</span>
                    </div>
                    <div class="second">
                        <span class="postal-code">10119</span>&nbsp;
                        <span class="locality"> Berlin - Mitte </span>
                    </div>

这是我为提取编写的代码：

paga_soup = soup(page_htmll,"html.parser")
karak = paga_soup.findAll("div",{"class":"article-attributes"})
ka = karak[0]
dat = ka.findAll("li")

# suche nach Adresse
for by in dat:
    adresse = by.find_all('span')
    if (adresse[0].text == "Adresse:"):
        print('    ' + adresse[0].contents[0] + ' ' + adresse[2].text + ', '+ adresse[3].text + ' ' + adresse[4].text.strip())

Answer 1

您可以试试这个，使用 CSS 选择器来查找具有地址的跨度，在空格上拆分，然后将它们解包以分配给变量。 这取决于您可能想要稍微调整解包的其他地址的外观。

paga_soup = soup(page_htmll,"html.parser")
            karak = paga_soup.findAll("div",{"class":"article-attributes"})
            ka = karak[0]
            dat = ka.findAll("li")
            # suche nach Adresse
            for by in dat:
                address, number = by.find(".article-attributes .street-address").text.split()

我正在尝试使用 python 从 html 网站中提取一些数据

问题描述

1 个解决方案

解决方案1
0 2019-11-19 21:44:09

我正在尝试使用 python 从 html 网站中提取一些数据

问题描述

1 个解决方案

解决方案1 0 2019-11-19 21:44:09

解决方案1
0 2019-11-19 21:44:09