[英]Python Scraping | Beautifulsoup
我想为每个“日期”部分提取,什么是刮掉<p>
内的日期部分的最佳方法。
<div class="kefufloat" id="targetObj">
<img src=" " width="44"></div>
<div class="reblock">
<p><span>运单编号:</span>w44036</p>
<p><span>下单时间:</span>2020-04-21 14:17:56</p>
<p><span>到齐时间:</span>2020-04-10 11:33</p>
<p><span>已称重时间:</span>2020-04-21</p>
</div>
<style>
我希望这个片段能帮助你。
from bs4 import BeautifulSoup
html = """<div class="reblock">
<p><span>运单编号:</span>w44036</p>
<p><span>下单时间:</span>2020-04-21 14:17:56</p>
<p><span>到齐时间:</span>2020-04-10 11:33</p>
<p><span>已称重时间:</span>2020-04-21</p>
</div>
<style>"""
soup = BeautifulSoup(html, 'html.parser')
for row in soup.find_all('p'):
print(row.get_text())
Output 看起来像这样:
运单编号:w44036
下单时间:2020-04-21 14:17:56
到齐时间:2020-04-10 11:33
已称重时间:2020-04-21
为了进一步处理,您可以使用split()方法仅获取字符串的 Date 部分。 然后您可以使用日期时间库轻松操作日期。 尤其是strftime() 和 strptime( ) function 会很有帮助。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.