繁体   English   中英

协助清洁数据收集输出

[英]Assistance with Cleaning Data Scraping Output

我是Python的新手,我想知道什么是清除代码输出的最佳方法。 这是我到目前为止的内容:

# DNH KDR Checker

import time
import urllib.request
import csv
from datetime import datetime
from bs4 import BeautifulSoup

print("Please Enter SteamID64")
player = input()

dnh = 'https://pug.districtnine.host/profile?id=' + str(player)
page = urllib.request.urlopen(dnh)
soup = BeautifulSoup(page, 'html.parser')

kdr_value = soup.find(class_="col-md-3")

print(kdr_value.prettify())

当我输入Steam64ID时(在本例中为76561198802827420),输出如下所示:

<div class="col-md-3">
 <h4>
  <i class="fas fa-crosshairs">
  </i>
  Kills: 1717
 </h4>
 <h4>
  <i class="fas fa-skull">
  </i>
  deaths:
  <strong>
   1462
  </strong>
  <br/>
 </h4>
 <h4>
  <i class="fas fa-dot-circle">
  </i>
  kdr: 1.17
  <br/>
 </h4>
</div>

但我希望它像这样出来:

Kills: 1717
Deaths: 1462
KDR: 1.17

非常简单 要删除HTML标记,请使用BeautifulSoupget_text()函数。

在最后一行中,将打印语句替换为:

print(kdr_value.get_text())

现在,您将获得以下输出:

Kills: 1717
deaths: 1462
kdr: 1.17

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM