我只是想获得任何喜欢的 Facebook页面数量,并将其显示在一个简单的网页中。 我用BeautifulSoup刮了很多

但是问题是:脚本运行后,值不会被刷新...是否有任何方法可以定期重新运行脚本?

这是.py脚本

      from flask import Flask, render_template

        import requests
        import string
        import lxml.html
        import lxml.html.clean
        import unicodedata
        from bs4 import BeautifulSoup
        import re


        user = 'EttounsiyaTV'
        url = 'https://www.facebook.com/'+ user
        response = requests.get(url)
        soup = BeautifulSoup(response.content,'lxml')
        fe = soup.find('div', attrs={'class': '_4-u3 _5sqi _5sqk'})
        f = fe.text
        nonBreakSpace = u'\xa0'
        soup = f.replace(nonBreakSpace, '')

        soup = re.sub("\D","",soup)

        fan_number = int(soup)
        old_number = 6206360
        difference = old_number - fan_number


        print("lost in one day {difference} ".format(difference=difference))

        print(fan_number)


        app = Flask(__name__)



        @app.route("/")
        def home():
            return render_template("index.html",text=soup,text2=f)


        if __name__ == "__main__":
            app.run(debug=True)

这是在模板中找到的html

    <!DOCTYPE html>
    <html lang="en" dir="ltr">
    <meta http-equiv="refresh" content="5"/>

      <head>
           <title>Flask app</title>
        <link rel="stylesheet" href="https://stackpath.bootstrapcdn.com/bootstrap/4.3.1/css/bootstrap.min.css" integrity="sha384-ggOyR0iXCbMQv3Xipma34MD+dH/1fQ784/j6cY/iJTQUOhcWr7x9JvoRxT2MZw1T" crossorigin="anonymous">


      </head>
      <body>
       <center> <h1> {{ text }}</h1> <center>

      </body>
    </html>

如何将其上传到免费主机上,并使其每5秒刷新一次?

  ask by Amir Bennasr translate from so

本文未有回复,本站智能推荐:

1回复

网页抓取-使用BeautifulSoup

我是 beautifulsoup 的新手,在篮球参考中使用它时遇到了问题。 我正在尝试将 Advanced stats 的整个数据帧存储到 Pandas 数据帧中,但我什至无法选择它。 到目前为止,这是我的代码: 从上面的代码中选择高级后,我看到了我需要的 html,但我实际上无法解析和提取数据。
1回复

使用BeautifulSoup进行网页抓取时无法捕获html元素

使用 BeautifulSoup 进行网页抓取时无法捕获 html 元素我在 pycharm 中运行以下代码 输出不包含要捕获的 html 元素,它只显示标签中的错误,而不是类和 html 元素。
1回复

使用BeautifulSoup进行网页抓取时遇到问题

我很难抓取这个网页top-programming-guru 。 我希望检索页面中列出的所有 youtube 频道的列表。 我正在使用BeautifulSoup ,我查看了页面的源代码,然后尝试使用以下代码: 但我总是得到一个空列表。 任何想法如何正确地做到这一点? 这是我正在寻找的标签
1回复

使用beautifulsoup进行网页抓取

我正在尝试使用 python3.6 从 Imdb 电影中抓取评论。 但是,当我打印我的“评论”时,只会弹出 1 条评论,我不确定为什么其他评论没有弹出。 我的“review_title”不会发生这种情况。 非常感谢任何建议或帮助,因为我一直在搜索论坛和谷歌搜索但无济于事。
2回复

如何使用BeautifulSoup库从可折叠表中刮取肢体?

最近,我做了一个基于covid-19仪表板的项目。 我用来从这个具有可折叠表格的网站上抓取数据的地方。 到目前为止,一切都还可以,现在最近的heroku应用程序显示了一些错误。 所以我在我的本地计算机上重新运行我的代码,并在刮取tbody时发生了错误。 然后我发现用于刮取数据的站点已更改或更新了它的
2回复

使用BeautifulSoup保存网页内容

我正在尝试使用以下代码使用 BeautifulSoup 抓取网页: 问题是它保存了维基百科的主页而不是那篇特定的文章。 为什么地址不起作用,我应该如何更改它?
2回复

IndexError:使用BeautifulSoup从网页中提取表

我正在尝试从机场网站提取包含航班抵达信息的表(带有列-航班,承运人,出发地,日期,预定,估计,状态),但出现以下错误: 我已经对stackoverflow进行了梳理,但是找不到解决方案。 这是我的代码: 感谢您的贡献。
1回复

无法使用BeautifulSoup从网页获取更新的数据

使用此代码,我能够获取 var1 的值,但是一旦我们登陆该网页,我正在访问的网页不显示实时数据,一旦我们登陆,更新实时值需要 1 秒网页。 因此,我在 var1 中获得的值不是实时值。 想知道在进行网页抓取之前我如何在登陆网页后等待。 提前致谢。