Python Beautiful Soup-獲取輸入值

Question

我的計划是能夠使用Bs4來獲取_AntiCsrfToken。

我有這個HTML，我的HTML來自

我在代碼中寫的是

token = soup.find('input', {'name':'_AntiCsrfToken'})['value'])
print(token)

但這給我一個錯誤

    Traceback (most recent call last):
  File "C:\Users\HelloWorld.py", line 67, in <module>
    print(soup.find('input', {'name':'_AntiCsrfToken'})['value'])
  File "C:\Python\lib\site-packages\bs4\element.py", line 1292, in find
    l = self.find_all(name, attrs, recursive, text, 1, **kwargs)
AttributeError: 'str' object has no attribute 'find_all'

我完全不知道我是否做對了。 我確實認為我做對了，但也許我需要在form-id之前找到它，而不是直接隱藏它？

Answer 1

我不確定錯誤在哪里，但是我已經制作了一個html文件並將其放在我的服務器上，復制和粘貼您的代碼沒有問題。

唯一明顯的區別（如果您尚未完成）是我使用請求將html解析為BS4

我認為這可能是一個解析問題。

HTML

<html>

<form action="process">
<input type="hidden" name="_AntiCsrfToken" value="5435434354353453545">

</form>
</html>

蟒蛇：

from bs4 import BeautifulSoup as bs4
import requests

r = requests.get('http://maffaz.com/so.html')
html_bytes = r.text
soup = bs4(html_bytes, 'lxml')
token = soup.find('input', {'name':'_AntiCsrfToken'})['value']
print(token)

收益：

5435434354353453545

你也不需要

{'name':'_AntiCsrfToken'}

所以：

token = soup.find('input')['value']

將工作

Answer 2

也許嘗試使用CSS選擇器？

from bs4 import BeautifulSoup

html = """
<html>
<input type="hidden" name="_AntiCsrfToken" value="5435434354353453545">
</html>
"""

soup = BeautifulSoup(html, 'lxml')
csrf = soup.select_one('input[name=_AntiCsrfToken]')['value']
print(csrf)

輸出： 5435434354353453545

Python Beautiful Soup-獲取輸入值

問題描述

2 個解決方案

解決方案1
1 已采納 2017-09-03 22:09:50

解決方案2
0 2017-09-03 23:25:52

Python Beautiful Soup-獲取輸入值

問題描述

2 個解決方案

解決方案1 1 已采納 2017-09-03 22:09:50

解決方案2 0 2017-09-03 23:25:52

解決方案1
1 已采納 2017-09-03 22:09:50

解決方案2
0 2017-09-03 23:25:52