cost 320 ms
當每個餐廳鏈接的 href 屬性設置為“#”時,如何從 zaubee.com 導航和提取餐廳詳細信息?

[英]How can I navigate and extract restaurant details from zaubee.com when the href attribute is set to "#" for each restaurant link?

當 scrapy 中的 href 屬性設置為“#”時,如何抓取 zaubee.com 網站以從每個餐廳的頁面中提取業務詳細信息? 我目前正在從事 web 抓取項目,該項目將從zaubee.com網站收集公司信息。 但是,每個餐廳鏈接的 href 參數都設置為# ,這使我無法訪問各個餐廳網站並收集所 ...

Selenium 無頭模式打開瀏覽器TimeoutException錯誤

[英]TimeoutException error on opening the browser in headless mode in Selenium

我正在使用這個vezeeta.com來抓取一些關於毒品的信息,我正在使用 selenium 來處理這個網站。 我已經允許用戶輸入葯物名稱,然后 Selenium 將鍵入用戶在提到的網站的搜索框中輸入的葯物名稱,並且 select 將成為下拉菜單中的第一個選項,然后它將在瀏覽器中打開一個新頁面,然后從 ...

如何“取消評論”Beautifulsoup 的評論內容?

[英]How can I 'uncomment' the contents of a comment with Beautifulsoup?

我正在使用來自 bs4 版本的 BeautifulSoup:'4.10.0' 我正在為我正在開發的項目做一些抓取,我遇到了一個問題,我抓取的一些元素出於某種原因被評論了。<div class="h-[125] js-scroll-hidden" id="link-index-40"> ...

雙引號里面需要空格嗎?

[英]Do double quotes need space inside?

很簡單,但我很困惑。 在我的 Python 腳本上,它使用 selenium 進行 web 抓取,所有輸入都是 對於國家/地區,內部不需要空格,但是當涉及到輸入發送鍵時,在 " 之后沒有空格,它確實會在將其寫入網站時刪除第一個字母。 是有什么特殊原因還是取決於網站? 對不起我的英語我還在學習。 我 ...

使用 wget 從 Instagram 下載圖片

[英]Downloading images from Instagram with wget

我正在嘗試從 Instagram 下載圖片,代碼是: 問題是 wget 不能正常工作,或者我做錯了什么,但我想不通, ValueError:沒有足夠的值來解壓(預期 2,得到 1) 我已經在 (image, save_as) 中定義了 url 和目標值,但它一直給我這個錯誤。 有人能幫助我嗎? 完 ...

Python 鏈接抓取器正則表達式僅在搜索 1 種擴展類型時有效,但在匹配多種擴展類型時失敗

[英]Python link scraper regex works when only searching for 1 extension type, but fails when matching more than one extension type

這是我用於該項目的測試鏈接: https://www.dropbox.com/sh/4cgwf2b6gk4bex4/AADtM1GDYgPDdv8QP6JdSOkba?dl=0 現在,下面的代碼僅在匹配 for.mp3 時有效(第 8 行),並按要求將純鏈接輸出到文本文件。 問題是,上面的測試鏈接不 ...

嘗試從 Clockify 導出數據

[英]Trying to Export the Data from Clockify

我一直在嘗試使用 VBA 並使用以下代碼將 Clockify 中的所有數據提取到 Excel 中,但該代碼中沒有 output 非常感謝您的幫助。 運行代碼時獲得此響應{"code":405,"message":"HTTP 405 Method Not Allowed"} ...

我的 selenium 腳本正確地抓取了谷歌地圖第一個鏈接中的變量,但是當它加載第二個鏈接時它顯示了一些錯誤

[英]My selenium script is scraping the variables in the first link of google maps correctly , but when it loads the second link it shows some error

`這個腳本的目標是從 excel 文件中獲取企業名稱,然后在谷歌地圖上搜索它並抓取所需的數據,問題是腳本運行正確並在谷歌地圖上抓取第一個企業名稱的數據。 但是當第二個鏈接加載並且出現 data.table 時它給出了一些錯誤,那么我該如何解決它。 隨意在您的編譯器上運行此腳本。您可以創建一個 ex ...

迭代被覆蓋

[英]Iterations are getting overwritten

希望讀這篇文章的人一切都好。 我想做的是從 NIST ILThermo 網站上提取關於純(單一組分)離子液體的粘度及其測量條件的數據表。 我正在使用此代碼,由一個名為 HedgeHog 的用戶編寫,但它會自行覆蓋而不顯示所有不同的溫度及其粘度。 相反,它顯示了整個表格的最后溫度和粘度。 這是代碼:i ...

從 Python 字典中的鍵中獲取值

[英]Fetching the value from the key in Python's dict

我正在從 JSON 中的 'key' 中獲取 'value',但我不知道為什么我無法獲取目標信息。 下面的代碼 下面是本例的JSON。 (鏈接中的信息是公開的。因此,我不會刪除 1194452 的詳細信息)。 問題由於 type(x) 是 Python 中的 'dict',為什么我不能獲取鍵的值? ...

python 垂直滾動特定的滾動條

[英]python scroll a specific scrollbar vertically

我正在使用 python selenium 滾動網頁,我試圖通過單擊滾動元素到達頁面底部,但它返回此錯誤: MoveTargetOutOfBoundsException: move target out of bounds 到目前為止我的代碼: 還有另一種使用“scrollbar_needed”路徑 ...

除非單擊文本,否則我無法訪問隱藏了 selenium 個元素的文本框

[英]I can not access text box with selenium elements hid unless text clicked

我在 python 和 Selenium 工作。當我點擊這條線時 並使用click()或send.keys(8)復制路徑,它不會 go 到第 8 頁它只是閃爍並繼續移動到下一行代碼。 但是,作為一個人,如果我單擊該框,它會更改元素以顯示帶有輸入部分的第二張圖片。 我不知道該怎么辦 我也試過 圖像 ...

我用Python做webscraping時怎么寫兩個For循環?

[英]How can I write two For Loops when I do webscraping with Python?

我想寫一個代碼來抓取多個網頁。 但是,問題是網頁中有兩個數字變體。 正如我們在這里看到的,頁碼和文檔編號同時變化。 到目前為止我寫了這個,但它只循環頁碼,所以它沒有給我任何東西。 有什么方法可以為頁碼和文檔編號創建外觀嗎? ...

嘗試使用 BeautifulSoup 從 Kayak 網站獲取 href URL

[英]Trying to grab href URLs from Kayak website using BeautifulSoup

我試圖從出現在這個 Kayak 網站上的每張卡片中獲取 URL,當我嘗試運行下面的代碼時,我收到了BrokenPipeError: [Errno 32] Broken pipe錯誤。 有人可以幫助我獲得正確的代碼以從該頁面的航班結果中獲取所有 URL 嗎? ...

如何用 BeautifulSoup 獲取文本和對應的標簽?

[英]How to get text and corresponding tag with BeautifulSoup?

我有一個文本,包含 HTML 個標簽,例如: 我使用BeautifulSoup解析了這段文本。 我想用相應的文本和標簽提取每個句子。 我試過: 我也試過soup.find_all()並停留在同一點:我可以訪問文本但不能訪問原始標簽。 ...

登錄牆后面的抓取表

[英]Scraping table behind login wall

我正在努力獲取正確的代碼片段,以將受密碼保護的網站的表格抓取到 excel 工作簿中。 我已經能夠獲得所有代碼來處理表格部分。 當我運行代碼時,它打開 IE,登錄但隨后出錯(91:Object 變量或未設置 WITH 塊變量)。 代碼如下: 我已經包含了我在登錄后嘗試在重定向頁面上抓取的表的 HTM ...

使用 Puppeteer 和 Cheerio 抓取帶有圖像的卡片列表時缺少數據

[英]Missing data when scraping list of cards with images with Puppeteer and Cheerio

我正在嘗試抓取一頁卡片項目。 我想從這些卡片中提取標題、價格、圖像來源和其他屬性。 然而,當我使用 Puppeteer 和 Cheerio 進行抓取時,一些數據丟失了。 見下圖: 我怎樣才能確保所有數據都通過? 這是我的代碼:(async () => { try { const ...


 
粵ICP備18138465號  © 2020-2025 STACKOOM.COM