Web用R刮擦桌子

Question

我正在嘗試從音調書網站上抓取一張桌子。 但是使用簡單的HTML無效，因為宣傳冊使用Java腳本而不是HTML來加載數據，因此我需要執行JS才能從json文件中提取信息。 這是我的代碼：

    library(httr)
    library(jsonlite)
    library(magrittr)  
    json=get("https://my.pitchbook.com/old/ 
    homeContent.64ea0536fd321cc1dd3b.js") %>% 
    content(as='text') %>% 
    fromJSON()

我收到此錯誤：

    Error in 
   get("https://my.pitchbook.com/old/homeContent.64ea0536fd321cc1dd3b.js") 
    : 
     object 
  'https://my.pitchbook.com/old/homeContent.64ea0536fd321cc1dd3b.js'
   not found

我嘗試加載的任何數據都會返回相同的錯誤。 會感謝您的幫助:)謝謝:)

Answer 1

您已調用base::get而不是httr::GET 。 所以應該

library(httr)
library(jsonlite)
library(magrittr)  
json <- GET(
  "https://my.pitchbook.com/old/homeContent.64ea0536fd321cc1dd3b.js"
) %>% 
  content("text") %>% 
  fromJSON()

但我不能完全確定您的網站網址是否提供了有效的json。 這本身會給

詞法錯誤：json文本中的char無效。

Web用R刮擦桌子

問題描述

1 個解決方案

解決方案1
0 已采納 2019-05-15 06:56:13

Web用R刮擦桌子

問題描述

1 個解決方案

解決方案1 0 已采納 2019-05-15 06:56:13

解決方案1
0 已采納 2019-05-15 06:56:13