簡體   English   中英

如何處理YQL的回復

[英]How do I handle this response from YQL

在對YQL的請求中(select * from html where url="...")我得到以下響應:

callback({
    "query":
        {"count":"1","created":"2011-05-09T23:29:05Z","lang":"en-US"
     }, "results": ["<body>... we\ufffdll call Mr ...</body>"]
}

這來自YQL控制台頁面。 當我將該序列鍵入firebug(甚至在YQL的頁面上)時,我得到:

... we�ll call Mr ...

我究竟做錯了什么? YQL的網站編碼錯誤嗎? 有什么方法可以將像這樣的符號轉換為它們的ascii等價形式?

順便說一句,這不是我的網站,所以好像我不能在該網站上更改元字符集

也許這些問題的答案可能有助於獲得更好的答案:

  1. 您在那個地方期待什么角色?
  2. 您可以發布要抓取的網址嗎?
  3. 是該頁面上的字符還是被YQL拾取時被弄亂了?

更新資料

您可能想在YQL查詢的where子句中檢出charset選項-我不完全確定它的作用,但看起來它迫使YQL引擎在解析頁面時使用指定的字符集。 也許將其設置為UTF-8可以解決您的問題。

例如,

select * from html where url = 'http://google.com' and charset='utf-8'

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM