如何剝離 <html> 從字符串標記？

Question

我從HTTP獲取以下響應。

<HTML><BODY>Now='11/7/2017 4:08:34 PM' Process='chrome' SessionID=1 User='Local\User' Culture='en-US'<BR></BODY></HTML>

我需要將正文中的數據獲取到JSON對象中。 因此，我嘗試刪除HTML標簽。 盡管有所不同，但我已經嘗試過，就像在該解決方案中一樣 。 它適用於HTML標記，但不適用於<html>本身。

我也嘗試過如下：

var content = "<HTML><BODY>Now='11/7/2017 4:08:34 PM' Process='chrome' SessionID=1 User='Local\User' Culture='en-US'<BR></BODY></HTML>";

var tag = document.createElement("html");
tag.outerHtml = content;

它給出以下錯誤：

Uncaught DOMException: Failed to set the 'outerHTML' property on 'Element': This element has no parent node.

雖然我知道，它可以實現regex ，我想這樣做沒有regex 。

有人可以解決嗎？

Answer 1

使用DOMParser()將HTML字符串轉換為DOM：

 var html = `<HTML><BODY>Now='11/7/2017 4:08:34 PM' Process='chrome' SessionID=1 User='Local\\User' Culture='en-US'<BR></BODY></HTML>`; var parser = new DOMParser(); var html_dom = parser.parseFromString(html, "text/html"); var body = html_dom.querySelector("body"); var content = body.innerHTML; console.log(content);

Answer 2

剛剛創建了一個簡單的codepen 。 請嘗試，它將起作用：

https://codepen.io/vishalkaului/pen/rYMGoy

+6和-16排除開始<BODY>標記之前和結束</BODY>標記之后的內容。 它同時包含<BODY></BODY>標記的排除項。

(function () {
    let serverResponse = "<HTML><BODY>Now='11/7/2017 4:08:34 PM' 
    Process='chrome' SessionID=1 User='Local\User' Culture='en-
    US'<BR></BODY></HTML>";



 console.log(serverResponse.substr(serverResponse.indexOf('<BODY>')+6,serverResponse.indexOf('</BODY>')-16));
})()

注意：僅當您知道響應的結構相同時，此解決方案才適用。 雖然，內容可以變化，但是響應數據前后的標簽相同。

如何剝離 <html> 從字符串標記？

問題描述

2 個解決方案

解決方案1
0 已采納 2017-11-07 11:10:55

解決方案2
-2 2017-11-07 11:30:19

如何剝離 <html> 從字符串標記？

問題描述

2 個解決方案

解決方案1 0 已采納 2017-11-07 11:10:55

解決方案2 -2 2017-11-07 11:30:19

解決方案1
0 已采納 2017-11-07 11:10:55

解決方案2
-2 2017-11-07 11:30:19