[英]PHP - DOM Parser will not return string
好的,我有一个HTML DOM解析器。 它可以...排序。 它正在尝试从div女巫上课的课文中获取文字。
查看主文件
<!DOCTYPE HTML>
<html>
<head>
<meta http-equiv="content-type" content="text/html" />
<script type="text/javascript" src="//ajax.googleapis.com/ajax/libs/jquery/1.10.2/jquery.min.js">
</script>
<script type="text/javascript" src="http://ajax.googleapis.com/ajax/libs/jqueryui/1.8.18/jquery-ui.min.js">
</script>
<style>
#txt_out {
border: 2px solid #C2C2C2;
color: #2E2E2E;
background: #EDEDED;
width: 97%;
padding: 5px;
font-size: 12px;
font-family: monospace;
outline: none;
height: 800px;
margin: 10px 0;
}
</style>
<title>Get Ranks</title>
<script type="text/javascript" >
$(document).on("click", ".go", function (event) {
var ID = $(".rank").val();
console.log("Loading rank: " + ID);
loadData(ID);
});
function loadData(ID) {
var getRank = ID;
var dataString = 'getRank=' + getRank;
$.ajax({
type: "POST",
url: "otherTest.php",
data: dataString,
cache: false,
success: function (html) {
$("#txt_out").append(html);
}
});
}
</script>
</head>
<body>
<h1>Get Mens Rankings</h1>
<input value="233" class="rank" />
<button class="go">Get stats</button>
<textarea readonly="readonly" id="txt_out"></textarea>
</body>
</html>
然后点击“获取统计信息”按钮,就会(通过AJAX)调用此页面:
<?php
include_once ('simple_html_dom.php');
$rank = $_POST['getRank'];
$URL = "http://fifa.com/worldranking/rankingtable/gender=m/rank=".$rank."/confederation=25998/page=1/_ranking_table.html";
$html = file_get_html($URL);
$test = trim($html->find('.rnkdate', 0)->innertext);
echo "Date published: " . $test;
?>
它正在尝试从以下URL中提取发布日期: http://www.fifa.com/worldranking/rankingtable/gender=m/rank=233/confederation=25998/page=1/_ranking_table.html
: http://www.fifa.com/worldranking/rankingtable/gender=m/rank=233/confederation=25998/page=1/_ranking_table.html
,其中rank=XXX
是不同月份的不同表格。
无论如何,当我这样做时,这是我得到的:
问题是它在另一个DIV中,因此...我想它没有显示在<textarea>
。 那么...我如何进入该div并提取文本本身? 谢谢。
如果您使用的是http://simplehtmldom.sourceforge.net/ ,那么根据http://simplehtmldom.sourceforge.net/manual_api.htm看来,您应该使用“纯文本”,而不是“内部文本”(作为内部文本)似乎是javascript开发人员称为innerHTML的内容,而“ plaintext”似乎是.textContent的js等效语言……这个simplehtmldom lib似乎是由非Web开发人员编写的。
$test = trim($html->find('.rnkdate', 0)->plaintext);
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.