[英]preg_match UTF-8 problems unknown symbols instead of Cyrillic
我的腳本工作得很好,但今天在簽入日志后我找到了一些矩陣詞,經過分析我明白有一些東西與utf8,文件被解析,標題被提取,但結果而不是俄語單詞是(СÐμриР°Ð»Ñ<ТТ¢Ð¡ÐμриÐ)未知符號
我用
$cont = "dasdas<title>Сериалы ТУТ! Сериалы онлайн sda</title>";
preg_match("'<title[^>]*?>(.*)</title>'siU", $cont, $match);
//$match[1] = Сериалы ТУТ! СериРsda
當我嘗試添加模式修飾符/ u時沒有變化,相同的未知矩陣詞。 請。
也許有PHP的東西?
它不是php或正則表達式問題,而是一個html問題。 要獲得正確的顯示,您必須在html代碼的標題中添加<meta charset="UTF-8"/>
。
作為旁注:使用U修飾符是無用的:
preg_match('~<title[^>]*>(.*?)</title>~si', $cont, $match);
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.