簡體   English   中英

preg_match UTF-8問題是未知符號而不是西里爾語

[英]preg_match UTF-8 problems unknown symbols instead of Cyrillic

我的腳本工作得很好,但今天在簽入日志后我找到了一些矩陣詞,經過分析我明白有一些東西與utf8,文件被解析,標題被提取,但結果而不是俄語單詞是(СÐμриР°Ð»Ñ<ТТ¢Ð¡ÐμриÐ)未知符號

我用

$cont = "dasdas<title>Сериалы ТУТ! Сериалы онлайн sda</title>";
preg_match("'<title[^>]*?>(.*)</title>'siU", $cont, $match);

//$match[1] = Сериалы ТУТ! СериРsda

當我嘗試添加模式修飾符/ u時沒有變化,相同的未知矩陣詞。 請。

也許有PHP的東西?

它不是php或正則表達式問題,而是一個html問題。 要獲得正確的顯示,您必須在html代碼的標題中添加<meta charset="UTF-8"/>

作為旁注:使用U修飾符是無用的:

preg_match('~<title[^>]*>(.*?)</title>~si', $cont, $match);

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM