簡體   English   中英

HTML和字符編碼與HTML實體

[英]HTML and character encoding vs HTML Entity

在編寫HTML文檔時,是否可以使用直接特殊字符(如字母C和下面的cedilla)作為常規文本: Ç或使用此字符的HTML實體名稱 &Ccedil

我已經看到兩者都在實踐中使用,但肯定有規則管理這個的適當用法,以及一種方式優於另一種方式。 例如,該網站維護此角色的原始形式,但其他網站可能最終將其呈現為方塊。

真人物:

  • 如果您的系統設置為使用這些字符的語言,則更容易鍵入
  • 生成更易讀的代碼
  • 保存字節

HTML實體:

  • 讓你或多或少忘記字符編碼

顯然,HTML( <& ,等)中具有特殊含義的字符仍然需要由實體表示。

如果您使用的是UTF-8字符編碼,則大多數實體字符( &amp;&gt;&lt;除外)都會變得多余。

如果你沒有使用UTF-8,那么你需要所有的實體。

這一切都取決於文檔的字符編碼。 如果您不確定是否應使用常規文本或編碼版本,則可以通過W3C驗證程序運行頁面。

考慮以下代碼:

<html>
<head>
  <meta http-equiv="content-type" content="text/html; charset=utf-8" />
  <title>Stuff</title>
</head>
<body>
 <p>©</p>
 <p>&#169;</p>
</body>
</html>

文檔編碼設置為UTF-8,當驗證時,它返回錯誤:

抱歉,我無法驗證此文檔,因為在第7行它包含一個或多個我無法解釋為utf-8的字節(換句話說,找到的字節在指定的字符編碼中不是有效值)。 請檢查文件內容和字符編碼指示。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM