HTML 字符集
- 默认模式
- 浅蓝色模式
- 淡绿色模式
- 深夜模式
HTML 字符集
为了正确显示 HTML 页面,浏览器必须知道文档所使用的字符集(编码):
推荐使用UTF-8
编码方式,如下所示,
<meta charset="UTF-8">
字符集的发展历史
在 Web 开发的演进中,字符集的迭代紧跟技术步伐。HTML5 规范大力倡导使用UTF-8
字符集,但其普及并非一帆风顺。
早期 Web 因技术限制,长期采用ASCII
编码,仅支持有限的英文字符及符号。
随着 Web 应用场景不断拓展,从 HTML 2.0 到 HTML 4.01,ISO-8859-1
成为主流字符集标准。
ISO-8859-1
虽在ASCII
基础上扩展了西欧语言字符支持,但仍无法满足全球多语言需求。
直到 XML 技术与 HTML5 规范融合,UTF-8
才成为 Web 开发核心标准。
UTF-8
凭借对全球语言字符的统一编码能力,解决了多语言乱码、字符集不兼容等问题,为全球化 Web 应用筑牢根基。

最初:ASCII
计算机数据以二进制代码(01000101)存储在电子设备中。
为了使文本的存储标准化,创建了美国信息交换标准码(American Standard Code for Information Interchange,ASCII)。它诞生时主要为了满足英文使用(如字母、标点)。
由于ASCII
只用 7 位二进制数(最多 128 个字符),没空间容纳其他语言的字母(比如中文、法语、俄语等)。
如今,ASCII
仍在使用,特别是在大型主机计算机系统中。如需更深入的研究,请访问我们的完整 ASCII 参考。
在 Windows 中:Windows-1252
Windows-1252
是 Windows(直到 Windows 95)中的默认字符集。
它是ASCII
的扩展,增加了国际字符。
它使用一个完整的字节(8 位)表示 256 个不同的字符。
由于Windows-1252
是 Windows 中的默认设置,因此所有浏览器都支持它。
如需更深入的研究,请访问我们的完整 Windows-1252 参考。
在 HTML4 中:ISO-8859-1
HTML4 中最常用的字符集是ISO-8859-1
。
ISO-8859-1
是ASCII
的扩展,增加了国际字符。
1. 在 HTML 4 中,可以在<meta>
标签中指定ISO-8859-1
的字符集:
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
2. 在 HTML 4 中,可以在<meta>
标签中指定与ISO-8859-1
不同的字符集:
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
3. 所有 HTML 4 处理器也都支持 UTF-8:
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
提示:当浏览器检测到ISO-8859-1
时,它通常默认为Windows-1252
,因为Windows-1252
还有 32 个国际字符。
如需更深入的研究,请访问我们的完整 ISO-8859-1 参考。
在 HTML5 中:Unicode UTF-8
HTML5 规范鼓励 Web 开发人员使用 UTF-8 字符集:
<meta charset="UTF-8">
在 HTML5 中,可以在<meta>
标签中指定不同于UTF-8
的字符集:
<meta charset="ISO-8859-1">
Unicode 联盟开发了UTF-8
和UTF-16
标准,因为ISO-8859
字符集是受限制的,并且不兼容多语言环境。
Unicode 标准(几乎)涵盖世界上所有的字符、标点和符号。
提示:所有 HTML5 和 XML 处理器都支持UTF-8
、UTF-16
、Windows-1252
和ISO-8859
。
如需更深入的研究,请访问我们的完整 Unicode 参考。
反馈提交成功
感谢您的反馈,我们将尽快处理您的反馈