21xrx.com
2025-06-01 20:04:25 Sunday
  

HTML 编码(字符集)

为了正确的显示HTML页面,浏览器必须知道页面的字符集(编码).

什么是字符编码?

ASCII是第一个标准字符编码(也叫字符集).它定义了127个不同的字母或数字用于因特网.

ASCII编码支持数字(0-9),英文字母(A-Z),和其它一些特殊字符:! % + - ( ) @ < > .

ANSI(Windows-1252)是Windows系统的集成字符集.它支持256个不同的字符编码.

ISO-8859-1编码是HTML4的默认字符集.他也支持256个不同的字符编码.

因为ANSI和ISO都有限制,所以在HTML5里默认字符编码改为了UTF-8编码.

UTF-8(Unicode:统一码)几乎覆盖了世界上的所有字符和符号.

  
所有的HTML4解析器也支持UTF-8.

HTML字符集属性

为了正确的显示HTML页面,网页浏览器必须知道页面用的什么字符集.

在<meta>标签里指定页面用什么字符集:

HTML 4:

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
Markup

HTML 5:

<meta charset="UTF-8">
Markup
  
如果浏览器在页面用的是ISO-8859-1编码,浏览器会默认为ANSI,因为ANSI和ISO-8859-1完全一样,除了ANSI有32个扩展字符.

数字所对应的字符:

数字字符
32
33!
34"
35#
36$
37%
38&
39'
40(
41)
42*
43+
44,
45-
46.
47/
480
491
502
513
524
535
546
557
568
579
58:
59;
60<
61=
62>
63?
64@
65A
66B
67C
68D
69E
70F
71G
72H
73I
74J
75K
76L
77M
78N
79O
80P
81Q
82R
83S
84T
85U
86V
87W
88X
89Y
90Z
91[
92\
93]
94^
95_
96`
97a
98b
99c
100d
101e
102f
103g
104h
105i
106j
107k
108l
109m
110n
111o
112p
113q
114r
115s
116t
117u
118v
119w
120x
121y
122z
123{
124|
125}
126~
127
128€
129
130‚
131ƒ
132„
133…
134†
135‡
136ˆ
137‰
138Š
139‹
140Œ
141
142Ž
143
144
145‘
146’
147“
148”
149•
150–
151—
152˜
153™
154š
155›
156œ
157
158ž
159Ÿ
160 
161¡
162¢
163£
164¤
165¥
166¦
167§
168¨
169©
170ª
171«
172¬
173­
174®
175¯
176°
177±
178²
179³
180´
181µ
182
183·
184¸
185¹
186º
187»
188¼
189½
190¾
191¿
192À
193Á
194Â
195Ã
196Ä
197Å
198Æ
199Ç
200È
201É
202Ê
203Ë
204Ì
205Í
206Î
207Ï
208Ð
209Ñ
210Ò
211Ó
212Ô
213Õ
214Ö
215×
216Ø
217Ù
218Ú
219Û
220Ü
221Ý
222Þ
223ß
224à
225á
226â
227ã
228ä
229å
230æ
231ç
232è
233é
234ê
235ë
236ì
237í
238î
239ï
240ð
241ñ
242ò
243ó
244ô
245õ
246ö
247÷
248ø
249ù
250ú
251û
252ü
253ý
254þ
255ÿ

ASCII字符集

ASCII用0-31(和127)用来作为控制字符

ASCII用32-126作为字母,数字和符号

ASCII不用128-255之间的数字

ANSI字符集(Windows-1252)

ANSI的0-127之间的值和ASCII完全一样.

ANSI从127到159之间的数字是专属字符集.

ANSI的160-255之间的值和UTF-8完全一样.

ISO-8859-1字符集

8859-1的0到127之间的字符和ASCII完全一样.

8859-1不用128到159之间的值

8859-1的160到255之间的字符和UTF-8完全一样.

UTF-8字符集

UTF-8的0-127之间的字符和ASCII完全一样.

UTF-8不用128到159之间的值.

UTF-8的160-255之间的字符和ANSI、8859-1完全一样.

UTF-8的256-10000有更多的不同的字符.

为了更好学习字符集,可以看我们完整的HTML字符集参考.

  
  

评论区

21技术    www.21xrx.com 备案号:蜀ICP备17043188号-2