整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:

HTML Unicode(UTF-8)参考手册

nicode 联盟(Unicode Consortium)

Unicode 联盟(Unicode Consortium)开发了 Unicode 标准(Unicode Standard)。他们的目标是使用标准的 Unicode 转换格式(即 UTF,全称 Unicode Transformation Format)取代现有的字符集。

Unicode 标准是一个成功的创举,在 HTML、XML、Java、JavaScript、E-mail、ASP、PHP 中都得到实现。Unicode 标准也得到许多操作系统和所有现代浏览器的支持。

Unicode 联盟与领先的标准开发组织合作,这些组织有 ISO、W3C 和 ECMA。


Unicode 字符集

Unicode 可以由不同的字符集实现。最常用的编码是 UTF-8 和 UTF-16:

字符集描述
UTF-8UTF8 中的字符可以是 1 到 4 字节长。UTF-8 可以代表 Unicode 标准中的任何字符。UTF-8 向后兼容 ASCII。UTF-8 是电子邮件和网页的首选编码。
UTF-1616 位 Unicode 转换格式是一种可变长度的 Unicode 字符编码,能够编码整个 Unicode 指令表。UTF-16 主要用于操作系统和环境,如 Microsoft Windows、Java 和 .NET。

提示:Unicode 的前 128 个字符(与 ASCII 一一对应)使用一个与 ASCII二进制值相同的八位组进行编码,使有效的 ASCII 文本在进行 UTF-8 编码时也是有效的。

提示:所有的 HTML 4 处理器支持 UTF-8,所有的 HTML 5 和 XML 处理器支持 UTF-8 和 UTF-16!


HTML5 标准:Unicode UTF-8

因为 ISO-8859 中字符集大小是有限的,且在多语言环境中不兼容,所以 Unicode 联盟开发了 Unicode 标准。

Unicode 标准覆盖了(几乎)所有的字符、标点符号和符号。

Unicode 使文本的处理、存储和运输,独立于平台和语言。

HTML-5 中默认的字符编码是 UTF-8。

下面列出了一些 HTML5 支持的 UTF-8 字符集:

字符集十进制十六进制
C0 控制与基本的 Latin(C0 Controls and Basic Latin)0-1270000-007F
C1 控制与 Latin-1 的补充(C1 Controls and Latin-1 Supplement)128-2550080-00FF
Latin 扩展 A(Latin Extended-A)256-3830100-017F
Latin 扩展 B(Latin Extended-B)384-5910180-024F

如果 HTML5 网页使用不同于 UTF-8 的字符,则需要在 <meta> 标签中指定,如下:

实例

<meta charset="ISO-8859-1">

如您还有不明白的可以在下面与我留言或是与我探讨QQ群308855039,我们一起飞!

tml+css基础一:html简介和发展史

HTML全称(hypertext markup language)译为超文本标记语言,其译文代表了HTML的含义,它和其他编程语言不同的是,HTML不是一门真正意义上编程语言,而是一种标记语言,通过带有尖角号的标签对文本进行标记,从而实现网页的结构搭建。

1.2、HTML发展史

HTML创始人(蒂姆·伯纳斯-李)蒂姆·伯纳斯-李除了是HTML的创始人,还是w3c组织的主席。

1、HTML1.0 (1991年12月)

1991年万维网(www)在互联网上首次露面,也随之引起了巨大的轰动。

1989年,伯纳斯-李写了一份备忘录,提出建立一个基于互联网的超文本系统。同年和另外一个工程师一起进行联合资金申请,但是这个项目并没有通过。

1991年底的时候,伯纳斯-李公开了一份“HTML Tag”的文档,里面描述了组成HTML初始版本的18个元素

2、HTML2.0(1995年11月)

HTML 2.0是HTML语言的扩展。    

与原始版本的HTML不同,HTML 2.0被创建为Web标准,规定了常见的网页结构

3、HTML3.2(1996年1月)

惨淡的"第一次浏览器大战时期(Netspace Vs IE)",两大巨头不断推出重大举措试图控制整个领域。       

网页开发者是这场战争中的焦点。商业战争就像军备竞赛,各家公司为了保持领先,招兵买马。各家都有各家的规则。         

那时候,你不得不写两份不同的网页,一个用于网景的浏览器,另一个用于微软的浏览器

4、HTML4(1997年12月)

浏览器大战接近尾声,W3C(世界万维网联盟)成立,他们打算通过制定统一的HTML标准,使整个产业能有序的发展。            

他们计划用两种语言分离出HTML的表达式(HTML 4.0)和结构(CSS),并且说服浏览器厂商接受这些标准

这次发布提供了规范的三种变体:

Strict,严格版本;

Transitional,过渡版本;

Frameset,iframe框架集;

HTML4.0 采纳了许多浏览器特定的元素类型及属性,但是同时也把 Netscape 的视觉化标记标记为过时的寻求淘汰; 赞成使用样式表; 同时在1998年4月对HTML4.0进行了微小的修订,没有增加版本号HTML5.0

5、HTML4.01(1999年12月)

像 HTML4.0 一样提供了三种变体,并且他的最终错误修订版在2001年的5月12日发布

6、XHTML 1.0(2000年1月)

各大浏览器厂商纷纷接受W3C标准的时候,新技术出现了。             

HTML和另一种语言XML融合,XHTML(可拓展的超文本标记语言)就此诞生。           

它继承了HTML的通用型和浏览器的兼容性,继承了XML的严密性和可拓展性

7、HTML5(2014 年 10 月)

HTML5是HTML最新的修订版本,由W3C制定,目标是取代1999年所制定的HTML 4.01和XHTML 1.0标准

我们现在使用的是html5版本,因为由于新兴框架的出现和浏览器兼容性的提升,让我们选择了html5。

.1 JavaScript: Hello, world!

从本讲开始,我们正式踏上了JavaScript的梦幻之旅啦!

还记得上一讲中,如何打开console调试代码吗?可以借助调试器查看代码运行结果。另一种查看运行结果的办法是使用alert,当然,这种方法不适合进行复杂调试。选择一种,开始吧!

script 标签

通常可以将JavaScript代码写在<script></script>标签内,并且script标签可以插入HTML文档的任何位置。

<!DOCTYPE HTML>
<html>
<body>
<p>之前...</p>
<script>
alert( 'Hello, world!' );
</script>
<p>...之后</p>
</body>
</html>

将代码保存为debug.html,用浏览器打开debug.html,运行结果:

标签属性

<script>标记具有一些属性,但通常情况下使用较少,仅做简单介绍:

  • 类型属性:<script type=…>

旧的HTML标准HTML4要求脚本具有类型。 通常它是type =“ text / javascript”。

但是现在不再需要了。现代HTML标准完全改变了此属性的含义。 现在,它可以用于JavaScript模块。

  • 语言属性:<script language=…>

此属性旨在显示脚本的语言。 因为JavaScript是默认语言,所以该属性不再有意义。 不需要使用它。

  • 脚本前后的注释

在比较早期的书籍和指南中,您可能会在<script>标记内找到注释,如下所示:

<script type="text/javascript"><!--
...
//--></script>

现代JavaScript不使用此技巧。 这些注释会在不知道如何处理<script>标记的旧浏览器中隐藏JavaScript代码。 由于过去15年内发布的浏览器没有此问题,因此此类注释可以帮助您识别真正的旧代码。

外部脚本

当我们有很多JavaScript代码时,则可以将其放入单独的文件中。

脚本文件通过src属性附加到HTML:

<script src="/path/to/script.js"></script>

在这里,/path/to/script.js是从站点根目录到脚本的绝对路径。 您还可以提供当前页面的相对路径。 例如,src =“ script.js”表示当前文件夹中的文件“ script.js”。

我们也可以提供完整的URL。 例如:

<script src="https://your.domain.com/libs/jquery.js"></script>

要附加多个脚本,则可以使用多个标签:

<script src="/js/script1.js"></script>
<script src="/js/script2.js"></script>
…

小窍门:通常,仅将最简单的脚本放入HTML。 更复杂的文件位于单独的文件中。单独文件的好处是浏览器将下载该文件并将其存储在其缓存中。引用同一脚本的其他页面将从缓存中获取而不是下载它,因此该文件实际上仅下载了一次。这样可以减少访问量并使页面更快。

注意:如果设置了src,则脚本内容将被忽略。单个<script>标签不能同时包含src属性和代码。

<script src="file.js">
alert(1); // 这里的代码将被忽略,因为src设置了文件
</script>

我们必须选择带有代码的外部<script src =“…”>或常规的<script>。上面的示例可以分为两个脚本工作:

<script src="file.js"></script>
<script>
alert(1);
</script>

本讲小结

  • 我们可以使用<script>标记将JavaScript代码添加到页面。
  • 类型和语言属性不是必需的。
  • 可以使用<script src =“ path/to/script.js”> </ script>插入外部文件中的脚本。

小练习

  • 创建一个页面,显示“我爱JavaScript!”。
  • 通过将脚本内容提取到位于同一文件夹中的外部文件alert.js中进行修改。