2分钟了解 HTML 的基本结构和语法规则

TML 是一种标记语言，用于创建网页和应用程序。它的基本结构由以下三个部分组成：

文档类型声明（doctype declaration），用来告诉浏览器文档的版本和规范。它以 <!DOCTYPE html> 开头，表示文档遵循 HTML5 标准。
html 标签（html tag），用来包含整个文档的内容。它以 <html> 开始，以 </html> 结束。它还可以包含一个 lang 属性，用来指定文档的主要语言。
head 和 body 标签（head and body tags），用来分别包含文档的元数据（metadata）和可见内容（visible content）。head 标签以 <head> 开始，以 </head> 结束。它可以包含一些不显示在网页上的信息，比如标题、字符集、样式表等。body 标签以 <body> 开始，以 </body> 结束。它可以包含一些显示在网页上的内容，比如文本、图片、视频、表单等。

一个 HTML 的基本结构示例如下：

*******HTML********

**Web服务本质**

import socket

sk = socket.socket()

sk.bind(("127.0.0.1", 8080))

sk.listen(5)

while True:

conn, addr = sk.accept()

data = conn.recv(8096)

conn.send(b"HTTP/1.1 200 OK\r\n\r\n")#http协议简化

conn.send(b"<h1>Hello world!</h1>")#发送内容

conn.close()

sk.close()

浏览器发送请求-->HTTP协议-->服务器接受请求-->服务端返回响应-->服务端把HTML文件内容发送给浏览器-->浏览器渲染页面

What HTML?

*超文本标记语言（Hypertext Markup Language，HTML）是一种用于创建网页标记语言

*本质上是浏览器可识别的规则，我们按照规则写网页，浏览器根据规则渲染我们的页面。

对于不同的浏览器，对于同一个标签可能会有不同的解释。（兼容性问题）

*网页文件的扩展名：.html或.htm

*HTML是一种标记语言，他不是一种编程语言，HTML使用标签来描述网页。

****HTML文档结构****

*最基本的HTML文档**

<!DOCTYPE html>

<head>

</head>

<body>

</body>

</html>

#解释

1.<!DOCTYPE html>声明为HTML5文档

2.<html></html>是文档的开始标记语言和结束标记，是HTML页面的根本元素，在他们之间是文档的头部(head)和主题(body)

3.<head></head>定义了HTML文档的开头部分。他们之间的内容不会在浏览器的文档窗口显示。包含了文档的元（meta）数据

4.<title></title>定义了网页标题，在浏览器标题栏显示

5.<body></body>之间的文本是可见的网页主体内容

注意：

对于中文网页需要使用<meta charset='utf-8'>声明编码。否则会出现乱码。这些浏览器会设置GBK为默认编码，则需要我们设为

****HTML标签格式****

*HTML标签是由尖括号包围的关键字

*HTML标签通常是成对出现的，比如：<div>和</div>，第一个标签是开始，第二个标签是结束。结束标签会有斜线。

*也有一部分标签是单独呈现的，比如：<br/>、<hr/>、<img src="1.jpg" />等。

*标签里面可以有若干属性，也可以不带属性。

****标签的语法

<标签名属性1=“属性值1” 属性2=“属性值2”……>内容部分</标签名>

<标签名属性1=“属性值1” 属性2=“属性值2”…… />

几个很重要的属性：

id：定义标签的唯一ID，HTML文档树中唯一

class：为html元素定义一个或多个类名（classname）(CSS样式类名)

style：规定元素的行内样式（CSS样式

****HTML注释

****<!DOCTYPE>标签****

<!DOCTYPE> 声明必须是HTML文档的第一行，位于<html>标签之前

<!DOCTYPE> 声明不是HTML标签，他是指示web浏览器关于页面使用哪个HTML版本进行编写的指令

****HTML常用标签****

**head内常用的标签**

1.<title></title> 定义网页的标题

2.<style></style> 定义内部样式表

3.<script><script>定义JS代码或引入外部JS文件

4.<link/> 引入外部样式文件

5.<meta/>定义网页原信息

****Meta标签

Meta标签介绍：

meta标签的组成：meta标签共有两个属性，它们分别是http-equiv属性和name 属性，不同的属性又有不

同的参数值，这些不同的参数值就实现了不同的网页功能。

1.http-equiv属性：相当于http的文件头作用，它可以向浏览器传回一些有用的信息，以帮助正确地显示

网页内容，与之对应的属性值为content，content中的内容其实就是各个参数的变量值。

2.names属性：主要用于描述网页，与之对应的属性值为content，content中的内容主要是便于搜索引擎

机器人查找信息和分类信息用的

******body内常用表标签******

****基本标签（块级标签和内联标签）****

<br>

<hr>

****特殊字符****

空格------

>-------->

<--------<

&--------&

￥--------¥

版权(©️)---©

****div标签和span标签****

div标签用来定义一个块级元素，并无实际的意义。主要通过CSS样式为其赋予不同的表现。

span标签用来定义内联(行内)元素，并无实际的意义。主要通过CSS样式为其赋予不同的表现。

块级元素与行内元素的区别：

所谓块元素，是以另起一行开始渲染的元素，行内元素则不需另起一行。如果单独在网页中插入这两个元素，不会对页面产生任何的影响。

这两个元素是专门为定义CSS样式而生的。

注意：

关于标签嵌套：通常块级元素可以包含内联元素或某些块级元素，但内联元素不能包含块级元素，它只能包含其它内联元素。

p标签不能包含块级标签，p标签也不能包含p标签。

****img标签****

****a标签****

超链接标签

所谓的超链接是指从一个网页指向一个目标的连接关系，这个目标可以是另一个网页，

也可以是相同网页上的不同位置，还可以是一个图片，一个电子邮件地址，一个文件，

甚至是一个应用程序。

什么是URL？

URL是统一资源定位器(Uniform Resource Locator)的缩写，也被称为网页地址，是因特网上标准的资源的地址。

URL举例

http://www.baidu.com/stu/index.html

http://111.13.100.91/stu/index.html

URL地址由4部分组成

第1部分：为协议：http://、ftp://等

第2部分：为站点地址：可以是域名或IP地址

第3部分：为页面在站点中的目录：stu

第4部分：为页面名称，例如 index.html

各部分之间用“/”符号隔开。

href属性指定目标网页地址。该地址可以有几种类型：

1.绝对URL-指向另一个站点（不如 href = 'https://www.baidu.com'）

2.相对URL-指向当前站点中确切的路径（href = 'index.html'）

3.锚URL-指向页面中的锚（href = '#top'）

target:

1._blank表示在新标签页中打开目标页面

2._self表示在当前标签页中打开目标页面

****列表*****

1.无序列表

</ul>

type属性：

1.disc（实心圆点，默认值）

2.circle（空心圆圈）

3.square（实行方块）

4.none（无样式）

2.有序列表

</ol>

type属性：

1.1数字列表，默认值

2.A大写字母

3.a小写字母

4.I大写罗马

5.i小写罗马

3.标题列表

<dl>

</dl>

****表格****

表格是一个二维数据空间，一个表格由若干行组成，一行又有若干单元格组成，单元格里面可以

包括文字。列表。图案。表单。数字符号。预置文本和其它的表格等内容。

表格最重要的目的是显示表格类数据。

表格类数据是值最适合组织为表格格式（即按行和列组织）的数据

表格基本结构：

<table>

<thead>

<tr>

</tr>

</theaf>

<tbody>

<tr>

</tr>

<tr>

</tr>

</tbody>

</table>

属性：

1.border：表格边框

2.cellpadding：内边距

3.cellspacing：外边距

4.width：像素百分比（最好通过css来设置长度）

5.rowspan：单元格竖跨多少行

6.colspan：单元格横跨多少列（即合并单元格）

****form（表单）****

功能；

表单用于向服务器传输数据，从而实现用户与web服务器的交互

表单能够包含input系列标签，比如文本字段、复选框、单选框、提交按钮等等

表单还可以包含textarea、select、fieldest和lable标签

***表单属性

1.accept-charset 规定在被提交表单中使用的字符集（默认：页面字符集）

2.action 规定在何处提交表单的地址（URL）（提交页面）

3.autocomplete 规定浏览器应该自动完成表单（默认：开启）

4.enctype 规定被提交数据的编码（默认：url-encoded）

5.method 规定在提交表单时所用的HTTP方法（默认GET）

6.name 规定识别表单的名称（对于DOM使用：document.forms.name）

7.novalidate规定浏览器不验证表单

8.target规定action属性中地址的目标（默认_self）

***表单元素

基本概念：

HTML表单是HTML元素中较为复杂的部分，表单往往和脚本、动态页面、数据处理等功能相结合，因此它是制作动态网站很重要的内容。

表单一般用来收集用户的输入信息

表单工作原理：

访问者在浏览有表单的网页时，可填写必需的信息，然后按某个按钮提交。这些信息通过Internet传送到服务器上。

服务器上专门的程序对这些数据进行处理，如果有错误会返回错误信息，并要求纠正错误。

当数据完整无误后，服务器反馈一个输入完成的信息。

******input******

<input>元素会根据不同的type属性，变化为多种形态

type属性值表现形式对应代码

text单行输入文本<input type="text" />

password密码输入框<input type="password" />

date日期输入框<input type="date" />

checkbox复选框<input type="checkbox" checked="checked" />

radio单选框<input type="radio" />

submit提交按钮<input type="submit" value="提交" />

reset重置按钮<input type="reset" value="重置" />

button普通按钮<input type="button" value="普通按钮" />

hidden隐藏输入框<input type="hidden" />

file文本选择框<input type="file" />

属性说明：

1.name：表单提交时的“键”，注意和id的区别

2.value：表单提交时对应项的值

type = “button”，“reset”，“submit”时，为按钮上显示的文本信息

type = “text”，“password”，“hidden“时，为输入框的初始值

type = ”checkbox“，”radio“，”file“时，为输相关联的值

3.checked：radio和checkbox默认被选中的项

4.readonly：text和password设置只读

5.disabled：所有input均适用

******select标签******

</select>

</form>

属性说明：

1.multiple：布尔属性，设置后为多选，否则默认单选

2.disabled：禁用

3.selected：默认选中该项

4.value：定义提交时的选项值

******lable标签******

定义：<lable>标签为input元素定义标注（标记）

说明：

1.label元素不会向用户呈现任何特殊效果

2.<lable>标签的for属性值应当与相关元素的id属性值相同

<form>

</form>

******textarea多行文本******

默认内容

</textarea>

属性说明：

1.name:名称

2.rows:行数

3.cols:列数

4.disable:禁用

文本标记语言（英语：HyperText Markup Language，简称：HTML）是一种用于创建网页的标准标记语言。HTML是一种基础技术，常与CSS、JavaScript一起被众多网站用于设计令人赏心悦目的网页、网页应用程序以及移动应用程序的用户界面。网页浏览器可以读取HTML文件，并将其渲染成可视化网页。HTML描述了一个网站的结构语义随着线索的呈现，使之成为一种标记语言而非编程语言。

HTML元素是构建网站的基石。HTML允许嵌入图像与对象，并且可以用于创建交互式表单，它被用来结构化信息——例如标题、段落和列表等等，也可用来在一定程度上描述文档的外观和语义。HTML的语言形式为尖括号包围的HTML元素（如<html>），浏览器使用HTML标签和脚本来诠释网页内容，但不会将它们显示在页面上。

HTML可以嵌入如JavaScript的脚本语言，它们会影响HTML网页的行为。网页浏览器也可以引用层叠样式表（CSS）来定义文本和其它元素的外观与布局。维护HTML和CSS标准的组织万维网联盟（W3C）鼓励人们使用CSS替代一些用于表现的HTML元素。

历史

W3C制作的早期HTML标志

发展

蒂姆·伯纳斯-李

1980年，物理学家蒂姆·伯纳斯-李在欧洲核子研究中心（CERN）在承包工程期间，为使CERN的研究人员使用并共享文档，他提出并创建原型系统ENQUIRE。1989年，伯纳斯-李在一份备忘录中提出一个基于互联网的超文本系统。他规定HTML并在1990年底写出浏览器和服务器软件。同年，伯纳斯-李与CERN的数据系统工程师罗伯特·卡里奥联合为项目申请资助，但未被CERN正式批准。在他的个人笔记中伯纳斯-李列举“一些使用超文本的领域”，并把百科全书列为首位。

HTML的首个公开描述出现于一个名为“HTML标签”的文件中，由蒂姆·伯纳斯-李于1991年底提及。它描述18个元素，包括HTML初始的、相对简单的设计。除了超链接标签外，其他设计都深受CERN内部一个以标准通用标记语言（SGML）为基础的文件格式SGMLguid的影响。这些元素在HTML 4中仍有11个存在。

伯纳斯-李认为HTML是SGML的一个应用程序。1993年中期互联网工程任务组（IETF）发布首个HTML规范的提案：“超文本标记语言（HTML）”互联网草案，由伯纳斯-李与丹·康纳利（英语：Dan Connolly (computer scientist)）撰写。其中包括一个SGML文档类型定义来定义语法。草案于6个月后过期，不过值得注意的是其对NCSA Mosaic浏览器自定义标签从而将在线图像嵌入的行为的认可，这反映IETF把标准立足于成功原型的理念。同样，戴夫·拉格特（英语：Dave Raggett）在1993年末提出的与之竞争的互联网草案“HTML+（超文本标记格式）”建议规范已经实现的功能，如表格与填写表单。

在HTML和HTML+的草案于1994年初到期后，IETF创建一个HTML工作组，并在1995年完成"HTML 2.0"，这是第一个旨在成为对其后续实现标准的依据的HTML规范。

在IETF的主持下，HTML标准的进一步发展因竞争利益而遭受停滞。自1996年起，HTML规范一直由万维网联盟（W3C）维护，并由商业软件厂商出资。不过在2000年，HTML也成为国际标准（ISO/ IEC15445：2000）。HTML 4.01于1999年末发布，进一步的勘误版本于2001年发布。2004年，网页超文本应用技术工作小组（WHATWG）开始开发HTML5，并在2008年与W3C共同交付，2014年10月28日完成标准化。

版本时间线

1995年11月24日

HTML 2.0作为IETF RFC 1866发布。追加RFC的附加功能：

1995年11月25日：RFC 1867（基于表单的文件上传）

1996年5月：RFC 1942（表格）

1996年8月：RFC 1980（客户端图像映射）

1997年1月：RFC 2070（国际化）

1997年1月14日

HTML 3.2作为W3C推荐标准发布。这是首个完全由W3C开发并标准化的版本，因IETF于1996年9月12日关闭它的HTML工作组。

最初代号为“威尔伯”（Wilbur），HTML 3.2完全去除数学公式，协调各种专有扩展，并采用网景设计的大多数视觉标记标签。由于两家公司达成了协议，网景的闪烁元素（英语：blink element）和微软的滚动元素（英语：marquee element）被移除。HTML对数学公式的支持最后成为另外一种被称为MathML的标准。

1997年12月18日

HTML 4.0作为W3C推荐标准发布。它提供三种变化：

严格，过时的元素被禁止。

过渡，过时的元素被允许。

框架集，大多只与框架相关的元素被允许。

最初代号“美洲狮”（Cougar）， HTML 4.0采用许多特定浏览器的元素类型和属性，并试图淘汰网景的视觉标记功能，将其标记为不赞成使用。HTML 4是遵循ISO 8879 - SGML的SGML应用程序。

1998年4月24日

HTML 4.0进行微调，不增加版本号。

1999年12月24日

HTML 4.01作为W3C推荐标准发布。它同样提供三种变化，最终勘误版于2001年5月12日发布。

2000年5月

ISO/IEC 15445:2000（"ISO HTML"，基于HTML 4.01严格版）作为ISO/IEC国际标准发布。在ISO中这一标准位于ISO/IEC JTC 1/SC 34（英语：ISO/IEC JTC 1/SC 34）域（ISO/IEC联合技术委员会1、小组委员会34 – 文档描述与处理语言）。

2014年10月28日

HTML 5作为W3C推荐标准发布。

草案时间线

HTML5的Logo

1991年10月

HTML标签，一个非正式CERN文件首次公开18个HTML标签。

1992年6月

HTML DTD的首个非正式草案，后续有七个修订版（7月15日，8月6日，8月18日，11月17日，11月19日，11月20日，11月22日）。

1992年11月

HTML DTD 1.1（首个版本号，基于RCS修订版，版本号从1.1开始而非1.0），非正式草案。

1993年6月

超文本标记语言由IETF IIIR工作小组作为互联网草案（一个粗略的建议标准）。在被第二版代一个月后，IETF又发布6个草案，最终在RFC1866中发布HTML 2.0。

1993年11月

HTML+由IETF作为互联网草案发布，是超文本标记语言草案的一个竞争性提案。它于1994年5月到期。

1995年4月（1995年3月编写）

HTML 3.0[33]被提议作为IETF的标准，但直到提案在五个月过期后（1995年9月28日）仍没有进一步的行动。它包含许多拉格特HTML+提案的功能，如对表格的支持、围绕数据的文本流和复杂的数学公式的显示。W3C开始开发自己的Arena浏览器作为HTML 3和层叠样式表的试验台（英语：Test bed），但HTML 3.0并没有获得成功。浏览器厂商，包括微软和网景，选择实现HTML3草案功能的不同子集并引入它们自己的插件（见浏览器大战）。

2008年1月

HTML5由W3C作为工作草案（链接）发布。虽然HTML5的语法非常类似于SGML，但它已经放弃任何成为SGML应用程序的尝试，除了一种替代的基于XML的HTML5序列，它已明确定义自己的“HTML”序列。

2011年 HTML5 – 最终征求

2011年5月，工作小组将HTML5推进至“最终征求”（Last Call）阶段，邀请W3C社区内外人士以确认本规范的技术可靠性。W3C开发一套综合性测试套件来实现完整规范的广泛交互操作性，完整规范的目标日期为2014年。2011年1月，WHATWG将其“HTML5”活动标准重命名为“HTML”。W3C仍然继续其发布HTML5的项目。

2012年 HTML5 – 候选推荐

2012年7月，WHATWG和W3C的工作产生一定程度的分离。W3C继续HTML5规范工作，重点放在单一明确的标准上，这被WHATWG称为“快照”。WHATWG组织则将HTML5作为一个“活动标准”（Living Standard）。活动标准的概念是从未完成但永远保持更新与改进，可以添加新特性，但功能点不会被删除。

2012年12月，W3C指定HTML5作为候选推荐阶段。该阶段的标准为“两个100％完成，完全实现交互操作”。

2014年 HTML5 – 提案推荐与推荐

2014年9月，HTML5进入提案推荐阶段。

2014年10月28日，HTML5作为稳定W3C推荐标准发布，这意味着HTML5的标准化已经完成。

XHTML版本

XHTML是使用XML 1.0改写自HTML 4.01的独立语言。它不再被作为单独标准开发。

XHTML 1.0， 2000年1月26日作为W3C推荐标准发布。修订版于2002年8月1日发布，它提供与HTML 4.0和4.01相同的三个变化，这些变化被重新在XML中制定。

XHTML 1.1，基于XHTML 1.0 严格版，2001年5月31日作为W3C推荐标准发布。修订版可使用模块化XHTML的模块，2001年4月10日作为W3C推荐标准发布。

XHTML 2.0为工作草案，但为支持HTML5与XHTML5的工作，此草案被放弃。 XHTML 2.0与XHTML 1.x不兼容，因此更确切的说这是一个XHTML风格的新语言而不是XHTML 1.x的更新。

在HTML5草案中规定一个XHTML语法，称为“XHTML5.1”。

标记

HTML标记包含标签（及其属性）、基于字符的数据类型、字符引用和实体引用等几个关键部分。HTML标签是最常见的，通常成对出现，比如<h1>与</h1>。这些成对出现的标签中，第一个标签是开始标签，第二个标签是结束标签。两个标签之间为元素的内容，有些标签没有内容，为空元素，如<img>。

HTML另一个重要组成部分为文档类型声明（英语：document type declaration），这会触发标准模式渲染。

以下是一个经典的Hello World程序的例子：

<!DOCTYPE html>

<html>

<head>

<title>This is a title</title>

</head>

<body>

<p>Hello world!</p>

</body>

</html>

<html>和</html>之间的文本描述网页，<body>和</body>之间的文本为可视页面内容。标记文本<title>This is a title</title>定义了浏览器的页面标题。

文档标记类型<!DOCTYPE html>用于HTML5。如果未进行声明，浏览器会使用“怪异模式”进行渲染。

元素

HTML文档由嵌套的HTML元素构成。它们用HTML标签表示，包含于尖括号中，如<p>

在一般情况下，一个元素由一对标签表示：“开始标签”<p>与“结束标签”</p>。元素如果含有文本内容，就被放置在这些标签之间。

在开始与结束标签之间也可以封装另外的标签，包括标签与文本的混合。这些嵌套元素是父元素的子元素。

开始标签也可包含标签属性。这些属性有诸如标识文档区段、将样式信息绑定到文档演示和为一些如<img>等的标签嵌入图像、引用图像来源等作用。

一些元素如换行符<br>，不允许嵌入任何内容，无论是文字或其他标签。这些元素只需一个单一的空标签（类似于一个开始标签），无需结束标签。

许多标签是可选的，尤其是那些很常用的段落元素<p>的闭合端标签。HTML浏览器或其他媒介可以从上下文识别出元素的闭合端以及由HTML标准所定义的结构规则。这些规则非常复杂，不是大多数HTML编码人员可以完全理解的。

因此，一个HTML元素的一般形式为：<tag attribute1="value1" attribute2="value2">''content''</tag>。一些HTML元素被定义为空元素，其形式为<tag attribute1="value1" attribute2="value2">。空元素不能封装任何内容。例如<br>标签或内联标签<img>。一个HTML元素的名称即为标签使用的名称。注意，结束标签的名称前面有一个斜杠“/”，空元素不需要也不允许结束标签。如果元素属性未标明，则使用其默认值。

例子

HTML文档的页眉：<head>...</head>。标题被包含在头部，例如：

<head>

<title>The Title</title>

</head>

标题：HTML标题由<h1>到<h6>六个标签构成，字体由大到小递减：

<h1>Heading level 1</h1>

<h2>Heading level 2</h2>

<h3>Heading level 3</h3>

<h4>Heading level 4</h4>

<h5>Heading level 5</h5>

<h6>Heading level 6</h6>

段落：

换行：<br>。<br>与<p>之间的差异是br换行但不改变页面的语义结构，而p部分的页面成段。

链接：使用<a>标签来创建链接。href属性包含链接的URL地址。

<a href="https://zh.wikipedia.org/">中文維基百科的連結！</a>

注释：

注释有助于理解标记，但它不会在网页上显示。

HTML中存在以下几种类型的标记元素：

用于文本的结构式标记

例如，<h2>羽毛球</h2>将“羽毛球”定义为二级标题。结构式标记不指示任何特定的渲染，但大多数网页浏览器都会采用元素格式的默认样式。要在内容上实现进一步的风格可以使用层叠样式表（CSS）。

用于文本外观的表现式标记，不论其目的

例如，<b>粗体</b>表示视觉输出设备应将文本“粗体”加粗，但如果设备无法做到这一点（如朗读文本的听觉设备），就不会发生什么现象。在这种情况下，<b>粗体</b>与''斜体''也可能有相同的视觉效果，但在本质上它们更加语义化。如同<strong>加强文字</strong>与<em>强调文字</em>的区别。为支持CSS的使用，大多数表现式标记在HTML 4.0规范中不再被推荐使用。

超文本标记使文档的一部分链接到其他文档

锚元素在文档中创建超链接，其href属性设置链接的目标URL。例如：HTML标记<a href="https://zh.wikipedia.org/">中文维基百科</a>会将文字"中文维基百科"渲染为超链接。要将图片渲染为超链接，img元素要作为内容插入到a元素中：<a href="https://example.org"><img src="image.gif" alt="说明文字" width="50" height="50" border="0"></a>。

属性

大多数元素的属性以“名称-值”的形式成对出现，由“=”分离并写在开始标签元素名之后。值一般由单引号或双引号包围，有些值的内容包含特定字符，在HTML中可以去掉引号（XHTML不行）。不加引号的属性值被认为是不安全的[58]。有些属性无需成对出现，仅存在于开始标签中即可影响元素[6]，如img 元素的ismap 属性。

许多元素存在一些共通的属性：

id属性为元素提供了在全文档内的唯一标识。它用于识别元素，以便样式表可以改变其表现属性，脚本可以改变、显示或删除其内容或格式化。对于添加到页面的URL，它为元素提供了一个全局唯一标识，通常为页面的子章节。例如，ID "属性"对于https://zh.wikipedia.org/wiki/HTML#属性

class属性提供一种将类似元素分类的方式。常被用于语义化或格式化。例如，一个HTML文档可指定类<class="标记">来表明所有具有这一类值的元素都从属于文档的主文本。格式化后，这样的元素可能会聚集在一起，并作为页面脚注而不会出现在HTML代码中。类属性也被用于微格式的语义化。类值也可进行多声明。如<class="标记重要">将元素同时放入標記与重要两类中。

style属性可以将表现性质赋予一个特定元素。比起使用id或class 属性从样式表中选择元素，“style”被认为是一个更好的做法，尽管有时这对一个简单、专用或特别的样式显得太繁琐。

title属性用于给元素一个附加的说明。大多数浏览器中这一属性显示为工具提示（英语：Tooltip）。

lang属性用于识别元素内容的语言，它可能与文档的主要语言不同。例如，在中文文档中：

<p>法语<span lang="fr">c'est la vie</span>在法国的应用很普遍，意为“这就是生活” 。<p>

缩写元素abbr可用于说明一些属性：

这个例子显示为HTML；在大多数浏览器中，光标指向缩写时会显示标题文字“超文本标记语言”。

大多数元素采用与语言相关的属性dir 来指定文字方向，如 "rtl"采用从右到左的文本，比如阿拉伯语、波斯语以及希伯来语。

字符与实体引用

参见：XML与HTML字符实体引用列表和Unicode与HTML

在4.0版本中，HTML定义了一系列共252个字符实体引用和1,114,050个字元值参考。二者都支持单个字符通过简单的标记写入。文字字符与其对应的标记渲染的效果相同。

用这种方式“转义”字符的能力允许字符<与&（当分别被写作<和&时）被理解为字符数据而不是标记。例如<通常为标签的开头，&通常为字符实体引用与数字字符引用的开头；&或&或&将&作为元素的内容或属性的值。双引号字符"在不被用于属性值的标示时必须转义为"或"或"；相等地，当于单引号字符'不被用于属性值的标示时，也必须转义为'或'（或HTML5与XHTML文档中的'）。

如果文档作者忽略了转义这样的字符，一些浏览器会尝试通过上下文猜测他们的意图。如果结果仍为无效标记，这会使其他浏览器或用户代理难以访问到该文档，并使它们尝试使用搜索和索引来解析该文档。

那些难以输入或不在该文档字符编码中的字符也可通过转义来实现。例如通常只在西欧或南美的键盘出现的重音符e（é），可以在HTML文档中用作实体引用é 或数字引用é或é。诸如UTF-8的Unicode字符编码与所有的现代浏览器兼容并允许直接访问全球书写系统几乎所有的字符。

数据类型

HTML为元素内容定义了多种数据类型，如脚本数据、样式表数据以及许多属性值的类型，包括ID、名称、URI、数字长度单位、语言、媒体描述符颜色、字符编码、日期和时间等等。所有这些数据类型都是字符数据的特殊化。

文档类型声明

HTML文档需要以文档类型声明（英语：document type declaration）（英语非正式说法“doctype”）开头。在浏览器中，文档类型声明有助于确定渲染模式——特别是是否使用怪异模式。

文档类型声明的初衷是通过基于文档类型定义（DTD）的SGML工具来解析并验证HTML文档。

HTML5未定义DTD，所以在HTML5中文档类型声明更为简短：

<!DOCTYPE html>

HTML 4文档类型声明举例：

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">

该声明引用HTML 4.01“严格”版的DTD。基于SGML的验证器可读取DTD，正确解析这些文档并执行验证。在现代浏览器中，一个有效的文档类型激活标准模式有别于怪异模式。

另外，HTML 4.01提供过渡型与框架集型的DTD。过渡型涵盖最广，它可整合当前以及老旧或“过时”的标签，而严格型DTD排除了过时的标签。框架集拥有所有构建框架所需的标签以及过渡型的标签。

语义化HTML

语义化HTML是一种编写HTML的方式，它强调编码信息的含义在其格式（样子）之上。HTML从创立之初就包括语义化标记，但也包括标识性标记如<font>、<i>和<center>标签。也存在一些语义上中立的span与div标签。自1990年代末层叠样式表开始应用于大多数浏览器，网页制作者就被鼓励使用CSS以便呈现与内容分离。

在2001年一次对语义网的讨论中，蒂姆·伯纳斯-李等人给出了一种的方法，使智能软件“代理人”可能有一天会自动抓取网页进行查找、过滤并将之前不相关的联系起来。这种代理甚至在现在也不普遍，但一些Web 2.0、混搭和价格比较网站的想法可能会结束。这些网页应用程序的混合与伯纳斯-李的语义代理人的之间主要区别基于以下事实：当前的聚合与信息混合通常由网页开发者设计，他们早已知道网络位置和他们希望混搭、比较与结合的特定数据的API语义。

网页代理的一个重要类型是网络爬虫或搜索引擎蜘蛛。这些软件代理依赖于它们发现的网页的语义清晰度，因为它们一天要使用各种技术与算法来读取和索引数百万个网页并给网页用户提供搜索工具，没有这些万维网的有效性就会大大降低。

为使搜索引擎蜘蛛评估它们在HTML文档中发现的文本片段的重要性，也为那些创建标记等混合的人与更多的自动化代理工具，HTML中的语义结构需要广泛一致地应用从而将文本的含义呈现给浏览者。

表示性标记在当前的HTML和XHTML推荐中不被鼓励使用，HTML5中则被视为非法。

好的语义化HTML也改善了网页文档的可访问性。例如，当屏幕阅读器或音频浏览器可以正确判定一个文档的结构时，视觉障碍用户不会再因阅读重复或无关的信息而浪费时间。

分发

HTML文档分发的方法和其他计算机文件相同。不过，它们最常通过网页服务器的超文本传输协议或电子邮件传输。

HTTP

万维网主要由从服务器通过HTTP协议向浏览器发送的HTML文档组成。但是，HTTP也可以被用于传输HTML之外的数据，例如图像、声音和其他内容。为使浏览器了解如何处理接收到的文档，在传输文档时必须同时传递文件类型。这种元数据包含MIME类型（对于HTML 4.01或更早版本是text/html，而对于XHTML 1.0或之后的版本是application/xhtml+xml），以及字符编码（参见HTML字符编码方式）。

在现在的浏览器中，和HTML文档一起发送的MIME类型影响文档的解读方式。和XHTML MIME类型一起发送的文档被认为是良构的XML，而语法错误会导致浏览器无法呈现文档。完全相同的文档如果和HTML MIME类型一起发送，则可能被正常显示，因为浏览器对HTML的语法检查更加松懈些。

W3C的推荐指出，遵循规定的推荐指引的XHTML 1.0文档可标记二者任一的MIME类型。XHTML 1.1还指出，XHTML 1.1文档应标有两种MIME类型。

HTML邮件

大多数图形电子邮件客户端允许使用HTML的子集（经常界限不清）提供格式化和无法使用纯文本的语义标记。这可能包括印刷信息，如彩色标题、强调和引用文本、内嵌图片和图表等。许多这样的客户包含一个编写HTML电子邮件消息的图形用户界面编辑器和一个用于显示的渲染引擎。在邮件中使用HTML受到了一些兼容性的批评，由于一些盲人或具有视觉障碍的人的访问问题，这种方式有利于伪装的钓鱼攻击。因其消息大小超过明文，所以它可混淆垃圾邮件过滤器。

命名规则

最常用的计算机文件扩展名为.html，通用缩写为.htm。它起源于某些早期操作系统与文件系统，如DOS以及FAT数据结构的局限性，它将文件扩展名限制为3个字母。

HTML应用程序

HTML应用程序（HTA；文件扩展名".hta"）是一个Microsoft Windows应用程序，它在浏览器中使用HTML和动态HTML提供应用程序图形界面。正规HTML文件被限制在浏览器的安全模型中，只能分别通过网页服务器和网页对象与站点Cookie进行通信和操作。HTA作为完全受信任的应用程序运行，因此拥有更多的权限，如创建/编辑/删除文件与注册表项。因为它们在浏览器安全模式之外操作，所以HTA不能通过HTTP执行，必须下载（就像EXE文件）并在本地文件系统执行。

所见即所得编辑器

所见即所得编辑器使用图形用户界面（GUI）显示HTML文档，常常类似于文字处理器，所以用户可以设计一切。编者面对的是文档，而不是代码，所以作者并不需要太多的HTML知识。这种所见即所得的编辑模式一直受到诟病，主要因为它生成的代码质量不高；也有人主张将其改变至WYSIWYM模型（所见即所指）。

在线咨询

上一篇：一首纯AI制作的歌曲，由GPT4作词AI作曲MJ作图
下一篇：HTML <base> 标签

您的项目需求

*请认真填写需求信息，我们会在24小时内与您取得联系。

整合营销服务商

2分钟了解 HTML 的基本结构和语法规则

您的项目需求