HTMLand XHTML语言

1 view
Skip to first unread message

hang@gmail

unread,
Jun 6, 2011, 5:35:49 PM6/6/11
to dev...@googlegroups.com

一、(X)HTML语言基础

1、HTML文档基本结构
HTML文档一般都应包含两部分:头部区域和主体区域。基本结构由<html>、<head>和<body>三个标签负责组织,其中<html>标签标识HTML文档,<head>标签标识头部区域,<body>标签标识主体区域。

一个完整的HTML文档基本结构如下:

<html>   <!--语法开始-->
<head>
<!--头部信息,如<title>标签定义的网页标题-->
</head>
<body>
<!--主体信息,包含网页显示的内容-->
</body>
</html>   <!--语法结束-->


2、HTML基本语法
1)所有标签都包含在“<”“>”起止标识符中,如<body>;
2)大多数元素都有起始标签和结束标签:<tag>元素主体</tag>,少数标签不成对出现:<tag />;
3)元素属性包含属性名称和属性值:<tag a1="v1" a2="v2" ... an="vn">元素主体</tag>,少数属性可能没有属性值;
4)一般属性值应包含在引号内;
5)属性可选;
6)标签嵌套需匹配;
7)html文档所有信息须包含在<html>标签里面,所有文档元信息包含在<head>子标签里面,所有html传递信息和网页显示内容应包含在<body>子标签中;

html文档应包含:
1)首行定义文档类型;
2)<html>标签设置文档名字空间;
3)<meta>标签在<head>标签内定义文档字符编码(中文简体为gb2312,通用字符为utf-8,繁体为big5);
4)<title>标签在<head>标签内设置文档标题。

 若要增加注释性文本,可在“<!--”“-->”标识符间增加,如
<!--单行注释-->   或
<!--------------
    多行
    注释
-------------->

 
3、HTML常用标签
1)文档结构标签
<html>...</html>:标识html文档的起始和终止。
<head>...</head>:标识html文档的头部区域。
<body>...</body>:标识html文档的主体区域。

2)文本格式标签
<title>...</title>:标识网页标题。
<hi>...</hi>:标识标题文本,i=1~6,分别表示1~6级标题。
<p>...</p>:标识段落文本。
<pre>...</pre>:标识预定义文本。
<blockquote>...</blockquote>:标识引用文本。

3)字符格式标签
<b>...</b>:强调加粗。
<i>...</i>:斜体。
<blink>...</blink>:闪烁(IE不支持)。
<big>...</big>:放大。
<small>...</small>:缩小。
<sup>...</sup>:上标。
<sub>...</sub>:下标。
<cite>...</cite>:引用。

4)列表标签
<ul>...</ul>:无序列表。
<ol>...</ol>:有序列表。
<li>...</li>:列表项目。
<dl>...</dl>:定义列表。
<dt>...</dt>:词条。
<dd>...</dd>:解释。

5)链接标签
<a>...</a>:超链接,定义锚点。

6)多媒体标签
<img />:嵌入图像。
<embed>...</embed>:嵌入多媒体。
<object>...</object>:嵌入多媒体。

7)表格标签
<table>...</table>:定义表格结构。
<caption>...</caption>:定义表格标题。
<th>...</th>:定义表头。
<tr>...</tr>:定义表格行。
<td>...</td>:定义表格单元格。

8)表单标签
<form>...</form>:定义表单结构。
<input>...</input>:定义文本域、按钮和复选框。
<textarea>...</textarea>:定义多行文本框。
<select>...</select>:定义下拉列表。
<option>...</option>:定义下拉列表中的选择项目。


4、HTML公共属性
1)基本属性
class:定义类规则或样式规则。
id:定义元素的唯一标识。
style:定义元素的样式声明。

下面元素不拥有基本属性,一般位于文档头部区域,标识网页元信息:
html,head,title,base(网页基准信息),meta,param(元素参数信息),script、style(网页的脚本和样式)。

2)语言属性
lang:定义元素的语言代码或编码。
dir:定义文本方向,包括ltr和rtl取值,分别表示从左向右和从右向左。
下面元素不拥有语言语义属性:
frameset、frame、iframe(网页框架结构),br(换行标识),hr(结构装饰线),base,param,script。

3)键盘属性(浏览器兼容性不好)
accesskey:定义访问某元素的键盘快捷键。
tabindex:定义元素的Tab键索引编号。

4)内容属性
alt:替换文本。
title:提示文本。
longdesc:包含内容的大段描述信息(浏览器支持不一致,应避免使用)。
cite:包含内容的引用信息。
datetime:包含内容的日期和时间。
不能用到下列元素上:
html,head,title,base、basefont(网页基准信息),meta,param和script。


二、XHTML基础

xhtml文档与html文档的区别只是添加了xml语言的基本规范和要求。

1、xhtml文档基本结构
xhtml与html有下面两点不同:

1)定义文档类型
xhtml文档第一行新增了<!DOCTYPE>元素,该元素用来定义文档类型。
如:<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

2)声明命名空间
在xhtml文档根元素中须使用xmlns属性声明文档的命名空间。
如:<html xmlns="http://www.w3.org/1999/xhtml">


2、xhtml基本语法
1)在文档开头必须定义文档类型;
2)在根元素中声明命名空间,即设置xmlns属性;
3)所有标签都必须闭合,如果是单独不成对的标签,应在标签最后加“/”来闭合它,如<br />;
4)所有元素和属性必须小写;
5)所有属性必须用引号""括起来;
6)所有标签必须合理嵌套;
7)所有属性必须被赋值,没有值的属性就用自身来赋值,如<td nowrap="nowrap">;
8)所有特殊符号都用编码表示,如小于号<,必须被编码为 "&lt;“;
9)不能在注释内容中使用“-”;
10)xhtml规范废除了name属性,使用id属性作为统一的名称。


3、xhtml文档类型
xhtml1.0支持三种DTD(文档类型定义)声明:过渡型(Transitional)、严格型(Strict)和框架型(Frameset)。

过渡型允许在页面中使用html4.01的标签(符合xhtml语法标准),DTD语句:<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

严格型不允许使用任何表现层的标签和属性,不被支持的元素有center、font、strike、s、u、iframe、isindex、dir、menu、basefont、applet,不被支持的属性有align、language、background、bgcolor、border、height、hspace、name、noshade、nowrap、target、text、link、vlink、alink、vspace、width。DTD语句:<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">

框架型专门针对框架页面所使用的DTD,当页面中含有框架元素时,应采用框架型的DTD,DTD语句:<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Frameset//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-frameset.dtd">

目前,过渡型DTD是比较普遍的选择,因为这种DTD可以包含除Frameset元素以外的全部内容,允许使用描述性的元素和属性,也较容易通过W3C的代码校验。
 

4、DTD文档类型解析
DTD是一套关于标签的语法规则。一个DTD文档包含元素的定义规则,元素间关系的定义规则,元素可使用的属性、实体或符号规则。此外还规定了哪些标签能出现在其他标签中。文档类型不同,对应的DTD也不同。


5、名字空间:<html xmlns="http://www.w3.org/1999/xhtml">
在标准设计中,名字空间是必须设置的一个属性,用来定义该顶级元素以及其包含的各级子元素的唯一性。因为文档的根元素都是document,同时文档中包含很多相同的元素名,如果文档都在网上共享就会发生语义冲突,这就要求我们使用xmlns分别为它们定义一个名字空间,避免这种冲突的发生。通俗地说,名字空间就是给文档做一个标签,标明该文档是属于哪个网站的。对于html文档来说,由于它的元素是固定的,不允许用户进行定义,所以指定的名字空间都是http://www.w3.org/1999/xhtml

Reply all
Reply to author
Forward
0 new messages