XML入门教程:XHTM


XHTML是W3C推荐的一种标准,它定义了一种与XML兼容的HTML版本。XHTML文档是一个有效的XML文档,所以编写格式比HTML严格。
XHTML是W3C推荐的一种标准,它定义了一种与XML兼容的HTML版本。XHTML文档是一个有效的XML文档,所以编写格式比HTML严格。如果需从HTML文档转换成XHTML文档,需作以下更改:
本文由来客网(https://www.laike.net)整理发布!转载请注明出处,谢谢!

    在XHTML中不允许省略结束标签,所以需补齐缺少的标签。
    元素需按正确的顺序嵌套。
    所有元素和属性的名称都采用小写。
    属性值需添加引号,如<p align="center">。
    所有属性都需有属性值。
    采用&和<等的实体形式表示这些字符。
    确保文档有单一根元素,最好用html。
    像<hr>这样的空元素要改成<hr/>或<hr><hr/>。
    注释应由<! 注释 >的形式改成<!-- 注释 -->。
    文档编码应采用UTF-8或UTF-16,或者添加XML声明指定文档的编码方式。
    需去掉非标准的元素。如:marguee。
    添加一个DOCTYPE声明,用PUBLIC来指向XHTML的三种DTD中的一种。分别是Strict、Transitional和Frameset,一般使用Strict。

      Strict(严格型),W3C推荐的XHTML形式。不包括一些非标准的元素和属性,如applet和center等。声明方式如下:
      <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
      Transitional(过渡型),一种不太严格的XHTML格式,可使用一些非标准的元素和属性,如applet和bgcolor等。声明方式如下:
      <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
      Frameset(框架型),与过渡型DTD类似,允许使用与框架相关的元素,如frameset和iframe。声明方式如下:
      <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-frameset.dtd">
      文档的根元素必须具有xmlns属性,标识缺省的名称空间提http://www.w3.org/1999/xhtml。
      下面是一个标准的XHTML文档的示例:
      <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> <html xmlns:"http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-type" content="text/html; charset=UTF-8"> <title>xhtml example</title> </head> <body> ... </body> </html>
      由HTML转到XHTML是一种枯燥而乏味的工作,现在有一种叫tidy的开源工具可帮我们完成大部份的工作,它是一个C程序,使用方法如下:
      % tidy --output-xhtml yes test.html test.xml
      XHTML 1.1把XHTML的三种DTD分成独立模块。我们可根据实际情况包含或省去某些模块。这些模块是:本文由来客网(https://www.laike.net)整理发布!转载请注明出处,谢谢!

        Structure Module(结构模块)--->%xhtml-struct.module;,包含HTML文档主要的元素,如:html、head、title和body。
        Text Module(文本模块)--->%xhtml-text.module;,包含文本的基本元素和其内联元素,如:h1、h2、...、strong、span等。
        Hypertext Module(超链接模块)--->%xhtml-hypertext.module;,包含用于链接的元素,如:a元素。
        List Module(列表模块)--->%xhtml-list.module;,包含用于列表的元素,如:dl、dt、dd、ul、ol和li。
        Applet Module(applet模块)--->%xhtml-applet.module;,Java所需要元素,如:applet和param。
        Presentation Module(表示模块)--->%xhtml-pres.module;,面向表示的标记:b、big、hr、I、small、sub、sup和tt。
        Edit Module(编辑模块)--->%xhtml-edit.module;,用于修正的元素,如:del和ins。
        Bidirectional Text Module(文本方向模块)--->%xhtml-bdo.module;,用于指定文本阅读的方向,如bdo元素。
        Basic Forms Module(基本表单模块)--->%xhtml-basic-form.module;,用于HTML 3.2的表单元素,如:form、input、select、option和textarea。
        Forms Module(表单模块)--->%xhtml-form.module;,用于HTML 4.0的表单元素,如:form、input、select、option、textarea、button、fieldset、label、legend和optgroup。
        Basic Tables Module(基本表格模块)--->%xhtml-basic-table.module;,基本的表格元素,如:table、caption、th、tr和td。
        Table Module(表格模块)--->%xhtml-table.module;,安全功能的表格支持,如:table、caption、th、tr、td、col、colgroup、tbody、thead和tfoot。
        Image Module(图像模块)--->%xhtml-image.module;,包含img元素。
        Client-side Image Map Module(客户端图像映像模块)--->%xhtml-csismap.module;,包含map和area元素以及支持客户端图像映像所需要的元素的属性。
        Server-side-Image Map Module(服务器端图像映像模块)--->%xhtml-ssismap.module;,该模块没有添加新元素,但对img元素添加了一个ismap属性。
        Object Module(对象模块)--->%xhtml-object.module;,用于在网页中嵌入可执行内容,如:java程序。
        Param Module(参数模块)--->%xhtml-param.module;,网页中可执行内容中传递参数的param元素。
        Frames Module(框架模块)--->%xhtml-frames.module;,包含实现框架所需的元素,如:frame、frameset和noframes。
        Iframe Module(内联框架模块)--->%xhtml-iframe.module;,包含内联框架的iframe元素。
        Intrinsic Events(固有事件模块)--->%xhtml-events.module;,支持如onSubmit和onFocus等脚本的属性。
        Meta-information Module(元信息模块)--->%xhtml-meta.module;,包含meta元素。
        Scripting Module(脚本模块)--->%xhtml-script.module;,支持JavaScript等脚本。
        Stylesheet Module(样式表模块)--->%xhtml-style.module;,用于定义CSS的style元素。
        Link Module(链接模块)--->%xhtml-link.module;,指定外部文件,如样式表、库等关系的link元素。
        Base Modue(基模块)--->%xhtml-base.module;,包含base元素,指定解析相对URL所参照的基URL。
        Target Module(目标模块)--->%xhtml-target.module;,用于指定目标框架或框架中某个窗口的target属性。
        Style Attribute Module(样式属性模块)--->%xhtml-inlstyle.module;,将CSS样式应用于文档中单个元素的style属性。
        Name Identification Module(名称标识模块)--->%xhtml-nameident.module;,name属性是id属性的早期版本,现在不推荐使用。
        Legacy Module(传统模块)--->%xhtml-legacy.module;,不推荐使用的元素和属性,如:basefont、center、fonts、strike和u元素。
        Ruby Module(Ruby模块)--->%xhtml-ruby.module;,东亚文本中用于将少量文本放于正文文本旁边的ruby、rbc、rtc、rb、rt和rp元素,一般用来指示发音。