【 tulaoshi.com - 编程语言 】
dom规范和在Java中的实现(一) (二)(三)
sunmingdong
概念:
1、DOM就是一个对象化的XML数据接口;
2、一个与语言无关、与平台无关的标准接口规范;
3、它定义了Html文档和XML文档的逻辑结构;
4、给出了一种访问和处理HTML文档和XML文档的方法(动态地创建文档,遍历文档结构,添加、修改、删除文档内容,改变文档的显示方式等等)。
组成:
ü DOM由三部分组成,包括:核心(core)、HTML和XML。
ü 核心部分是结构化文档比较底层对象的集合;
ü HTML接口和XML接口两部分则是专为操作具体的HTML文档和XML文档所提供的高级接口,使对这两类文件的操作更加方便。
版本:
ü 1998年8月18日通过的DOM Level 1;
ü 2000年3月7日 DOM Level 2;
ü DOM Level 3。
XML基本概念
XML 声明:?xml version="1.0" encoding="UTF-8"?
DOCTYPE 声明:!DOCTYPE ORDERS SYSTEM "orders.dtd"
数据本身:ordersordercustomerid limit="1000"12341/customerid/order /orders
元素:
属性:
文本:
文档:
CData:[CDATA[bImportant: Please keep head and hands inside ride at iall times/i./b]]
注释:!--This is a comment. --
处理指令:?xml-stylesheet type="text/xsl" href="foo.xsl"?
文档片段:item instock="Y" itemid="SA15"
nameSilver Show Saddle, 16 inch/name
price825.00/price
qty1/qty
/item
item instock="N" itemid="C49"
namePremium Cinch/name
price49.00/price
qty1/qty
/item
实体:
实体引用节点:
记号:
名字空间:
基本接口接口定义(java API package:org.w3c.dom):
类继续图(箭头指向的是父类,另一端为子类)
1.Node接口
Node接口在整个DOM树中具有举足轻重的地位,DOM接口中有很大一部分接口是从Node接口继续过来的,例如,Element、Attr、CDATASection等接口,都是从Node继续过来的。在DOM树中,Node接口代表了树中的一个节点。
Field Summary
static short
ATTRIBUTE_NODE
The node is an Attr.
static short
CDATA_SECTION_NODE
The node is a CDATASection.
static short
COMMENT_NODE
The node is a Comment.
static short
DOCUMENT_FRAGMENT_NODE
The node is a DocumentFragment.
static short
DOCUMENT_NODE
The node is a Document.
static short
DOCUMENT_TYPE_NODE
The node is a DocumentType.
static short
ELEMENT_NODE
The node is an Element.
static short
ENTITY_NODE
The node is an Entity.
static short
ENTITY_REFERENCE_NODE
The node is an EntityReference.
static short
NOTATION_NODE
The node is a Notation.
static short
PROCESSING_INSTRUCTION_NODE
The node is a ProcessingInstruction.
static short
TEXT_NODE
The node is a Text node.
Method Summary
Node
appendChild(Node newChild)
将节点对象添加到本节点的子节点列表的末尾
Node
cloneNode(boolean deep)
创建新的节点对象,他是本节点的克隆,假如deep=true,他将包含本节点的所有子孙节点。
NamedNodeMap
getAttributes()
假如是节点,返回一个包含所有属性的NamedNodeMap对象,否则为空。
NodeList
getChildNodes()
返回包含所有子节点的NodeList对象
Node
getFirstChild()
得到第一个子节点
Node
getLastChild()
得到最后一个子节点
java.lang.String
getLocalName()
返回本节点合法名字的本地部分
java.lang.String
getNamespaceURI()
返回本节点命名空间的URI,未指明的话返回null
Node
getNextSibling()
得到本节点的下一个兄弟节点
java.lang.String
getNodeName()
得到本节点的名字
short
getNodeType()
得到一个节点类型
java.lang.String
getNodeValue()
得到一个节点值
Document
getOwnerDocument()
返回本节点所属的Document对象
Node
getParentNode()
得到父节点
java.lang.String
getPrefix()
返回本节点的命名空间前缀,假如未指定返回null
Node
getPreviousSibling()
得到本节点的上一个兄弟节点
boolean
hasAttributes()
返回是否有属性
boolean
hasChildNodes()
返回本节点是否有任何子节点
Node
insertBefore(Node newChild, Node refChild)
在参考节点refChild前插入新节点newChild
boolean
isSupported(java.lang.String feature, java.lang.String version)
测试version版本的DOM规范是否支持feature特性
void
normalize()
Puts all Text nodes in the full depth of the sub-tree underneath this Node, including attribute nodes, into a "normal" form where only structure (e.g., elements, comments, processing instructions, CDATA sections, and entity references) separates Text nodes, i.e., there are neither adjacent Text nodes nor empty Text nodes.
Node
removeChild(Node oldChild)
从子节点列中删除节点
Node
replaceChild(Node newChild, Node oldChild)
替换oldChild节点为newChild
void
setNodeValue(java.lang.String nodeValue)
void
setPrefix(java.lang.String prefix)
2.NodeList接口
NodeList接口提供了对节点集合的抽象定义,它并不包含如何实现这个节点集的定义。NodeList用于表示有顺序关系的一组节点,比如某个节点的子节点序列。另外,它还出现在一些方法的返回值中,例如GetNodeByName。
在DOM中,NodeList的对象是"live"的,换句话说,对文档的改变,会直接反映到相关的NodeList对象中。例如,假如通过DOM获得一个NodeList对象,该对象中包含了某个Element节点的所有子节点的集合,那么,当再通过DOM对Element节点进行操作(添加、删除、改动节点中的子节点)时,这些改变将会自动地反映到NodeList对象中,而不需DOM应用程序再做其他额外的操作。
NodeList中的每个item都可以通过一个索引来访问,该索引值从0开始。
Method Summary
int
getLength()
列表中节点长度
Node
item(int index)
返回第index个节点
3.NamedNodeMap接口
实现了NamedNodeMap接口的对象中包含了可以通过名字来访问的一组节点的集合。不过注重,NamedNodeMap并不是从NodeList继续过来的,它所包含的节点集中的节点是无序的。尽管这些节点也可以通过索引来进行访问,但这只是提供了枚举NamedNodeMap中所包含节点的一种简单方法,并不表明在DOM规范中为NamedNodeMap中的节点规定了一种排列顺序。
NamedNodeMap表示的是一组节点和其唯一名字的一一对应关系,这个接口主要用在属性节点的表示上。
与NodeList相同,在DOM中,NamedNodeMap对象也是"live"的。
Method Summary
int
getLength()
得到映射中的节点个数
Node
getNamedItem(java.lang.String name)
通过唯一名字得到一个节点
Node
getNamedItemNS(java.lang.String namespaceURI, java.lang.String localName)
通过本地名和命名空间的URI得到唯一的节点
Node
item(int index)
得到在影射中的第index个节点
Node
removeNamedItem(java.lang.String name)
通过唯一名字删除一个节点
Node
removeNamedItemNS(java.lang.String namespaceURI, java.lang.String localName)
通过本地名和命名空间删除唯一的节点
Node
setNamedItem(Node arg)
用arg增加一个节点
Node
setNamedItemNS(Node arg)
用命名空间的URI和当地名增加一个节点
高级接口:
Interface Summary
Attr
代表元素对象的属性
CDATASection
DTD或模式中的CDATA项用于将不希望被解释为标记的文本块“转义”。在DTD中,使用!CDATA…声明
CharacterData
在DOM中,提供一套方法和属性操作字符数据
Comment
代表注释元素的内容
Document
Document接口描述了整个HTML或XML文档
DocumentFragment
DocumentFragment是一个轻量对象,他可以创建新的文档片断,然后将整个片断插入到一有的文档中
DocumentType
包含文档的类型声明或模式信息
DOMImplementation
该对象答应访问与应用程序相关且独立于任何特定的文档对象模型实例的方法
Element
代表HTML/XML文档中的元素,常见元素有:Element、Attr、Text
Entity
代表在DTD中以元素!ENTITY…声明的解析的或未解析的实体
EntityReference
代表XML文档中的实体引用节点,假如XML处理器在构建结构模型时展开了实体引用,树中可能不会出现实体引用对象。
Notation
代表在DTD或模式中以元素!NOTATION…声明表示法
ProcessingInstruction
代表通过’?’和’?’嵌入XML的指令,它提供了在XML文档中保存与处理器相关的信息的方法
Text
代表元素节点或属性节点的文本内容
重要的节点类型
从NODE派生出的几个比较重要的节点类型有Document Element, Attribute,Text:
Document是DOM树的根,它代表一个完整的XML文档。它会有一些自己的子节点,至少应该有一个文档元素的子节点,这个节点类型为Element,是XML文件最外层的根元素,此外他还可能有DocumentType(唯一),ProcessingInstruction,Comment这几种作为子节点。
Element代表XML元素,是最常用的节点,它可以组成以它为根的DOM的子树。他还可以有Element子节点,以及Attribut,Text,ProcessingInstruction,CDATASection,Comment子节点。
Attribute是XML元素的属性,它的父节点必然是Element,它的子节点有Text和EntityReference;
Text代表元素节点或属性节点的文本内容。