当前位置:C++技术网 > 资讯 > XML编程:2 如何解析xml文件

XML编程:2 如何解析xml文件

更新时间:2015-06-24 10:05:02浏览次数:1+次

    XML文件的介绍,请阅读《xml文件是什么》。
    从理论上说,根据xml的格式定义,我们完全可以自己编写一个xml的语法分析器,然而实际上微软已经给我们提供了一个xml语法解析器,如果你安装了IE5.0以上版本的话,实际上你就已经安装了xml语法解析器。它是一个叫做msxml.DLL的动态链接库,最新版本为msxml3,实际上它是一个COM对象库,里面封装了所有进行xml解析所需要的所有必要的对象。因为COM是一种以二进制格式出现的和语言无关的可重用对象。所以你可以用任何语言(比如VB,VC,DELPHI,C++ 甚至是脚本语言等等)对它进行调用,在你的应用中实现对xml文档的解析。
xml DOM对象提供了一个标准的方法来操作存储在xml文档中的信息,DOM应用编程接口(API)作为应用程序和xml文档之间的桥梁,是解析XML的核心。
DOM可以认为是一个标准的结构体系用来连接文档和应用程序(也可以是脚本语言)。msxml解析器允许你装载和创建一个文档,收集文档的错误信息,得到和操作文档中的所有的信息和结构,并把文档保存在一个xml文件中。DOM提供给用户一个接口来装载和操作并序列化xml文档。DOM提供了对存储在内存中的xml文档的一个完全的表示,提供了可以随机访问整个文档的方法。DOM允许应用程序根据msxml解析器提供的逻辑结构来操作xml文档中的信息。利用msxml所提供的接口来操作xml。
实际上msxml解析器根据xml文档生成一个DOM树结构,它能够读xml文档并根据xml文档内容创建一个节点的逻辑结构,文档本身被认为是一个包含了所有其他节点的节点。
DOM使用户能够把文档看成是一个有结构的信息树,而不是简单的文本流。这样应用程序或者是脚本语言即使不知道xml的语义细节也能够方便的操作该结构。DOM包含两个关键的抽象:一个树状的层次、另一个是用来表示文档内容和结构的节点集合。树状层次包括了所有这些节点,节点本身也可以包含其他的节点。这样的好处是对于开发人员来说,他可以通过这个层次结构来快速找到并修改相应的某一个节点的信息。DOM把节点看成是一个普通的对象,这样就有可能创建一个脚本来装载一个文档,然后遍历所有的节点,显示感兴趣的节点的信息。注意节点可以有很多中具体的类型,比如元素、属性和文本,这些都可以认为是一个节点。
msxml解析器读一个xml文档,然后把它的内容解析到一个抽象的信息容器中称为节点(NODES)。NODES包含所有的节点,这些节点代表文档的结构和内容,并允许应用程序来读和操作文档中的信息而不需要显式的知道xml的语义。在一个文档被解析以后,它的节点能够在任何时候被浏览而不需要保持一定的顺序。
对开发人员来说,最重要的编程对象是DOMDocument。DOMDocument对象通过暴露属性和方法来允许你浏览,查询和修改xml文档的内容和结构,每一个对象暴露自己的属性和方法,这样你就能够收集关于对象实例的信息,操作对象的值和结构,并导航到树的其他对象上去。