首页 > 程序开发 > Web开发 > PHP教程 > PHP应用 > XML教程 >

在.NET Framework中轻松处理XML数据(2-1)

2016-01-06

??分析属性值 ??大部分情况下,属性值都是一个简略的文本字符串。然而,这并不意味着实际利用中的属性值都是字符型的。有时候,属性值是由很多种类型的数据组合而成的,例如Date或Boolean,这时,你就要用XmlCon

??分析属性值

??大部分情况下,属性值都是一个简略的文本字符串。然而,这并不意味着实际利用中的属性值都是字符型的。有时候,属性值是由很多种类型的数据组合而成的,例如Date或Boolean,这时,你就要用XmlConvert或System.Convevt类的方法把这些类型转换成本来的类型。XmlConvert和System.Convevt类都能实现数据类型的转换,但是XmlConvert类根据XSD中指定的数据类型进行转换,而不管它现在是什么类型。

??假设你有以下的XML数据片段:

??

??让我们先确认,birthdaay属性值是February 8, 2001,假如你用System.Convert类把该字符串转换成.NET Framework中的DateTime类型,这样,我们就可以把它当成date类型应用了。相比下,假如你用XmlConvert类来转换字符串,你将看到一个分析错误,由于XmlConvert类不能准确说明这个字符串中的日期。由于在XML中,日期型数据的格局必需是YYYY-MM-DD情势的。XmlConvert类担负CLR类型与XSD类型之间的相互转换工作。当转换工作产生时,转换成果是局部的。

??在某些解决计划中,属性值是由纯文本和实体共同组成的。在所有的浏览器类中,只有XmlValidatingReader类能处理实体。XmlTextReader固然不能处理实体,但它们同时呈现在属性值中的时候,它只能把文本值取出来。呈现这种情况,你必需用ReadAttributeValue方法调换简略的读方法来分析属性值的内容。

??ReadAttributeValue方法分析属性值,然后把各个组成的要素分隔开(如把纯文本和实体离开)。你可以用ReadAttributeValue方法的返回值作为循环条件,遍历全部属性值中的要素。既然XmlTextReader类不能处理实体,那么你可以自己写一个用于处理实体的类。下面的代码片段演示了怎么调用一个自定义的处理类:

??while(reader.ReadAttributeValue())

??{

??if (reader.NodeType == XmlNodeType.EntityReference)

??// Resolve the 'reader.Name' reference and add

??// the result to a buffer

??buf = YourResolverCode(reader.Name);

??else

??// Just append the value to the buffer

??buf = reader.Value;

??}

??当属性值全部被分析后,ReadAtributeValue方法返回False, 从而结束循环。属性值的终极成果就是全局变量buffer的值了。

??处理XML文本(Text)

??当我们在处理XML标签文本时,假如不能准确的处理,它的错误原因能很快地断定。例如一个字符转换错误,它必定是传输了非XML文本到一个XML数据流中。不是所有在给定的平台中有效的字符都是有效的XML字符。只有在XML规范(www.w3.org/TR/2000/REC-xml-20001006.html)中规定的有效的字符才干安全的用作元素和属性名。

??XmlConvert类供给了把非XML尺度的命名转换成尺度的XML命名的功效。当标签名中包含有无效的XML字符时,EncodeName 和 DecodeName方法能把它们调剂成符合Schema的XML命名。包含SQL Server™ 和Microsoft Office,这些利用程序答应及支撑Unicode文档,然而,这些文档中的字符有些也不是有效的XML命名。典范的情况是在你处理数据库中包含空格的列名时。固然SQL Server答应长列名,但这对XML流来说可能就不是有效的命名。空格会被十六进制代码Invoice_0x0020_Details调换。下面的代码演示了怎么样在程序中获得该字符串:

??XmlConvert.EncodeName('Invoice Details');

??与此相反的方法是DecodeName。该方法把XML文本转换成其原始的格局。要留心的是它只能转换完整的十六进制代码,只有_0x0020_才被当成一个空格,而_0x20_就不是了:

??XmlConvert.DecodeName('Invoice_0x0020_Details');

??在XML文档中的空格即重要也不重要。说它重要,是当它呈现在元素的内容中或者它在注释语句中时,它能表现实际意义。例如下面的情况:



??<MyNode xml:space='preserve'>

??<!-- any space here must be preserved -->

??•••

??</MyNode>

??在xml中,空格不只是代表空格(空缺),也代表回车、换行和缩进。

??通过XmlTextReader类的WhiteSpaceHandling属性你可以处理空格。这个属性接收及返回一个WhiteSpaceHandling枚举值(该枚举类有三种可选值)。默认值是All,它表现有意义和无意义的空格都会作为节点返回---- 分辨为SignificantWhitespace和Whitespace节点。 另一个枚举值是None,它表现对任何空格都不作为节点返回。最后,就是Signficant枚举值,它表现疏忽没有意义的空格,而只返回节点类型为SignficantWhitespace的节点。留心WhiteSpaceHandling属性是少数浏览器属性中的一个。它能被转变在任何时候和给Read把持带来影响。而Normalization及 XmlResolver属性是“Sensitive”的。

相关文章
最新文章
热点推荐