5

您好,我正在使用的 xml 文件遇到问题。现在发生的事情是,每当我尝试获取 msg 标签时,我都会收到一个错误,阻止我访问数据。这是我目前正在编写的代码。

from xml.dom import minidom
import smtplib
from email.mime.text import MIMEText
from datetime import datetime

def xml_data ():

  f = open('C:\opidea_2.xml', 'r')

  data = f.read()

  f.close()

  dom = minidom.parseString(data)

  ic = (dom.getElementsByTagName('logentry'))

  dom = None      
  content = ''  
  for num in ic:

    xmlDate = num.getElementsByTagName('date')[0].firstChild.nodeValue

    content += xmlDate + '\n '

    xmlMsg = num.getElementsByTagName('msg')


    if xmlMsg !='' and len(xmlMsg) > 0:
        xmlMsgc = xmlMsg[0].firstChild.nodeValue
        content += "   Comments: \n        " + str(xmlMsg) + '\n\n'

    else:
        xmlMsgc = "No comment made."

        content += xmlMsgc

  print content

if __name__ == "__main__":
xml_data ()

如果有帮助,这是xml的一部分。

 <log>
 <logentry
  revision="33185">
 <author>glv</author>
 <date>2012-08-06T21:01:52.494219Z</date>
 <paths>

 <path
  kind="file"
  action="M">/branches/Patch_4_2_0_Branch/text.xml</path>   

 <path
  kind="dir"
  action="M">/branches/Patch_4_2_0_Branch</path>

</paths>
<msg>PATCH_BRANCH:N/A
 BUG_NUMBER:N/A
 FEATURE_AFFECTED:N/A
 OVERVIEW:N/A
  Adding the SVN log size requirement to the branch 
 </msg>
  </logentry>
    </log>

现在,当我使用时,xmlMsg = num.getElementsByTagName('msg')[0].toxml()我可以让代码工作,我只需要做很多替换,我宁愿不必这样做。我也有使用xmlDate = num.getElementsByTagName('date')[0].firstChild.nodeValue.

我有什么遗漏或做错了吗?这里也是回溯。

Traceback (most recent call last):
  File "C:\python\src\SVN_Email_copy.py", line 141, in <module>
    xml_data ()
  File "C:python\src\SVN_Email_copy.py", line 94, in xml_data
    xmlMsg = num.getElementsByTagName('msg').firstChild.nodeValue
AttributeError: 'NodeList' object has no attribute 'firstChild'
4

4 回答 4

5

我建议采用不同的方法。下面是一个程序,可以做你想要的(我认为......)。它使用ElementTree API而不是 minidom。这大大简化了事情。

您已经发布了几个有关使用 minidom 解析 XML 文件的相关问题。我真的认为您应该研究 ElementTree(对于更高级的东西,请查看 ElementTree 的“超集” lxml)。这两个 API 都比 minidom 更容易使用。

import xml.etree.ElementTree as ET

def xml_data():
    root = ET.parse("opidea_2.xml")
    logentries = root.findall("logentry")
    content = ""

    for logentry in logentries:
        date = logentry.find("date").text
        content += date + '\n '
        msg = logentry.find("msg")
        if msg is not None:
            content += "   Comments: \n        " + msg.text + '\n\n'
        else:
            content += "No comment made."

    print content

if __name__ == "__main__":
    xml_data()

使用 XML 示例时的输出(您可能希望在确切的布局上多做一些工作):

2012-08-06T21:01:52.494219Z
    Comments: 
        PATCH_BRANCH:N/A
 BUG_NUMBER:N/A
 FEATURE_AFFECTED:N/A
 OVERVIEW:N/A
  Adding the SVN log size requirement to the branch 
于 2012-08-31T15:28:22.953 回答
3

我似乎做错了代码。这是我能够解决它的方法。

if len(xmlMsg) > 0 and xmlMsg[0].firstChild != None:

        xmlMsgc = xmlMsg[0].firstChild.nodeValue

        xmlMsgpbr = xmlMsgc.replace('\n', '       ')  

        xmlMsgf.append(xmlMsgpbr)        

    else:    

        xmlMsgf = "No comments made"  

我从来没有检查过第一个孩子是否有任何价值。这就是我所缺少的。其他答案很有帮助,但这就是我能够让它工作的方式。谢谢你们。

于 2012-09-07T15:29:00.910 回答
2
myNodeList.item( 0)

也许...... http://docs.python.org/library/xml.dom.html

于 2012-08-29T18:19:40.373 回答
1

用这个...print "%s" %(num.getElementsByTagName('date')[0].firstChild.data)

于 2013-07-07T17:32:48.863 回答