0

我正在学习如何使用 pyKML 模块在 Python 中解析 KML 文件。我正在使用的特定文件可以在这里找到,我也在这篇文章的底部添加了它。我已将文件保存在我的计算机上并命名test.kml

经过一番研究,我设法提取了test.kml文件的特定部分并将结果保存到 DataFrame。这是我的代码:

from pykml import parser
import pandas as pd

filename = 'test.kml'
with open(filename) as fobj:
    folder = parser.parse(fobj).getroot().Document

plnm = []

for pm in folder.Placemark:
    plnm1 = pm.name
    plnm.append(plnm1.text)

df = pd.DataFrame()
df['name'] = plnm

print(df)
          name
0   Club house
1  By the lake

我想在我的 DataFrame 中添加一个新列,对应于"holeNumber". 我试图在我的for循环中添加以下行但没有成功。

for pm in folder.Placemark:
    plnm1 = pm.name
    val1 = pm.ExtendedData.holeNumber.value
    plnm.append(plnm1.text)
    val.append(val1.text)

我不确定如何从该特定节点访问值。我正在寻找的结果 DataFrame 如下:

| name        | holeNumber |
|-------------|------------|
| Club house  | 1          |
| By the lake | 5          |

任何帮助,将不胜感激。

<kml xmlns="http://www.opengis.net/kml/2.2">
<Document>
  <name>My Golf Course Example</name>
  <Placemark>
    <name>Club house</name>
    <ExtendedData>
      <Data name="holeNumber">
        <value>1</value>
      </Data>
      <Data name="holeYardage">
        <value>234</value>
      </Data>
      <Data name="holePar">
        <value>4</value>
      </Data>
    </ExtendedData>
    <Point>
      <coordinates>-111.956,33.5043</coordinates>
    </Point>
  </Placemark>
  <Placemark>
    <name>By the lake</name>
    <ExtendedData>
      <Data name="holeNumber">
        <value>5</value>
      </Data>
      <Data name="holeYardage">
        <value>523</value>
      </Data>
      <Data name="holePar">
        <value>5</value>
      </Data>
    </ExtendedData>
    <Point>
      <coordinates>-111.95,33.5024</coordinates>
    </Point>
  </Placemark>
</Document>
</kml>
4

1 回答 1

2

这是解析 KML 的快速方法。

plnm = []
holeNumber = []
for pm in folder.Placemark:
    plnm1 = pm.name
    val1 = pm.ExtendedData.Data[0].value
    plnm.append(plnm1.text)
    holeNumber.append(val1.text)

df = pd.DataFrame()
df['name'] = plnm
df['holeNumber'] = holeNumber

print(df)

或者

df = pd.DataFrame(columns=('name', 'holeNumber'))
for pm in folder.Placemark:
    name = pm.name.text
    value = pm.ExtendedData.Data[0].value.text
    df = df.append({ 'name' : name, 'holeNumber' : value }, ignore_index=True)
print(df)

输出:

          name holeNumber
0   Club house          1
1  By the lake          5
于 2020-03-16T22:36:46.100 回答