1

我使用 BatchGeo 从电子表格创建地图,然后下载 KML 数据,即:

<Placemark>
  <name>?</name>
    <Snippet></Snippet>
    <description><![CDATA[]]></description>
    <styleUrl>#style75</styleUrl>
    <address>1234 Example St Denver, CO 80221</address>
    <Point>
      <coordinates>-121.879364,37.815151,0.000000</coordinates>
    </Point>
</Placemark>

当重新导入谷歌地图时,这些点被放置在正确的地址/坐标上,但左侧边栏上每个引脚旁边的名称/描述符只显示“?” 而不是显示地址。

我想使用正则表达式查找每个"<name>?</name>",然后使用正则表达式查找文件中的 NEXT 实例<address>.*</address>,然后返回并将标签之间的 替换为?标签<name>之间*<address>

每个点的标签之间都有一段代码<Placemark>,总共有数百个点。

以下是我到目前为止的点点滴滴:

newkml = File.open( 'Newkml.txt', 'w' )

def process_line(x)
  unless x == "<name>?</name>"
    # just return the original line
  else
    # Find the next instance of /<address>(.*)<\/address>/
    # Go to the original line
    # Replace it with "<name>#{$1}</name>"
  end
end

File.foreach('Whatever.kml'){|line|} do line.process_line
# Make a new file, copy over all of the lines that aren't <name>?</name>,
# and fix the name lines using the method above

更新:在原始服务 (BatchGeo) 中,有一个选项可以设置哪些信息包含在哪些 KML(XML) 标签中,因此我创建了一个新地图并首先防止了问题的发生。感谢那些向我推荐我将来可以用于此类操作的工具的人。

更新 2:尝试 Mark Thomas 的解决方案。这是我运行的代码:

require 'rubygems'
require 'nokogiri'

doc = Nokogiri::XML("whatever.xml")

edits = 0

doc.xpath("//name").each do |name|
  if name.content == "?"
    name.content = name.xpath("following-sibling::address").text
    edits +=1
  end
end

puts( doc.inspect )
puts( "edits: #{edits}" )
puts doc

这给了我以下输出:

#<Nokogiri::XML::Document:0xfe0064 name="document>
edits: 0
<?xml version="1.0"?>

如果edits我添加的测试代码按我认为的那样工作,它似乎表明该if name.content == "?"块执行了 0 次(比我预期的少了大约 130 次)。

4

3 回答 3

3

已经为您完成了几乎任何语言的解析/生成 KML 文件的工作。我怀疑这个对你有用:https ://github.com/schleyfox/ruby_kml

更新

由于没有实际使用过上述库,我想确认一下我的建议 - 看起来所有帮助函数都可用于创建 KML 文件,但仍需要您使用 XML 解析器来加载一个。我仍然建议这比仅使用建议的 XML 解析器操作 KML 更好(尽管这肯定也可以正常工作),但您可能还想查看http://georuby.rubyforge.org/georuby-doc /index.html支持 KML 输入和输出。

更新 2 - 为后代添加。

在我的回答中多加考虑,我对此类问题的默认建议是:

  1. 将 KML 解析为对象
  2. 纠正错误
  3. 重新生成 KML

我的理由是这应该不太容易破坏输出,如果您最终开始对 KML 进行更多操作,那么您已经完成了 90% 的工作。

所有这一切都说,在您的具体情况下,仅对已知数据进行您识别的更改,@Mark Thomas 的方法将提供更快且代码开销更低的解决方案。

于 2013-01-17T04:22:57.777 回答
2

我建议改用 XML 解析器。这是一些示例 Nokogiri 代码:

doc = Nokogiri::XML(kml)

doc.xpath("//name").each do |name|
  if name.content == "?"
    name.content = name.xpath("following-sibling::address").text
  end
end

更新

根据您的更新,您的 XML 文件的解析似乎出了点问题——您确定它有效吗?

这是一个完整的工作示例:

require 'nokogiri'

xml = <<End
<Placemark>
  <name>?</name>
    <Snippet></Snippet>
    <description><![CDATA[]]></description>
    <styleUrl>#style75</styleUrl>
    <address>1234 Example St Denver, CO 80221</address>
    <Point>
      <coordinates>-121.879364,37.815151,0.000000</coordinates>
    </Point>
</Placemark>

End

doc = Nokogiri::XML(xml)

doc.xpath("//name").each do |name|
  if name.content == "?"
    name.content = name.xpath("following-sibling::address").text
  end
end

puts doc

输出:

<?xml version="1.0"?>
<Placemark>
  <name>1234 Example St Denver, CO 80221</name>
    <Snippet/>
    <description/>
    <styleUrl>#style75</styleUrl>
    <address>1234 Example St Denver, CO 80221</address>
    <Point>
      <coordinates>-121.879364,37.815151,0.000000</coordinates>
    </Point>
</Placemark>
于 2013-01-17T03:01:39.913 回答
0

让我们尝试使用它:

require 'nokogiri'

doc = Nokogiri::XML::DocumentFragment.parse(<<EOT)
<Placemark>
  <name>?</name>
  <Snippet></Snippet>
  <description><![CDATA[]]></description>
  <styleUrl>#style75</styleUrl>
  <address>1234 Example St Denver, CO 80221</address>
  <Point>
    <coordinates>-121.879364,37.815151,0.000000</coordinates>
  </Point>
</Placemark>
EOT

doc.search('Placemark').each do |placemark|
  name = placemark.at('name')
  address = placemark.at('address')
  name.content = address.text
end

puts doc.to_xml

哪个输出:

<Placemark>
  <name>1234 Example St Denver, CO 80221</name>
  <Snippet/>
  <description><![CDATA[]]></description>
  <styleUrl>#style75</styleUrl>
  <address>1234 Example St Denver, CO 80221</address>
  <Point>
    <coordinates>-121.879364,37.815151,0.000000</coordinates>
  </Point>
</Placemark>

我使用文档片段来避免添加无关内容。通常,您希望使用法线Nokogiri::XML来解析文档。

我假设您有多个<Placemark>标签,它们search将迭代并返回一个 NodeSet。

于 2013-01-23T02:50:01.653 回答