1

我正在使用多脉冲激光雷达数据,这些数据沿飞行路径内的多条线收集点。我正在尝试确定 las 文件中各行的名称和数量。我在 python 中使用 liblas 模块。

我找到了解释存储在 las 文件中的不同字段的文档它在页面的最底部提到了一个数据字段(get_data 和 set_data)。

标头中的“点数据格式”和“点数据记录长度”为该“数据”字段留出空间。我的标题说我为数据字段预留了 28 个字节,并且数据字段中存储了 28 个值。第 19 个值(至少在来自两个不同传感器的两个数据集中)指的是行号。我在单脉冲数据中有一个值,在多脉冲数据中有 4 个值。

我想知道这个字段中存储的内容是否有标准,或者它是否是专有的。

另外,作为获取每条扫描线名称的一种方式,我编写了以下代码:

import liblas
from liblas import file as lasfile

# Get parameters
las_file = r"E:\Testing\00101.las"

f = lasfile.File(las_file, mode='r')

line_list = []
counter = 0
for p in f:
    line_num = p.data[18]
    if line_num not in line_list:
        line_list.append(line_num)
    counter += 1
print line_list

结果出现以下错误:

Traceback (most recent call last):
  File "D:\Tools\Python_Scripts\point_info.py", line 46, in <module>
    line_num = p.data[18]
  File "C:\Python27\ArcGIS10.1\lib\site-packages\liblas\point.py", line 560, in get_data
    length = self.header.data_record_length
  File "C:\Python27\ArcGIS10.1\lib\site-packages\liblas\point.py", line 546, in get_header
    return header.Header(handle=core.las.LASPoint_GetHeader(self.handle))
WindowsError: [Error -529697949] Windows Error 0xE06D7363

有谁知道更多关于存储在 las 点/标题中的行号?谁能解释这个错误?在我收到错误之前,它似乎分配了近 2gb 的内存。我在win xp上,所以我猜它是一个内存错误,但我不明白为什么访问这个“数据”字段会占用内存。任何帮助是极大的赞赏。

4

1 回答 1

1

我不假装自己是这方面的专家,但我对 GIS 数据很感兴趣,所以这引起了我的兴趣。liblas我在我的 Fedora 19 系统上安装了它及其依赖项,并使用了liblas.

使用你的代码,我遇到了同样的问题,就是看着我所有的记忆都被吃光了。我不知道为什么会发生这种情况——也许不需要的引用会阻止垃圾收集器像我们希望的那样工作。这可能会被修复,但我不会尝试。

我确实注意到了该liblas模块的一些有趣功能,并决定尝试一下。我相信你可以得到你想要的数据。

打开文件后,查看标题中的 XML 描述。

h = f.get_header()
print(h.get_xml())

很难看(随意使用 xml.dom.minidom 或 lxml.etree),但在我的示例文件中,它显示了点数据的字节布局(我的也有 28 个字节)。在我的情况下,偏移量 18 是分配给点源 ID 的单个短(2 个字节)。您应该能够使用p.data[18:19]p.get_data()[18:19]p.point_source_id或来检索它p.get_point_source_id()。不幸的是,这些data引用占用了内存并且p.point_source_id有一个错误(提交给开发人员的错误修复拉取请求)。如果我们将您的代码更改为使用最后一种访问方法,那么一切似乎都可以正常工作。所以,在你的for循环中试试这个:

for p in f:
    line_num = p.get_point_source_id()
    if line_num not in line_list:
        line_list.append(line_num)
    counter += 1

注意

counter == h.get_count()

如果您只想要一组唯一的点源 ID 值...

line_set = set(p.get_point_source_id() for p in f)

希望您的数据值也可以作为p.get_point_source_id(). 在评论中让我知道它对您的作用。干杯!

于 2013-11-21T08:38:54.133 回答