4

我知道这个问题可能不适合 SO,但请让这个问题在这里一段时间。上次我的问题被转移到交叉验证时,它冻结了;没有更多的意见或反馈。


我遇到了一个对我来说没有多大意义的问题。如何通过 NLP 询问IFC 模型?将 IFC 模型视为语义丰富的结构化数据。IFC 定义了一个基于 EXPRESS 的实体关系模型,该模型由组织成基于对象的继承层次结构的实体组成。实体的示例包括建筑元素、几何图形和基本构造。

NLP 如何用于此类数据?我根本看不到 NLP 相关。

4

1 回答 1

1

总的来说,我建议使用 NLP 技术来“询问”已经(非常正式)的结构化数据,如 EXPRESS 充其量是矫枉过正,最坏的情况是时间/维护漏洞。一般来说,当你已经有了这样一个明确的编码时,NLP 的优势(人类语言歧义解析、共指解析、文本摘要、文本蕴涵等)是完全没有必要的。如果有的话,您可以想象将此模式直接转换为 Prolog 应用程序以进行直接逻辑查询等(这与 NLP 完全不同)。

我进行了一些搜索,试图找到您可能提到的参考资料。我发现的唯一项目是使用语义自然语言处理技术半自动扩展建筑信息模型

...作者提出了一种扩展 IFC 模式的新方法,以客观和半自动化的方式合并 CC 相关信息。该方法利用语义自然语言处理技术和机器学习技术从与CC [合规性检查](例如,建筑规范)相关的文档中提取概念,并将提取的概念与IFC类层次结构中的概念相匹配。

所以在这个例子中,至少,作者不是用 NLP “询问” IFC 模式,而是用它来用从人类可读文本中提取的附加信息来扩充现有模式。这更有意义。如果您想发布包含“NLP 审讯”短语的实际 URL 或参考,我应该能够更具体地发表评论。

编辑:

您引用的项目资助摘要没有包含太多细节,但他们有这句话:

... 参数化 3D 模型中嵌入的信息旨在使用适当的软件进行设施或工作场所管理。然而,当与物联网传感器和认知计算结合使用时,这些信息也有可能被医疗保健专业人员在环境辅助生活 (AAL) 环境中使用。该项目将研究如何通过自然语言处理查询已构建的医疗保健设施 BIM 模型以支持 AAL。...

我只能推测出于以下目的可能使用 NLP 框架的原因:

虽然 BIM 模型包括行业基础类 (IFC) 和 aecXML,但还有许多其他格式,其中许多是专有的。有些是 CAD 集成的,有些是独立的。与其支付许多专有许可证(其中一些企业产品非常昂贵),和/或花时间为各种不同的文件格式规范(在专有情况下可能不公开)开发适当的结构化查询行为,不如作者选择了一种更自动化、更通用的解决方案来提取他们正在寻找的内容(我认为在几乎所有情况下都必须是文本或文本标签)。这几乎类似于搜索引擎“抓取”网站并寻找关键词或短语以及它们的同义词等。好处是他们不必针对所有不同的可能 BIM 文件格式进行显式编码以获得良好的覆盖率,也不必支付大笔资金。缺点是它们带来了 NLP 带来的新问题和考虑因素,包括训练、验证、监督等。而且 NLP 永远不会达到你从针对已知模式的真正结构化查询中获得的准确度水平。

于 2016-11-26T04:56:25.220 回答