0

我正在开发一个从互联网页面获取各种输入的应用程序,而每个信息片段都来自不同的位置(混搭)。我想通过可视化工具生成混搭构建块(片段)。你知道有什么类似的东西可以用于这样的项目吗?(已制作控件、示例代码、文章等)首选的开发环境是 .NET - 但不是强制性的。

4

1 回答 1

0

IMO 的主要挑战是以语义形式从每个提要中提取适当的信息。维基百科将混搭描述为:

混搭有多种类型,例如消费者混搭、数据混搭和企业混搭。最常见的混搭类型是面向大众的消费者混搭。

数据混搭将来自多个来源的相似类型的媒体和信息组合成一个表示形式。一个例子是 AlertMap,它结合了来自 200 多个来源的与恶劣天气条件、生物危害威胁和地震信息相关的数据,并将它们显示在世界地图上;另一个是芝加哥犯罪地图,它显示了芝加哥的犯罪率和犯罪地点。

经典的混搭 - 芝加哥犯罪 - 之所以有效,是因为日期和地理位置等关键信息在语义上是可用的。其他类型的公共信息是个人、组织和特定领域的标识符。

当您确定了这些后,您可能希望考虑语义网正在开发的基于 RDF 的工具。请注意,政府开始在 RDF 中发布他们的数据,所以我认为这是一项关键技术

如果您的网页没有立即包含语义信息,您可能必须创建屏幕抓取工具和 HTML 解析器。这不是很迷人,没有特殊的工具,而且往往只是艰苦的工作。

于 2009-11-29T16:23:31.597 回答