10

我一直在想这个问题,我不明白为什么谷歌还没有尝试过——或者他们可能已经尝试过了,我只是不知道。

是否有一个搜索引擎,您可以在其中输入一个问题,该问题会给您一个单一的答案,而不是一个结果列表,您必须自己搜索才能找到您想知道的内容?

例如,这就是我设计系统的方式:

用户输入:“你去哪里检查眼睛?”</p>

系统输出:“验光师。确定性:95%”</p>

这将计算如下:

  1. 输入从自然语言解析为简单的搜索字符串,在这种情况下可能类似于“眼睛测试”。系统也会解释术语“你去哪里”,并在比较结果时使用。
  2. 搜索字符串将被输入搜索引擎。
  3. 然后系统将比较结果的内容以找到匹配的单词或短语,并记录问题所问的内容(即,什么、在哪里、谁、如何等)
  4. 一旦确定了合适的答案,系统就会将其显示给用户,同时衡量答案是否正确。

由于互联网的分散性,一个正确的答案很可能会出现多次,尤其是对于简单的问题。对于这个特定的例子,系统不难识别这个词在结果中不断出现,并且几乎可以肯定它是正在搜索的答案。

对于更复杂的问题,将显示较低的确定性,并且可能会显示具有不同确定性水平的多个结果。用户还将有机会查看系统计算结果的来源。

这个系统的重点是它简化了搜索。很多时候,当我们使用搜索引擎时,我们只是在寻找一些非常简单或微不足道的东西。返回一长串结果似乎不是回答问题的最有效方式,即使答案几乎肯定隐藏在这些结果中。

只需查看上述问题的 Google 结果即可了解我的观点: http ://www.google.co.uk/webhp?sourceid=chrome-instant&ie=UTF-8&ion=1&nord=1#sclient=psy&hl=en&safe =off&nord=1&site=webhp&source=hp&q=Where%20do%20you%20go%20to%20get%20your%20eyes%20tested%3F&aq=&aqi=&aql=&oq=&pbx=1&fp=72566eb257565894&fp=72566eb257565894&ion=1

给出的结果不会立即回答问题——用户需要在找到他们真正想要的答案之前对其进行搜索。搜索引擎是很棒的目录。它们非常适合为您提供有关某个主题的更多信息,或告诉您在哪里可以找到服务,但它们不擅长回答直接问题。

在创建系统时必须考虑许多方面——例如,在计算结果时必须考虑网站的准确性。

尽管该系统应该可以很好地解决简单的问题,但要使其适用于更复杂的问题可能是一项艰巨的任务。例如,常见的误解需要作为特殊情况处理。如果系统发现证据表明用户的问题有一个普遍的误解作为答案,它应该在提供答案时指出这一点,或者甚至干脆忽略最常见的答案而支持网站提供的那个指出它的答案是一种常见的误解。这一切都必须通过比较冲突来源的准确性和质量来衡量。

这是一个有趣的问题,需要进行大量研究,但肯定值得花时间和精力吗?它并不总是正确的,但它会使用户的简单查询更快。

4

5 回答 5

12

这样的系统称为自动问答(QA) 系统或自然语言搜索引擎。不要将其与由人类生成答案的社交问答服务相混淆。QA 是一个研究得很好的领域,近十年的TREC QA 跟踪出版物证明了这一点,但它是自然语言处理(NLP)领域中较为困难的任务之一,因为它需要广泛的智能(解析、搜索,信息提取,共指,推理)。这或许可以解释为什么今天免费提供的在线系统相对较少,其中大部分更像是演示。其中包括:

主要搜索引擎对问答技术表现出了兴趣。在 2011 年 6 月 1 日的一次采访中,Eric Sc​​midt 说,谷歌的新搜索策略是提供答案,而不仅仅是链接。“‘我们可以从字面上计算出正确的答案,’施密特说,他提到了人工智能技术的进步”(来源)。

Google Enterprise 产品负责人 Matthew Goltzbach表示,“问答是企业搜索的未来”。雅虎还预测,搜索的未来将涉及用户获得实时答案而不是链接。正如Google 的“简短答案”所示,这些大玩家正在逐步引入 QA 技术作为对其他类型搜索结果的补充。

尽管 IBM 的 Jeopardy-playing Watson 在普及机器回答问题(或答案)方面做了很多工作,但许多现实世界的挑战仍然存在于问答的一般形式中。

另请参阅有关开源 QA 框架的相关问题。

更新:

  • 2013 年 3 月 14 日:Google 和 Bing 搜索高管讨论搜索如何演变为对话式问答(AllThingsD
于 2011-05-10T15:10:03.513 回答
2

沃尔夫拉姆阿尔法

http://www.wolframalpha.com/

Wolfram Alpha(样式为 Wolfram|Alpha)是由 Wolfram Research 开发的答案引擎。它是一种在线服务,通过从结构化数据中计算答案直接回答事实查询,而不是像搜索引擎那样提供可能包含答案的文档或网页列表。 [4] 它于 2009 年 3 月由 Stephen Wolfram 宣布,并于 2009 年 5 月 15 日向公众发布。 [1] 它被《大众科学》评为 2009 年最伟大的计算机创新。[5][6]

http://en.wikipedia.org/wiki/Wolfram_Alpha

于 2011-05-09T19:41:09.813 回答
0

你试过 wolframalpha 吗?

看看这个:http ://www.wolframalpha.com/input/?i=who+is+the+president+of+brasil%3F

于 2011-05-09T19:41:36.857 回答
0

Ask Jeeves(现在的 Ask.com)曾经这样做过。为什么没有人再这样做了,除了 Wolfram:

  1. 问答 (QA) 远不是一个已解决的问题。
  2. 存在强大的问答系统,但它们需要对问题数据进行全面解析,因此即使与 Google 的规模相比,它们也需要大量的计算能力和存储才能获得任何覆盖。
  3. 大多数网络数据太嘈杂而无法处理;您首先必须检测它是否使用您支持的语言(或像一些研究人员所做的那样翻译它;搜索“跨语言问答”),然后尝试检测噪音,然后进行解析。你会失去更多的保障。
  4. 互联网以闪电般的速度变化。你会失去更多的覆盖面。
  5. 用户已经习惯了关键字搜索,因此更经济。
于 2011-05-09T19:51:00.220 回答
0

被微软收购的Powerset也在尝试做问答。他们将他们的产品称为“自然语言搜索引擎”,您可以在其中输入诸如“美国哪个州的所得税最高?”之类的问题。并搜索问题而不是使用关键字。

于 2011-05-15T15:45:14.227 回答