9

所以我们在我的 AI 课上学到了一些关于图灵测试的知识。这让我开始思考。我可以看到一些限制:

  1. 它仅限于特定的上下文。如果我不设计一个人工智能来与人类交谈怎么办?
  2. 它倾向于以人为本的行动胜过理性的行动。例如,如果我正在设计一个人工智能来控制核导弹,我真的希望它扮演人类吗?当然,这是一个极端的例子,但你明白了。
  3. 它可能受到不表明计算机可以进行人类思考的因素的影响。例如,假设我问 2334 * 321 是什么。我可以判断该设备是否是一台计算机,因为它可能会很快回答我,而人类必须弄清楚它。解决方案?让电脑暂停。

现在,我确信图灵测试在确定机器智能方面仍然占有一席之地。但我认为它的范围相当有限。有没有其他选择?就此而言,我认为它的局限性是错误的吗?

编辑:让我明确一点:我并不是建议应该放弃图灵测试。我只是好奇是否有任何其他测试可以克服其限制(可能将它们换成其他限制)。

4

6 回答 6

8

告诉你什么:在我们回答你的问题之前,先定义“智能”。

正如最初描述的那样,图灵测试也存在一些其他问题,其中最值得注意的是它不是“有效”的,也就是说无法判断它何时结束。

现在,看看你的(相当合理的)反对意见:一方面,如果它给出正确答案的速度太快,会让你怀疑;另一方面,你不确定如果它给出错误的答案会很好,即使它会让你认为它可能是“智能的”。

但是,现在,考虑我们的交互:你不知道我不是智能计算机。怎么样,作为星际迷航的参考,ST:TNG 上的数据先生?他当然与人类有区别,并且不会一直给予人类回应,但大多是通过。

现在,让我们考虑一下你遇到的一个人,他不是聪明人,而是完全是一种机制:没有“意识”,没有“灵魂”。(这种实体在文献中被称为“哲学僵尸”。) 除了那个缺失的“意识”之外,这个人,或一个人的拟像,在所有其他方面都像一个人:表达受伤时的痛苦,表现出吃好饭时的快乐,对小猫表示爱意和小孩. (更正,因为我想自己通过这个测试。)

你怎么能说这个哲学僵尸“聪明”?

这里的重点是你有很好的问题,但不一定有被广泛接受的答案。我自己对图灵测试的看法是它是一个很好的有效测试,因为它的重点,正如图灵自己所说,如果你不能区分智能或有感知的计算机,以及真正智能的实体,那么你必须假设没有区别。

您可以阅读的其他一些内容:

于 2009-01-10T17:24:32.583 回答
6

我认为您错过了图灵测试的重点。它并不是要评判人工智能算法的好坏,而是要模拟人类智能的人工智能算法的成功与否。从这个意义上说,它实际上更像是对人工智能最先进水平的测试,而不是任何特定的人工智能算法。也就是说,如果我们可以设计一个人工智能算法来通过这个测试,那么我们可以说我们能够用人工智能来开发具有人类智能的机器。

可以合理地假设还有其他测试同样足够,但是这个测试在其简单性和相对缺乏约束方面是优雅的。除了格式外,输入基本上没有限制。

于 2009-01-10T17:17:42.397 回答
3

菲利普·K·迪克(Philip K Dick)会和这个人一起度过一个愉快的一天……

1)。还存在哪些其他上下文?AI-海豚?人类智能是我们唯一可以直接体验到的(哲学仍然不确定),是唯一一个我们甚至可以开始接近任何经验和可测量的东西。其他一切都是二阶抽象。最好

2)。你真的希望人工智能理性行事吗?理性并没有说道德可以带你去一些可怕的地方。纯粹理性行事的人会做一些非常糟糕的事情。即使你将理性扩大到逻辑——两者并不相同——仍然有一些不可言喻的更多关于人类的东西。

3)。这就是诀窍不是吗?你不能停下来,因为大多数真实的人根本无法回答这个问题,或者会以非常人性化的方式回答——“错误,大约 750k ish”。图灵是关于外观的。

不要太拘泥于技术,这更像是一个哲学假设。

于 2009-01-10T17:25:44.797 回答
2

取决于您如何定义对话。

图灵的思想实验中使用的问答上下文可能看起来有限且做作。但是,如果您将其切换到医疗诊断会话或金融投资组合优化问题呢?这些感觉不像是问答环节,但仍然很难让机器与人类无法区分。

自然语言处理呢?仍然不是一个已解决的问题,因为自然语法不是上下文无关的。

我认为图灵测试仍然是一种思考问题的方式。

于 2009-01-10T17:09:13.880 回答
1

应该有替代方案,在某种程度上,图灵测试将 AI 与“人类智能”进行对比,而“人类智能”并不是唯一可能的类型。我们大多是聪明的,但通常只领先于像狗这样的生物,它们有自己的“智力”类型和自己的“逻辑”形式。如果你质疑一个可以通过 Turning 测试的 AI 足够长的时间,你会像任何其他人一样认为它在一些事情上是错误的。我们没有人是完美的,这是我们存在固有的(图灵测试可能会从双方失败)。

以下帖子可能会很有趣:决定论的必要性,因为它无论如何都质疑对人工智能的潜在需求。

至于另一种选择,有趣的是有一个测试来比较不同层次的一些“智能”行为,比如昆虫、狗、人类及以上。真正的问题是智能在其边缘的行为方式。这是人类的动态行为,即使他们没有足够的信息来处理事情,这是我们的定义属性之一。你会注意到计算机的故障方式,而不是它的工作方式(它试图模仿人)。

因此,如果您真的在寻找智能,那么当系统功能失调时,系统如何动态工作就变成了一个问题。如果您无法判断错误条件是什么,那么它是动态的,足以处理无限大量的输入。如果有一些输入导致输出发生明显变化,那么它就不够动态。

除了动态之外,您还可以衡量“思考”本身的质量。随着“思想”更加合乎逻辑和理性,它上升到跨越昆虫、狗、人、火神(是的,来自星际迷航)到纯数学的更高阶存在。我们不是唯一的智慧生物,我们只是比其他生物更具逻辑性和理性。图灵认为我们正处于巅峰,但我认为这很容易引起争议。一个好的测试可以显示出真正的智力水平。

保罗。

于 2009-01-10T19:44:06.483 回答
1

图灵测试中测试的能力不仅是自然语言理解,还有伪装成人类的能力。所以在电缆的另一端有一台伪装成人类的计算机,这就是为什么计算机认为在回答 2334*321 的结果之前暂停一下是合理的。这回答了 2) 和 3)。此外,“如果我正在设计一个人工智能来控制核导弹”——这就像设计一个可以钉钉子的手机一样错误。

据我了解,与人类交谈的能力是程序被认为是人工智能的最低要求。这回答 1)

很抱歉提出意见,但我认为图灵测试很棒。

于 2014-10-17T19:05:43.783 回答