artificial-intelligence - 图灵测试的替代方案

Question

所以我们在我的 AI 课上学到了一些关于图灵测试的知识。这让我开始思考。我可以看到一些限制：

它仅限于特定的上下文。如果我不设计一个人工智能来与人类交谈怎么办？
它倾向于以人为本的行动胜过理性的行动。例如，如果我正在设计一个人工智能来控制核导弹，我真的希望它扮演人类吗？当然，这是一个极端的例子，但你明白了。
它可能受到不表明计算机可以进行人类思考的因素的影响。例如，假设我问 2334 * 321 是什么。我可以判断该设备是否是一台计算机，因为它可能会很快回答我，而人类必须弄清楚它。解决方案？让电脑暂停。

现在，我确信图灵测试在确定机器智能方面仍然占有一席之地。但我认为它的范围相当有限。有没有其他选择？就此而言，我认为它的局限性是错误的吗？

编辑：让我明确一点：我并不是建议应该放弃图灵测试。我只是好奇是否有任何其他测试可以克服其限制（可能将它们换成其他限制）。

score 8 · Accepted Answer

告诉你什么：在我们回答你的问题之前，先定义“智能”。

正如最初描述的那样，图灵测试也存在一些其他问题，其中最值得注意的是它不是“有效”的，也就是说无法判断它何时结束。

现在，看看你的（相当合理的）反对意见：一方面，如果它给出正确答案的速度太快，会让你怀疑；另一方面，你不确定如果它给出错误的答案会很好，即使它会让你认为它可能是“智能的”。

但是，现在，考虑我们的交互：你不知道我不是智能计算机。怎么样，作为星际迷航的参考，ST:TNG 上的数据先生？他当然与人类有区别，并且不会一直给予人类回应，但大多是通过。

现在，让我们考虑一下你遇到的一个人，他不是聪明人，而是完全是一种机制：没有“意识”，没有“灵魂”。（这种实体在文献中被称为“哲学僵尸”。）除了那个缺失的“意识”之外，这个人，或一个人的拟像，在所有其他方面都像一个人：表达受伤时的痛苦，表现出吃好饭时的快乐，对小猫表示爱意~~和小孩~~. （更正，因为我想自己通过这个测试。）

你怎么能说这个哲学僵尸不“聪明”？

这里的重点是你有很好的问题，但不一定有被广泛接受的答案。我自己对图灵测试的看法是它是一个很好的有效测试，因为它的重点，正如图灵自己所说，如果你不能区分智能或有感知的计算机，以及真正智能的实体，那么你必须假设没有区别。

您可以阅读的其他一些内容：

阅读约翰塞尔的“中国房间”
阅读 Doug Hofstadter 的“哥德尔·埃舍尔·巴赫：永恒的金色辫子”

score 6 · Accepted Answer

我认为您错过了图灵测试的重点。它并不是要评判人工智能算法的好坏，而是要模拟人类智能的人工智能算法的成功与否。从这个意义上说，它实际上更像是对人工智能最先进水平的测试，而不是任何特定的人工智能算法。也就是说，如果我们可以设计一个人工智能算法来通过这个测试，那么我们可以说我们能够用人工智能来开发具有人类智能的机器。

可以合理地假设还有其他测试同样足够，但是这个测试在其简单性和相对缺乏约束方面是优雅的。除了格式外，输入基本上没有限制。

score 3 · Accepted Answer

菲利普·K·迪克（Philip K Dick）会和这个人一起度过一个愉快的一天……

1）。还存在哪些其他上下文？AI-海豚？人类智能是我们唯一可以直接体验到的（哲学仍然不确定），是唯一一个我们甚至可以开始接近任何经验和可测量的东西。其他一切都是二阶抽象。最好

2）。你真的希望人工智能理性行事吗？理性并没有说道德可以带你去一些可怕的地方。纯粹理性行事的人会做一些非常糟糕的事情。即使你将理性扩大到逻辑——两者并不相同——仍然有一些不可言喻的更多关于人类的东西。

3）。这就是诀窍不是吗？你不能停下来，因为大多数真实的人根本无法回答这个问题，或者会以非常人性化的方式回答——“错误，大约 750k ish”。图灵是关于外观的。

不要太拘泥于技术，这更像是一个哲学假设。

score 2 · Accepted Answer

取决于您如何定义对话。

图灵的思想实验中使用的问答上下文可能看起来有限且做作。但是，如果您将其切换到医疗诊断会话或金融投资组合优化问题呢？这些感觉不像是问答环节，但仍然很难让机器与人类无法区分。

自然语言处理呢？仍然不是一个已解决的问题，因为自然语法不是上下文无关的。

我认为图灵测试仍然是一种思考问题的方式。

score 1 · Accepted Answer

应该有替代方案，在某种程度上，图灵测试将 AI 与“人类智能”进行对比，而“人类智能”并不是唯一可能的类型。我们大多是聪明的，但通常只领先于像狗这样的生物，它们有自己的“智力”类型和自己的“逻辑”形式。如果你质疑一个可以通过 Turning 测试的 AI 足够长的时间，你会像任何其他人一样认为它在一些事情上是错误的。我们没有人是完美的，这是我们存在固有的（图灵测试可能会从双方失败）。

以下帖子可能会很有趣：决定论的必要性，因为它无论如何都质疑对人工智能的潜在需求。

至于另一种选择，有趣的是有一个测试来比较不同层次的一些“智能”行为，比如昆虫、狗、人类及以上。真正的问题是智能在其边缘的行为方式。这是人类的动态行为，即使他们没有足够的信息来处理事情，这是我们的定义属性之一。你会注意到计算机的故障方式，而不是它的工作方式（它试图模仿人）。

因此，如果您真的在寻找智能，那么当系统功能失调时，系统如何动态工作就变成了一个问题。如果您无法判断错误条件是什么，那么它是动态的，足以处理无限大量的输入。如果有一些输入导致输出发生明显变化，那么它就不够动态。

除了动态之外，您还可以衡量“思考”本身的质量。随着“思想”更加合乎逻辑和理性，它上升到跨越昆虫、狗、人、火神（是的，来自星际迷航）到纯数学的更高阶存在。我们不是唯一的智慧生物，我们只是比其他生物更具逻辑性和理性。图灵认为我们正处于巅峰，但我认为这很容易引起争议。一个好的测试可以显示出真正的智力水平。

保罗。

score 1 · Accepted Answer

图灵测试中测试的能力不仅是自然语言理解，还有伪装成人类的能力。所以在电缆的另一端有一台伪装成人类的计算机，这就是为什么计算机认为在回答 2334*321 的结果之前暂停一下是合理的。这回答了 2) 和 3)。此外，“如果我正在设计一个人工智能来控制核导弹”——这就像设计一个可以钉钉子的手机一样错误。

据我了解，与人类交谈的能力是程序被认为是人工智能的最低要求。这回答 1)

很抱歉提出意见，但我认为图灵测试很棒。

artificial-intelligence - 图灵测试的替代方案

6 回答 6

Related

Reference