regular-language - 相关正则语言之间的泵送长度关系

Question

常规语言的抽吸长度与相关语言的抽吸长度有何关系。例如，如果 A :< B :< C 都是正则语言，k 是 B 的泵送长度，我们是否知道 A 和 C 的泵送长度？

当我们查看有限语言时，人们可能会天真地认为子语言具有较小的 (<=) 泵送长度。{a,ab,abc} :< {a,ab,abc,abcd} 的泵送长度分别为 4 <= 5。从集合中取出一个元素不能使其最长的单词更长。

另一方面，如果你看由两种语言的同步乘积形成的状态机，交集语言和并集语言具有相同的状态机结构，但不同之处在于交集的最终状态集是联盟的最终状态集。拥有更多的最终状态，可以使其更有可能通过状态机找到更短的路径。但相反，具有较少的最终状态使得状态机更有可能具有不可共同访问的状态，因此是可约的。

score 0 · Accepted Answer

首先请注意，一个字母表上的所有语言都通过某种关系与该字母表上的所有其他语言相关，但这是人为的。正如您所建议的那样，我们确实需要将讨论限制在类似subset的范围内，以便有意义地确定问题的范围。

现在，您已经正确地注意到，在一般情况下，这种subset关系对相关语言的抽水长度没有明确的影响。您可以轻松地a*比较{a^n}并证明最小 DFAa*几乎总是比{a^n}.

让我们进一步将自己限制在具有有限条目数的语言上；即是有限的L \ R，R \ L是有限的。这是一个相似性指标，不同于subset; 但是如果我们要求 wlogR \ L为空，那么我们将恢复一个受限版本的subset. 考虑到这个修改后的版本，我们现在可能会问同样的问题：对于在有限数量的条目上有所不同的语言，这种subset关系能告诉我们什么吗？

答案仍然是否定的。考虑L = a*和R = a* \ A，其中A是的有限非空子集a*。即便如此，L采取一种状态并R可能采取更多。

正如您所建议的那样，仅将自己限制在有限集确实让我们推断出您的建议：最小自动机 forR不会比 for 的状态多L。为什么是这样？我们必须有n+1状态来接受任何长度的字符串n，并且我们必须有一个死状态来接受不是语言的字符串（其中将有无限多）。如果语言是有限的，那么最小的 DFA 将根本没有循环（除了以死状态为中心），否则您将能够获得无限多的字符串。

您对笛卡尔积的观察是正确的，因为应用构造的结果为任何集合操作（并集、差集、交集等）提供了结构上相同的 DFA；然而，这些 DFA 不能保证是最小的，有限语言的观点仍然成立，即，在两台机器的 DFA 最小化之前和之后，交集的 DFA 不会比联合的状态多。

您可能可以采用 Myhill-Nerode 定理并使用允许您比较语言以确定哪些语言具有更大的最小 DFA 来定义“密切相关性”的概念。但是，我不确定这一点，因为这样做的简单方法可以让您与参数化参考语言进行比较，例如，轻松证明任何非常规语言都是非常规的，这在数学中可能很重要就其本身而言（例如，一般来说这是不可能的，或者它会证明 P=NP 等）。

regular-language - 相关正则语言之间的泵送长度关系

1 回答 1

Related

Reference