首先请注意,一个字母表上的所有语言都通过某种关系与该字母表上的所有其他语言相关,但这是人为的。正如您所建议的那样,我们确实需要将讨论限制在类似subset
的范围内,以便有意义地确定问题的范围。
现在,您已经正确地注意到,在一般情况下,这种subset
关系对相关语言的抽水长度没有明确的影响。您可以轻松地a*
比较{a^n}
并证明最小 DFAa*
几乎总是比{a^n}
.
让我们进一步将自己限制在具有有限条目数的语言上;即是有限的L \ R
,R \ L
是有限的。这是一个相似性指标,不同于subset
; 但是如果我们要求 wlogR \ L
为空,那么我们将恢复一个受限版本的subset
. 考虑到这个修改后的版本,我们现在可能会问同样的问题:对于在有限数量的条目上有所不同的语言,这种subset
关系能告诉我们什么吗?
答案仍然是否定的。考虑L = a*
和R = a* \ A
,其中A
是 的有限非空子集a*
。即便如此,L
采取一种状态并R
可能采取更多。
正如您所建议的那样,仅将自己限制在有限集确实让我们推断出您的建议:最小自动机 forR
不会比 for 的状态多L
。为什么是这样?我们必须有n+1
状态来接受任何长度的字符串n
,并且我们必须有一个死状态来接受不是语言的字符串(其中将有无限多)。如果语言是有限的,那么最小的 DFA 将根本没有循环(除了以死状态为中心),否则您将能够获得无限多的字符串。
您对笛卡尔积的观察是正确的,因为应用构造的结果为任何集合操作(并集、差集、交集等)提供了结构上相同的 DFA;然而,这些 DFA 不能保证是最小的,有限语言的观点仍然成立,即,在两台机器的 DFA 最小化之前和之后,交集的 DFA 不会比联合的状态多。
您可能可以采用 Myhill-Nerode 定理并使用允许您比较语言以确定哪些语言具有更大的最小 DFA 来定义“密切相关性”的概念。但是,我不确定这一点,因为这样做的简单方法可以让您与参数化参考语言进行比较,例如,轻松证明任何非常规语言都是非常规的,这在数学中可能很重要就其本身而言(例如,一般来说这是不可能的,或者它会证明 P=NP 等)。