-1

我的任务是一个扫描仪程序。我的字母如下:

all english letters (upper and lower), digits, 
plus the extra character _ (underscore) & ws. Identifier begins with a letter and can 
continue with any number of letters, digits or _ up to 10 significant characters.

我想确保我的表是正确的。出于某种原因,我的扫描仪无法使用下划线。我可以让它适用于字母和数字。我正在尝试缩小我的问题范围,并希望确保它不是表格。

这是我的表格,只是其中的一部分:

// state token      ws    L   D   _   
 {   0,  0,         0,    1, 11,  21, 
 {   1,  id_tk,    -1,    2,  2,   2,
 {   2,  id_tk,    -1,    3,  3,   3,
 {   3,  id_tk,    -1,    4,  4,   4,
 {   4,  id_tk,    -1,    5,  5,   5,
 {   5,  id_tk,    -1,    6,  6,   6,
 {   6,  id_tk,    -1,    7,  7,   7,
 {   7,  id_tk,    -1,    8,  8,   8,
 {   8,  id_tk,    -1,    9,  9,   9,
 {   9,  id_tk,    -1,   10, 10,  10,
 { 10, id_tk,      -1,   -2, -2,  -2,
 { 11, num_tk,     -1,   -1, 12,  -2,
 { 12, num_tk,     -1,   -1, 13,  -2,
 { 13, num_tk,     -1,   -1, 14,  -2,
 { 14, num_tk,     -1,   -1, 14,  -2,
 { 15, num_tk,     -1,   -1, 15,  -2,
 { 16, num_tk,     -1,   -1, 16,  -2,
 { 17, num_tk,     -1,   -1, 17,  -2,
 { 18, num_tk,     -1,   -1, 18,  -2,
 { 19, num_tk,     -1,   -1, 19,  -2,
 { 20, num_tk,     -1,   -1, 20,  -2,
 { 21, undrs_tk,   -1,   -2, -2,  -2,

传说如下:

WS = whitespace
L = letter
D = digit
_ = underscore

-1 = final state
-2 = error state

此表与上述字母表是否正确?我真的很感激帮助。谢谢

4

1 回答 1

1

你的规范说一个标识符有 10 个有效字符,这通常意味着标识符可以更长,为了比较目的,一个只是忽略超过 10 个字符。您的自动机拒绝任何长度超过 10 个字符的标识符。

您的规范没有指定 num_tk 和 undrs_tk 应该是什么,所以我无法评论它们。

您处理表格中的下划线没有明显问题。如果它不起作用,则问题可能出在您的驱动程序代码中,而您没有显示。

于 2013-11-04T08:42:01.687 回答