我想知道 stackoverflow 如何解析各种不同的代码并识别关键字、特殊字符、空格格式等。它对我相信的大多数代码都执行此操作,而且我注意到它甚至足够复杂,可以理解它解析的所有内容之间的关系,像这样:
String mystring1 = "inquotes"; //incomment
String mystring2 = "inquotes//incomment";
String mystring3 = //incomment"inquotes";
许多 IDE 也这样做。这是怎么做到的?
编辑:进一步解释 - 我不是在询问文本的解析,我的问题是,一旦我过了那部分......是否有类似通用 XML 方案或描述哪些字符串是关键字的交叉代码格式层次结构,哪些字符表示注释、文本字符串、逻辑运算符等。或者我必须成为我希望准确解析的任何语言的语法专家吗?