我正在开发一个解析 Cobol 程序的应用程序。在这些程序中,有些尊重传统的编码风格(第 8 列到第 72 列的程序文本),有些较新,不遵循这种风格。
在我的应用程序中,我需要确定编码风格,以便知道是否应该解析第 72 列之后的内容。
我已经能够确定程序是从第 1 列还是第 8 列开始,但是从第 1 列开始的 prog 也可以遵循第 72 列之后的注释规则。
所以我试图找到允许我确定第 72 列之后的文本是注释还是有效代码的规则。
我找到了一些,但很难说它是否每次都有效:
第 72 列后的点,确定句子的结尾,但我担心点也可以在评论中
在第 72 列之后找到语句的结束字符:
" ' ) }
在第 71 - 72 - 73 列查找 char,如果没有空格,则查找整个单词,并检查它是关键字还是 var。问题,它可以是 COPY 中的 var 或替换等...
我想知道您对这些规则有何看法,以及您是否有任何想法可以帮助我确定 Cobol 程序的编码风格。
我不需要 API 或其他我可以依赖的可靠规则。