最近我意识到一个人必须擅长处理(解析)文本。它可能从解释 HTTP 响应或读取设置文件(*.ini 或 *.xml 或 *.json)到编写编译器或正则表达式引擎一样困难。
我同意现在我们有用于解释流行文本格式的库函数/方法。但是使用函数让我觉得缺少了一些东西。我不知道我错过了什么,但我肯定会因为对所有事情都使用函数而失去信心。
为了建立一些信心,我想尝试在 C 中进行一些文本处理。
任何人都可以建议一些中等水平但很好的项目吗?如果您能建议一些更复杂的有用项目,我们也将不胜感激。
最近我意识到一个人必须擅长处理(解析)文本。它可能从解释 HTTP 响应或读取设置文件(*.ini 或 *.xml 或 *.json)到编写编译器或正则表达式引擎一样困难。
我同意现在我们有用于解释流行文本格式的库函数/方法。但是使用函数让我觉得缺少了一些东西。我不知道我错过了什么,但我肯定会因为对所有事情都使用函数而失去信心。
为了建立一些信心,我想尝试在 C 中进行一些文本处理。
任何人都可以建议一些中等水平但很好的项目吗?如果您能建议一些更复杂的有用项目,我们也将不胜感激。
不太难,但您可以实现一个不错的 CSV 解析器?
开始但可能有用的项目:
/* ... */
) 的文本文件,编写一个从文件中删除注释的处理器。
对于更中间的项目,请考虑您感兴趣的功能域,并尝试为它编写简单的特定于域的语言。只处理解析语言的前端部分,一次处理语言的一小部分。
我想你会很快发现,对于更高级的文本处理,你会想要开始查看可以帮助你进行解析的库。我认为这可以很好地引导对正则表达式、lex/yacc、Antlr 甚至 Haskell/Parsec 的研究,如果你真的进入这种事情的话。无论哪种方式,您将不再仅仅依赖于其他人的文本处理器。
希望这可以帮助!