我需要一个特定的描述(一个不会被正则表达式等东西混淆的描述),用于一个可以计算混合换行符的源文件的算法:
'\r', '\n', '\r\n', '\n\r'
我目前有以下算法。好吗?:
我确保始终位于第一个换行符类型的“边界”上。
在那个事件中,我比较了当前的字节字符。
3.1。如果是'\n',我算作结束当前行并开始新行。
3.2. 如果是'\r',我读取下一个字符(如果没有超出文本缓冲区的限制)并查看它是否是'\n'。如果是,我将其视为 '\r\n' 换行符。
3.3. 如果是'\r',并且下一个字符不是'\n',我把它算作'\r'产生的换行符;将当前行标记为结束并将其计为新行的开始。
如果它有用,我需要它来尝试对跨 Web 浏览器复制/粘贴的源文件和/或从具有不同类型换行符的多个文件附加的源文件产生更大的“可移植性”,并且我有我想要的解析工具以确保在所有情况下都具有正确且稳健的行为。