我认为错误出在读取功能中。它无法读取超出图像中的特殊字符的内容请参阅 repr 输出
我在 python 中使用 string.find() 如下:
indexOfClosedDoc = temp.find("</DOC>",indexOfOpenDoc)
但是,当字符串具有如下文本时:
SUB
</DOC>
其中 SUB 是一个特殊字符, temp.find 找不到标签。对于如何解决这个问题,有任何的建议吗
例子:
导致它失败的代码:
handle = open("error.txt",'r');
temp = handle.read();
index = temp.find("</DOC>",0)
if(index == -1):
print "Error"
exit(1)
将图像文本放入文本文件并运行代码
这是示例中文本的 temp 变量的 repr。eror.txt 中的文本是图像中第 29722 行的所有内容
' </P>\n\n'
注意: read() 函数永远不会读取超出 SUB 所以查找是不可能的