我有一个包含数千行数据的文件名。我正在读取文件名并对其进行编辑。
以下标签大约有 900 行或更多行(每个文件不同):
<Report name="test" xmlns:cm="http://www.example.org/cm">
我需要在几个文件中删除该行及其之前的所有内容。所以我需要代码来搜索该标签并将其删除,它上面的所有内容并不总是向下 900 行,它会有所不同;但是,标签将始终相同。
我已经有代码可以读取行并写入文件。我只需要找到那条线并删除它以及它之前的所有内容背后的逻辑。
我尝试逐行读取文件,然后在遇到该字符串后写入新文件,但逻辑不正确:
readFile = open(firstFile)
lines = readFile.readlines()
readFile.close()
w = open('test','w')
for item in lines:
if (item == "<Report name="test" xmlns:cm="http://www.example.org/cm">"):
w.writelines(item)
w.close()
此外,每个文件中的确切字符串也不相同。“测试”的值会有所不同。我可能需要检查标签名称“”<Report name”