我有很大的 xml 文件,其中有很多数据(现在对我来说没有必要)和大量的程序。我想从最后读取 xml 以执行最后一个过程。(从最后一个 START PROCEDURE 到最后一个 END PROCEDURE 以及它们之间的所有内容)
我从一开始就尝试过,但效率不高,因为要花很长时间才能遍历所有数据,并且将每个过程作为最后一个过程,直到找到下一个过程。
我还尝试读取数组中的逐行存储,并使用 for 循环从末尾开始搜索,但这也需要很长时间。
getElementByTagName 也没有用,因为我有许多开始和结束过程,如果我必须通过所有这些过程,效率不是很高。
xml 文件具有以下格式:
.............
.............
.............
<value>
<struct>
<member>
<name> procedureAction </name>
<value> 0 </value>
</member>
<member>
<name> mainType </name>
<value> 200 </value>
</member>
<member>
<name> subType </name>
<value> 30 </value>
</member>
<member>
<name> time </name>
<value> 1890 </value>
</member>
</struct>
</value>
.................
.................
.................
..................
<value>
<struct>
<member>
<name> procedureAction </name>
<value> 1 </value> </member>
<member>
<name> mainType </name>
<value> 200 </value>
</member>
<member>
<name> subType </name>
<value> 30 </value>
</member>
<member>
<name> time </name>
<value> 1890 </value>
</member>
</struct>
</value>
.............
.............
.............
procedureAction 的值为 0 是一个 START,procedureAction 的值为 1 是一个 END。
如何从最后读取 xml 文件?迭代器不起作用,因为它需要固定大小的编码。
先感谢您。
找到“procedureAction”元素名称时,procedureSearch 函数会拆分 xml,并将该片段保存在数组中的某个位置。这是对所有包含procedureAction 的行进行的。我试图在数组中搜索最后一个“procedureAction value 0”,但花费了太多时间`private string[] procedureSearch(string inputXmlAsString){
string[] returnValue = null;
string[] split;
string startSplit = "<value><struct><member><name>procedureAction</name><value>";
string stopSplit = "</value></member></struct></value><value>";
const int MAX_COUNT = 100000;
string[] allResults = new string[MAX_COUNT];
int allResultsCounter = 0;
while (inputXmlAsString.CompareTo("") == 1) {
if (inputXmlAsString.Contains(startSplit)) {
//if the text is contained in the remaining log...
//split at the start (throw the split[0], keep split[1])
split = inputXmlAsString.Split(new string[] { startSplit }, StringSplitOptions.RemoveEmptyEntries);
string[] tempSplitter = null;
//gather the remaining
inputXmlAsString = string.Join(startSplit, split.Skip(1).ToList());
//and split the remaining at the stop
tempSplitter = inputXmlAsString.Split(new string[] { stopSplit }, StringSplitOptions.RemoveEmptyEntries);
//connect from the start to the stop
allResults[allResultsCounter] = startSplit + tempSplitter[0];
string tempComp = stopSplit;
tempSplitter = tempComp.Split(new String[] { "<value" }, StringSplitOptions.RemoveEmptyEntries);
allResults[allResultsCounter] += tempSplitter[0];
allResultsCounter++;
} else {
inputXmlAsString = "";
}//if substring exists
//Console.WriteLine("ReadLog after if: "+ readLog);
}//while readLog not null
returnValue = new string[allResultsCounter];
for (int b = 0; b < allResultsCounter; b++) {
returnValue[b] = allResults[b];
}//for
return returnValue;
}//end of procedureSearch function`
主要很简单:
string pieceOfXml = System.IO.File.ReadAllText(logPath);
const int MAX = 100000;
string[] allProcedures = new string[MAX];
int allProceduresCounter = 0;
allProcedures = procedureSearch(pieceOfXml);
结果是一个包含近 3000 行的数组: 一条线的示例
<value><struct><member><name>procedureAction</name><value>20</value></member>
<member><value><struct><member><name>mainType</name><value>31</value></member>
<member><name>subType</name><value>0</value></member></struct></value></member>
<member><name>time</name><value>97</value></member></member></struct></value>