0

我有很大的 xml 文件,其中有很多数据(现在对我来说没有必要)和大量的程序。我想从最后读取 xml 以执行最后一个过程。(从最后一个 START PROCEDURE 到最后一个 END PROCEDURE 以及它们之间的所有内容)

我从一开始就尝试过,但效率不高,因为要花很长时间才能遍历所有数据,并且将每个过程作为最后一个过程,直到找到下一个过程。

我还尝试读取数组中的逐行存储,并使用 for 循环从末尾开始搜索,但这也需要很长时间。

getElementByTagName 也没有用,因为我有许多开始和结束过程,如果我必须通过所有这些过程,效率不是很高。

xml 文件具有以下格式: ............. ............. ............. <value> <struct> <member> <name> procedureAction </name> <value> 0 </value> </member> <member> <name> mainType </name> <value> 200 </value> </member> <member> <name> subType </name> <value> 30 </value> </member> <member> <name> time </name> <value> 1890 </value> </member> </struct> </value>

................. ................. ................. .................. <value> <struct> <member> <name> procedureAction </name> <value> 1 </value> </member> <member> <name> mainType </name> <value> 200 </value> </member> <member> <name> subType </name> <value> 30 </value> </member> <member> <name> time </name> <value> 1890 </value> </member> </struct> </value> ............. ............. ............. procedureAction 的值为 0 是一个 START,procedureAction 的值为 1 是一个 END。

如何从最后读取 xml 文件?迭代器不起作用,因为它需要固定大小的编码。

先感谢您。

找到“procedureAction”元素名称时,procedureSearch 函数会拆分 xml,并将该片段保存在数组中的某个位置。这是对所有包含procedureAction 的行进行的。我试图在数组中搜索最后一个“procedureAction value 0”,但花费了太多时间`private string[] procedureSearch(string inputXmlAsString){

    string[] returnValue = null;
    string[] split;
    string startSplit = "<value><struct><member><name>procedureAction</name><value>";
    string stopSplit = "</value></member></struct></value><value>";
    const int MAX_COUNT = 100000;
    string[] allResults = new string[MAX_COUNT];
    int allResultsCounter = 0;

    while (inputXmlAsString.CompareTo("") == 1) { 
        if (inputXmlAsString.Contains(startSplit)) {

            //if the text is contained in the remaining log...
            //split at the start (throw the split[0], keep split[1])
            split = inputXmlAsString.Split(new string[] { startSplit }, StringSplitOptions.RemoveEmptyEntries);
            string[] tempSplitter = null;
            //gather the remaining
            inputXmlAsString = string.Join(startSplit, split.Skip(1).ToList());
            //and split the remaining at the stop
            tempSplitter = inputXmlAsString.Split(new string[] { stopSplit }, StringSplitOptions.RemoveEmptyEntries);
            //connect from the start to the stop
            allResults[allResultsCounter] = startSplit + tempSplitter[0];
            string tempComp = stopSplit;
            tempSplitter = tempComp.Split(new String[] { "<value" }, StringSplitOptions.RemoveEmptyEntries);
            allResults[allResultsCounter] += tempSplitter[0];
            allResultsCounter++;

        } else {
            inputXmlAsString = "";
        }//if substring exists
        //Console.WriteLine("ReadLog after if: "+ readLog);

    }//while readLog not null

    returnValue = new string[allResultsCounter];
    for (int b = 0; b < allResultsCounter; b++) {
        returnValue[b] = allResults[b];
    }//for
    return returnValue;
}//end of procedureSearch function`

主要很简单:

string pieceOfXml = System.IO.File.ReadAllText(logPath); const int MAX = 100000; string[] allProcedures = new string[MAX]; int allProceduresCounter = 0; allProcedures = procedureSearch(pieceOfXml);

结果是一个包含近 3000 行的数组: 一条线的示例

<value><struct><member><name>procedureAction</name><value>20</value></member> <member><value><struct><member><name>mainType</name><value>31</value></member> <member><name>subType</name><value>0</value></member></struct></value></member> <member><name>time</name><value>97</value></member></member></struct></value>

4

0 回答 0