我有以下文件,需要解析
--TestFile
Start ASDF123
Name "John"
Address "#6,US"
end ASDF123
以开头的--
行将被视为注释行。并且文件以“开始”开头并以end
. 后面的字符串Start
是 the UserID
,然后是name
andaddress
将在双引号内。
我需要解析文件并将解析后的数据写入 xml 文件。
所以生成的文件会像
<ASDF123>
<Name Value="John" />
<Address Value="#6,US" />
</ASDF123>
现在我使用模式匹配(Regular Expressions
)来解析上面的文件。这是我的示例代码。
/// <summary>
/// To Store the row data from the file
/// </summary>
List<String> MyList = new List<String>();
String strName = "";
String strAddress = "";
String strInfo = "";
方法:读取文件
/// <summary>
/// To read the file into a List
/// </summary>
private void ReadFile()
{
StreamReader Reader = new StreamReader(Application.StartupPath + "\\TestFile.txt");
while (!Reader.EndOfStream)
{
MyList.Add(Reader.ReadLine());
}
Reader.Close();
}
方法:FormateRowData
/// <summary>
/// To remove comments
/// </summary>
private void FormateRowData()
{
MyList = MyList.Where(X => X != "").Where(X => X.StartsWith("--")==false ).ToList();
}
方法:解析数据
/// <summary>
/// To Parse the data from the List
/// </summary>
private void ParseData()
{
Match l_mMatch;
Regex RegData = new Regex("start[ \t\r\n]*(?<Data>[a-z0-9]*)", RegexOptions.IgnoreCase);
Regex RegName = new Regex("name [ \t\r\n]*\"(?<Name>[a-z]*)\"", RegexOptions.IgnoreCase);
Regex RegAddress = new Regex("address [ \t\r\n]*\"(?<Address>[a-z0-9 #,]*)\"", RegexOptions.IgnoreCase);
for (int Index = 0; Index < MyList.Count; Index++)
{
l_mMatch = RegData.Match(MyList[Index]);
if (l_mMatch.Success)
strInfo = l_mMatch.Groups["Data"].Value;
l_mMatch = RegName.Match(MyList[Index]);
if (l_mMatch.Success)
strName = l_mMatch.Groups["Name"].Value;
l_mMatch = RegAddress.Match(MyList[Index]);
if (l_mMatch.Success)
strAddress = l_mMatch.Groups["Address"].Value;
}
}
方法:写文件
/// <summary>
/// To write parsed information into file.
/// </summary>
private void WriteFile()
{
XDocument XD = new XDocument(
new XElement(strInfo,
new XElement("Name",
new XAttribute("Value", strName)),
new XElement("Address",
new XAttribute("Value", strAddress))));
XD.Save(Application.StartupPath + "\\File.xml");
}
我听说过ParserGenerator
请帮助我使用 lex 和 yacc 编写解析器。这样做的原因是,我现有的 parser( Pattern Matching
) 不灵活,更多的是它不是正确的方式(我认为是这样)。
我如何使用ParserGenerator
(我已经阅读了代码项目示例一和代码项目示例二 ,但我仍然不熟悉)。请向我推荐一些输出 C# 解析器的解析器生成器。