如何使用可能由空格分隔或不分隔的令牌列表?
我正在尝试使用(6.1.2)以cedict格式解析中文罗马化(拼音)。nom
例如"ni3 hao3 ma5"
,由于转录中的人为错误,有时写为"ni3hao3ma5"
或"ni3hao3 ma5"
(注意可变间距)。
我已经编写了一个解析器来处理单个音节,例如["ni3", "hao3", "ma5"]
,我正在尝试使用 anom::multi::separated_list0
来解析它,如下所示:
nom::multi::separated_list0(
nom::character::complete::space0,
syllable,
)(i)?;
Err(Error(Error { input: "", code: SeparatedList }))
但是,在所有代币都被消耗后,我得到了一个。