我尝试这样做:
解析表单中的文本:
一些文本 #{0,0,0} 一些文本 #{0,0,0}#{0,0,0} 更多文本 #{0,0,0}
进入一些数据结构的列表:
[Inside "Some Text",Outside (0,0,0),Inside "some Text",Outside (0,0,0),Outside (0,0,0),Inside "more Text",Outside (0, 0,0)]
所以这些 #{a,b,c} 位应该变成与文本的其余部分不同的东西。
我有这个代码:
module ParsecTest where
import Text.ParserCombinators.Parsec
import Monad
type Reference = (Int, Int, Int)
data Transc = Inside String | Outside Reference
deriving (Show)
text :: Parser Transc
text = do
x <- manyTill anyChar ((lookAhead reference) <|> (eof >> return (Inside "")));
return (Inside x)
transc = reference <|> text
alot :: Parser [Transc]
alot = do
manyTill transc eof
reference :: Parser Transc
reference = try (do{ char '#';
char '{';
a <- number;
char ',';
b <- number;
char ',';
c <- number;
char '}';
return (Outside (a,b,c)) })
number :: Parser Int
number = do{ x <- many1 digit;
return (read x) }
这按预期工作。您可以通过键入在 ghci 中进行测试
parseTest alot "Some Text #{0,0,0} some Text #{0,0,0}#{0,0,0} more Text #{0,0,0}"
但我觉得不好看。
1)lookAhead
对于我的问题真的有必要使用吗?
2)这是return (Inside "")
一个丑陋的黑客吗?
3)通常是否有更简洁/更智能的方式来归档相同内容?