2

我正在使用enumerator-0.4.10,我需要将传入流的不同部分的处理分配给不同的迭代(我正在解析一个巨大的XML文件,不同的子树有不同的处理逻辑)。由于子树不相交,因此一次只有一个迭代者处于活动状态。

我写了一个简单的例子,过滤流并将结果传递给一个迭代器;请看下文。但是,对于多个嵌套的迭代器,在我看来,我不能再使用枚举器了。我是否需要编写自己的包含多个内部迭代器的多枚举器?有更好的想法吗?

这是我的(初学者)单个嵌套迭代的代码:

module Main ( main ) where

import qualified Data.Enumerator as E ( Enumeratee, Step(..), Stream(..),
  checkDone, checkDoneEx, continue, enumList, joinI, run_, yield )
import Data.Enumerator ( ($$), (>>==) )
import qualified Data.Enumerator.List as EL ( consume )

-- cribbed from EL.concatMap
concatMapAccum :: Monad m => (s -> ao -> (s, [ai])) -> s ->
E.Enumeratee ao ai m b
concatMapAccum f s0 = E.checkDone (E.continue . step s0)
  where
    step _ k E.EOF = E.yield (E.Continue k) E.EOF
    step s k (E.Chunks xs) = loop s k xs
    loop s k [] = E.continue (step s k)
    loop s k (x:xs) = case f s x of
      (s', ais) -> k (E.Chunks $ ais) >>==
        E.checkDoneEx (E.Chunks xs) (\k' -> loop s' k' xs)

passFromTo :: Monad m => ((a -> Bool), (a -> Bool)) -> Bool -> E.Enumeratee a a m b
passFromTo (from, to) pass0 =
  concatMapAccum updatePass pass0
    where
      updatePass pass el = case (pass, from el, to el) of
        (True, _, to_el) -> (not to_el, [el])
        (False, True, _) -> (True, [el])
        (False, False, _) -> (False, [])

main :: IO()
main = do
  E.run_ (E.enumList 3 [1..20] $$
    E.joinI $ passFromTo ((\e -> e == 3 || e == 13), (\e -> e == 7 || e == 17)) False $$
    EL.consume) >>= print

$ ./dist/build/StatefulEnumeratee/StatefulEnumeratee
[3,4,5,6,7,13,14,15,16,17]
4

1 回答 1

1

是的,您需要一个将流传递给多个迭代器的枚举器,例如来自 iteratee-0.8.6 的Data.Iteratee.sequence_Data.Iteratee.Parallel.psequence_sequence_获取一个同时运行的迭代列表,并通过mapM该列表处理每个输入块。psequence_采用类似的参数,但在单独的 forkIO 线程中运行每个输入迭代。

在过去的一年里,已经有一些关于 haskell-cafe 和 iteratee 邮件列表的讨论,例如:http ://www.haskell.org/pipermail/haskell-cafe/2011-January/088319.html小心处理来自内部迭代的错误:在您的应用程序中,如果一个内部迭代失败,您是要终止所有迭代还是只终止那个,以及[如何] 传播这些错误。

于 2011-08-29T02:42:32.490 回答