5

我正在尝试将 Data.Binary.PutM monad 修改为 monad 转换器。所以我从改变它的定义开始

newtype PutM a = Put { unPut :: PairS a }

newtype PutM a = Put { unPut :: Identity (PairS a) }

然后当然我改变了return>>=函数的实现:

从:

return a = Put $ PairS a mempty
{-# INLINE return #-}

m >>= k  = Put $
    let PairS a w  = unPut m
        PairS b w1 = unPut (k a)
    in PairS b (w `mappend` w1)
{-# INLINE (>>=) #-}

m >> k  = Put $
    let PairS _ w  = unPut m
        PairS b w1 = unPut k
    in PairS b (w `mappend` w1)
{-# INLINE (>>) #-}

到:

return a = Put $! return $! PairS a mempty
{-# INLINE return #-}

m >>= k  = Put $!
    do PairS a w  <- unPut m
       PairS b w1 <- unPut (k a)
       return $! PairS b $! (w `mappend` w1)
{-# INLINE (>>=) #-}

m >> k  = Put $!
    do PairS _ w  <- unPut m
       PairS b w1 <- unPut k
       return $! PairS b $! (w `mappend` w1)
{-# INLINE (>>) #-}

好像 PutM monad 只是一个 Writer monad。不幸的是,这(再次)造成了空间泄漏。我很清楚(或者是吗?)ghc 正在推迟某个地方的评估,但我试图按照一些教程的建议$!而不是$任何地方放置,但这并没有帮助。另外,如果内存分析器向我显示的内容是这样的,我不确定它有什么帮助:

内存配置文件.

为了完整起见,这是我在使用原始 Data.Binary.Put monad 时得到的内存配置文件:

原始内存配置文件

如果有兴趣,这里是我用来测试它的代码,我用来编译、运行和创建内存配置文件的行是:

ghc -auto-all -fforce-recomp -O2 --make test5.hs && ./test5 +RTS -hT && hp2ps -c test5.hp && okular test5.ps

我希望我的内存泄漏问题不会惹恼任何人。我发现互联网上没有很多关于这个主题的好资源,这让新手一无所知。

感谢您的关注。

4

1 回答 1

7

正如stephen tetley他在评论中指出的那样,这里的问题在于过于严格。~(PairS b w')如果您只是为您的身份样本(在您的定义中)添加更多的惰性,(>>)您将获得相同的恒定内存运行图片:

data PairS a = PairS a {-# UNPACK #-}!Builder

sndS :: PairS a -> Builder
sndS (PairS _ !b) = b

newtype PutM a = Put { unPut :: Identity (PairS a) }

type Put = PutM ()

instance Monad PutM where
    return a = Put $! return $! PairS a mempty
    {-# INLINE return #-}

    m >>= k  = Put $!
        do PairS a w  <- unPut m
           PairS b w' <- unPut (k a)
           return $! PairS b $! (w `mappend` w')
    {-# INLINE (>>=) #-}

    m >> k  = Put $!
        do PairS _ w  <- unPut m
           ~(PairS b w') <- unPut k
           return $! PairS b $! (w `mappend` w')
    {-# INLINE (>>) #-}

tell' :: Builder -> Put
tell' b = Put $! return $! PairS () b

runPut :: Put -> L.ByteString
runPut = toLazyByteString . sndS . runIdentity . unPut

您实际上可以在这里使用普通元组,$而不是$!

PS再一次:正确的答案实际上是在stephen tetley评论中。问题是您的第一个示例使用延迟 let绑定来>>实现,因此Tree不会强制完全构建,因此“是流式传输的”。Tree您的 2nd Identity 示例很严格,所以我的理解是,在处理之前,整个都是在内存中构建的。实际上,您可以轻松地为第一个示例添加严格性,并观察它如何开始“占用”内存:

m >> k  = Put $
          case unPut m of
            PairS _ w ->
                case unPut k of
                  PairS b w' ->
                      PairS b (w `mappend` w')
于 2011-03-09T14:55:38.297 回答