7

我遇到了一个MNP包问题,我追踪到一个不幸的调用deparse(其最大宽度限制为 500 个字符)。

背景(如果您感到无聊,可以轻松跳过)

因为mnp使用某种特殊的语法来允许不同的选择集(您包括在公式定义中),所以当调用它cbind(choiceA,choiceB,...)时,我的公式调用的左侧是 1700 个字符左右。由于最多支持500 个字符,因此in 中的行作为其第一个元素:model.matrix.defaultdeparsedeparsewidth.cutoffsapply(attr(t, "variables"), deparse, width.cutoff = 500)[-1L]model.matrix.default

[1] "cbind(plan1, plan2, plan3, plan4, plan5, plan6, plan7, plan8, plan9, plan10, plan11, plan12, plan13, plan14, plan15, plan16, plan17, plan18, plan19, plan20, plan21, plan22, plan23, plan24, plan25, plan26, plan27, plan28, plan29, plan30, plan31, plan32, plan33, plan34, plan35, plan36, plan37, plan38, plan39, plan40, plan41, plan42, plan43, plan44, plan45, plan46, plan47, plan48, plan49, plan50, plan51, plan52, plan53, plan54, plan55, plan56, plan57, plan58, plan59, plan60, plan61, plan62, plan63, "       
[2] "    plan64, plan65, plan66, plan67, plan68, plan69, plan70, plan71, plan72, plan73, plan74, plan75, plan76, plan77, plan78, plan79, plan80, plan81, plan82, plan83, plan84, plan85, plan86, plan87, plan88, plan89, plan90, plan91, plan92, plan93, plan94, plan95, plan96, plan97, plan98, plan99, plan100, plan101, plan102, plan103, plan104, plan105, plan106, plan107, plan108, plan109, plan110, plan111, plan112, plan113, plan114, plan115, plan116, plan117, plan118, plan119, plan120, plan121, plan122, plan123, "
[3] "    plan124, plan125, plan126, plan127, plan128, plan129, plan130, plan131, plan132, plan133, plan134, plan135, plan136, plan137, plan138, plan139, plan140, plan141, plan142, plan143, plan144, plan145, plan146, plan147, plan148, plan149, plan150, plan151, plan152, plan153, plan154, plan155, plan156, plan157, plan158, plan159, plan160, plan161, plan162, plan163, plan164, plan165, plan166, plan167, plan168, plan169, plan170, plan171, plan172, plan173, plan174, plan175, plan176, plan177, plan178, plan179, "
[4] "    plan180, plan181, plan182, plan183, plan184, plan185, plan186, plan187, plan188, plan189, plan190, plan191, plan192, plan193, plan194, plan195, plan196, plan197, plan198, plan199, plan200, plan201, plan202, plan203, plan204, plan205, plan206, plan207, plan208, plan209, plan210, plan211, plan212, plan213, plan214, plan215, plan216, plan217, plan218, plan219, plan220, plan221, plan222, plan223, plan224, plan225, plan226, plan227, plan228, plan229, plan230, plan231, plan232, plan233, plan234, plan235, "
[5] "    plan236, plan237, plan238, plan239, plan240, plan241, plan242, plan243, plan244, plan245, plan246, plan247, plan248, plan249, plan250, plan251, plan252, plan253, plan254, plan255, plan256, plan257, plan258, plan259, plan260, plan261, plan262, plan263, plan264, plan265, plan266, plan267, plan268, plan269, plan270, plan271, plan272, plan273, plan274, plan275, plan276, plan277, plan278, plan279, plan280, plan281, plan282, plan283, plan284, plan285, plan286, plan287, plan288, plan289, plan290, plan291, "
[6] "    plan292, plan293, plan294, plan295, plan296, plan297, plan298, plan299, plan300, plan301, plan302, plan303, plan304, plan305, plan306, plan307, plan308, plan309, plan310, plan311, plan312, plan313)"  

model.matrix.default针对 data.frame 中的变量进行测试时,它会返回一个错误。

问题

为了解决这个问题,我编写了一个新deparse函数:

deparse <- function (expr, width.cutoff = 60L, backtick = mode(expr) %in% 
  c("call", "expression", "(", "function"), control = c("keepInteger", 
                                                        "showAttributes", "keepNA"), nlines = -1L)  {
    ret <- .Internal(deparse(expr, width.cutoff, backtick, .deparseOpts(control), nlines))
    paste0(ret,collapse="")
  }

但是,当我mnp再次运行并逐步执行时,它会出于相同的原因返回相同的错误(base::deparse正在运行,而不是我的deparse)。

这对我来说有点令人惊讶,因为我期望这个例子更典型,其中用户定义的函数暂时覆盖了基本函数:

> print <- function() {
+   cat("user-defined print ran\n")
+ }
> print()
user-defined print ran

我意识到解决这个问题的正确方法是重写model.matrix.default,但作为调试工具,我很好奇如何强制它使用我的deparse以及为什么预期的(由我)的行为在这里没有发生。

4

2 回答 2

4

提供的功能fixInNamespaceassignInNamespace允许编辑现有功能。你可以试试......但我不会因为deparse看起来太危险了:

 assignInNamespace("deparse", 
                  function (expr, width.cutoff = 60L, backtick = mode(expr) %in% 
               c("call", "expression", "(", "function"), control = c("keepInteger", 
               "showAttributes", "keepNA"), nlines = -1L)  {
    ret <- .Internal(deparse(expr, width.cutoff, backtick, .deparseOpts(control), nlines))
    paste0(ret,collapse="")
                         }   , "base")

帮助页面上有指示使用此类功能有限制,我不会对此类核心功能可能有额外的保护层感到惊讶。由于它通过副作用起作用,因此您不需要分配结果。

于 2012-05-20T16:08:35.293 回答
3

这就是带有命名空间的包搜索函数的方式,如第 1.6 节,编写 R 扩展的包命名空间中所述

命名空间在加载后即被密封。密封意味着不能更改导入和导出,也不能更改内部变量绑定。密封允许命名空间机制的更简单的实现策略。密封还允许代码分析和编译工具准确地识别对应于函数体中的全局变量引用的定义。

命名空间控制包中函数使用的变量的搜索策略。如果在本地没有找到,R 首先搜索包命名空间,然后是导入,然后是基本命名空间,然后是正常搜索路径。

于 2012-05-20T15:56:50.900 回答