问题标签 [reproducible-research]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 限制可重现示例的分层数据的大小
我正在尝试为这个问题提出可重现的示例(RE) : Errors related to data frame columns during merging。要获得 RE 的资格,该问题仅缺少可重复的数据。但是,当我尝试使用非常标准的方法时dput(head(myDataObj))
,产生的输出是 14MB 大小的文件。问题是我的数据对象是一个数据帧列表,因此head()
限制似乎无法递归工作。
我还没有找到任何选项dput()
和head()
函数可以让我递归地控制复杂对象的数据大小。除非我在上面说错了,否则在这种情况下你会推荐什么其他方法来创建最小RE 数据集?
julia - Julia 中加载/导入的包列表
如何获取 Julia 会话的导入/使用包列表?
Pkg.status()
列出所有已安装的软件包。using ...
我对通过或导入/加载的那些感兴趣import ...
似乎whos()
包含相关信息(名称以及它是否是模块)。whos()
可以在变量中捕获输出吗?
r - 使用 knitr 制作复杂的动态文档
下面的最小可重现示例 (RE)是我试图弄清楚如何使用它knitr
来生成复杂的动态文档,这里的“复杂”不是指文档的元素及其布局,而是指底层 R 代码的非线性逻辑块。虽然提供的 RE 及其结果表明基于这种方法的解决方案可能效果很好,但我想知道:1)这是用于这种情况的正确方法吗?2)是否可以进行knitr
任何优化以改进该方法;3)什么是替代方法,可以降低粒度的代码块。
EDA 源代码(文件“reEDA.R”):
EDA 报告 R Markdown 文档(文件“reEDA.Rmd”):
结果可以在这里找到:
r - R 代码由 rmarkdown 评估,但文件为源时不评估
我在 RStudio 中编写我的 R 脚本。我也开始使用 RStudio 的 Rmarkdown notebook 功能。作为我工作流程的一部分,我希望 R 脚本包含在我获取代码和渲染笔记本时评估的一些 R 代码,以及仅在我渲染笔记本时评估的其他 R 代码,而不是在获取时评估。例如,典型的脚本可能具有以下格式:
其中#~
可以作为在 R 中采购的注释和用于执行 R 代码的 rmarkdown 命令,类似于在使用函数#'
时评估 markdown (不起作用——我做了这个来说明)。rmarkdown::render()
#~
这个想法是让代码用于探索、操作和检查将呈现到笔记本中的数据,以记录数据探索和代码中做出的决策,包括图形和表格。这个相同的文件也可以用来从数据源操作(例如`source)工作数据框。获取文件只会导致修改数据,而不会生成图形或表格。
有没有办法在我描述的框架中做到这一点?
r - 在函数调用中包含对象(如 dput)的文本表示以进行可重复研究
我创建了一个闪亮的应用程序,用户可以在其中加载文件并将对象用作函数参数。我还打印代码以在本地运行该函数(以便我或其他任何人可以复制和粘贴以重现结果)。
我想做的是能够使用类似dput
但将加载对象的文本表示保存到对象而不是控制台。dput
输出到控制台,但只是返回它的第一个参数的副本。我可以使用deparse
,但是当对象的长度超过 width.cutoff(默认 60 和最大 500)时它会失败。
以下骇人听闻的可重现示例说明了这一点。在其中我image
用作示例函数。就我而言,我还有其他带有更多参数的函数。
我意识到我构造函数调用的方式是一种 hack,但是当我前一段时间查看它时,我找不到更好的方法。接受任何建议。谢谢。
python - 如何自动将 matplotlib 图形与 Adobe Illustrator 矢量插图结合起来?
我目前正在写一篇科学论文,并且正在使用 matplotlib 生成大部分数据。我有一个使用生成文件设置的管道,每当我更新数据时,它都会重新生成我的所有图。我的问题是这些图形由多个面板组成,其中一些面板应该包含我使用 Adobe Illustrator 创建的矢量插图。更新原始数据时,如何自动将图表与插图结合起来?我可以将矢量插图保存为光栅格式,然后使用 matplotlib 的imshow
函数显示它们,但我希望输出是矢量以确保最佳的打印质量。
r - knitr 模板 - 动态块问题
对于我遇到的问题,以下代码是一个非常简化的MRE 。我试图避免R
使用模板包,例如brew
,并且仅用于knit_expand()
实现我的目标。这个问题是双重的:
- 生成的块不会被解析(这在我的真实代码中没有发生,但在 MRE 中发生)
- 而不是 LaTeX
\includegraphics
,knitr
(或rmarkdown
,或pandoc
)生成用于插入数字( )的 RMarkdown 语法![]
。
对于前者,我有一种感觉,可能与我的错误使用get()
或它的论点有关。您的建议将不胜感激。MRE如下('.Rmd' 文件):
parallel-processing - 在插入符号中设置种子并行随机森林以获得可重复的结果
我希望使用 caret 包并行运行随机森林,并且我希望设置可重现结果的种子,如使用 caret 的完全可重现并行模型中一样。但是,我不理解从插入符号帮助中获取的以下代码中的第 9 行:为什么我们采样 22(加上第 12、23 行中的最后一个模型)整数(评估参数 k 的 12 个值)?有关信息,我希望运行 5 倍 CV 来评估 RF 参数“mtry”的 584 个值。任何帮助深表感谢。谢谢你。
r - install_bitbucket 或 install_github 并安装特定版本的依赖项
我有一个托管在 bitbucket 私有存储库上的包,并且想安装我的包以及在说明文件的 Depends 部分中指定的依赖项的特定版本:
有没有办法让 devtools 自动为 R 2.15.0 查找并安装 foo 版本 1.17-12?
我喜欢 devtools 能够从我的 bitbucket 存储库安装不同的参考(开发、主、我的功能分支等),然后安装它的所有依赖项,但是在不同的服务器上安装我的 R 包在不同的时间,意味着我可以轻松获取不需要的依赖包更改,并且我还需要让 R 始终保持最新状态,以便它找到所有包。
ruby - 将 dput() gists 从 github 读入 R
我正在尝试阅读包含dput
来自 Github 的要点:
这会产生:
我认为这是一条Ruby
错误消息,而不是 R 错误。现在考虑一下:
这似乎工作正常。前一个要点相当大,1.7mb。这可能是我无法从 Github 读取它的原因吗?如果不是,为什么?