“reproducible-research”的相关标签问题

0 投票

1 回答

226 浏览

r - 限制可重现示例的分层数据的大小

我正在尝试为这个问题提出可重现的示例（RE）： Errors related to data frame columns during merging。要获得 RE 的资格，该问题仅缺少可重复的数据。但是，当我尝试使用非常标准的方法时dput(head(myDataObj))，产生的输出是 14MB 大小的文件。问题是我的数据对象是一个数据帧列表，因此head()限制似乎无法递归工作。

我还没有找到任何选项dput()和head()函数可以让我递归地控制复杂对象的数据大小。除非我在上面说错了，否则在这种情况下你会推荐什么其他方法来创建最小RE 数据集？

r dataset reproducible-research

2014-08-04T20:29:53.333

0 投票

8 回答

2901 浏览

julia - Julia 中加载/导入的包列表

如何获取 Julia 会话的导入/使用包列表？

Pkg.status()列出所有已安装的软件包。using ...我对通过或导入/加载的那些感兴趣import ...

似乎whos()包含相关信息（名称以及它是否是模块）。whos()可以在变量中捕获输出吗？

julia reproducible-research

2014-08-29T20:00:08.657

0 投票

1 回答

250 浏览

r - 使用 knitr 制作复杂的动态文档

下面的最小可重现示例 (RE)是我试图弄清楚如何使用它knitr来生成复杂的动态文档，这里的“复杂”不是指文档的元素及其布局，而是指底层 R 代码的非线性逻辑块。虽然提供的 RE 及其结果表明基于这种方法的解决方案可能效果很好，但我想知道：1）这是用于这种情况的正确方法吗？2）是否可以进行knitr任何优化以改进该方法；3）什么是替代方法，可以降低粒度的代码块。

EDA 源代码（文件“reEDA.R”）：

EDA 报告 R Markdown 文档（文件“reEDA.Rmd”）：

结果可以在这里找到：

http://rpubs.com/abrpubs/eda1

r knitr modularity r-markdown reproducible-research

2014-09-07T23:13:44.087

0 投票

0 回答

149 浏览

r - R 代码由 rmarkdown 评估，但文件为源时不评估

我在 RStudio 中编写我的 R 脚本。我也开始使用 RStudio 的 Rmarkdown notebook 功能。作为我工作流程的一部分，我希望 R 脚本包含在我获取代码和渲染笔记本时评估的一些 R 代码，以及仅在我渲染笔记本时评估的其他 R 代码，而不是在获取时评估。例如，典型的脚本可能具有以下格式：

其中#~可以作为在 R 中采购的注释和用于执行 R 代码的 rmarkdown 命令，类似于在使用函数#'时评估 markdown （不起作用——我做了这个来说明）。rmarkdown::render()#~

这个想法是让代码用于探索、操作和检查将呈现到笔记本中的数据，以记录数据探索和代码中做出的决策，包括图形和表格。这个相同的文件也可以用来从数据源操作（例如`source）工作数据框。获取文件只会导致修改数据，而不会生成图形或表格。

有没有办法在我描述的框架中做到这一点？

r rstudio r-markdown reproducible-research

2014-09-12T15:59:37.930

0 投票

1 回答

471 浏览

r - 在函数调用中包含对象（如 dput）的文本表示以进行可重复研究

我创建了一个闪亮的应用程序，用户可以在其中加载文件并将对象用作函数参数。我还打印代码以在本地运行该函数（以便我或其他任何人可以复制和粘贴以重现结果）。

我想做的是能够使用类似dput但将加载对象的文本表示保存到对象而不是控制台。dput输出到控制台，但只是返回它的第一个参数的副本。我可以使用deparse，但是当对象的长度超过 width.cutoff（默认 60 和最大 500）时它会失败。

以下骇人听闻的可重现示例说明了这一点。在其中我image用作示例函数。就我而言，我还有其他带有更多参数的函数。

我意识到我构造函数调用的方式是一种 hack，但是当我前一段时间查看它时，我找不到更好的方法。接受任何建议。谢谢。

r reproducible-research

2014-10-09T11:05:37.323

0 投票

2 回答

1526 浏览

python - 如何自动将 matplotlib 图形与 Adobe Illustrator 矢量插图结合起来？

我目前正在写一篇科学论文，并且正在使用 matplotlib 生成大部分数据。我有一个使用生成文件设置的管道，每当我更新数据时，它都会重新生成我的所有图。我的问题是这些图形由多个面板组成，其中一些面板应该包含我使用 Adobe Illustrator 创建的矢量插图。更新原始数据时，如何自动将图表与插图结合起来？我可以将矢量插图保存为光栅格式，然后使用 matplotlib 的imshow函数显示它们，但我希望输出是矢量以确保最佳的打印质量。

python matplotlib vector-graphics adobe-illustrator reproducible-research

2014-11-05T17:57:51.273

0 投票

1 回答

956 浏览

r - knitr 模板 - 动态块问题

对于我遇到的问题，以下代码是一个非常简化的MRE 。我试图避免R使用模板包，例如brew，并且仅用于knit_expand()实现我的目标。这个问题是双重的：

生成的块不会被解析（这在我的真实代码中没有发生，但在 MRE 中发生）
而不是 LaTeX \includegraphics，knitr（或rmarkdown，或pandoc）生成用于插入数字（）的 RMarkdown 语法![]。

对于前者，我有一种感觉，可能与我的错误使用get()或它的论点有关。您的建议将不胜感激。MRE如下（'.Rmd' 文件）：

r knitr pandoc r-markdown reproducible-research

2014-11-12T09:50:10.433

0 投票

1 回答

1379 浏览

parallel-processing - 在插入符号中设置种子并行随机森林以获得可重复的结果

我希望使用 caret 包并行运行随机森林，并且我希望设置可重现结果的种子，如使用 caret 的完全可重现并行模型中一样。但是，我不理解从插入符号帮助中获取的以下代码中的第 9 行：为什么我们采样 22（加上第 12、23 行中的最后一个模型）整数（评估参数 k 的 12 个值）？有关信息，我希望运行 5 倍 CV 来评估 RF 参数“mtry”的 584 个值。任何帮助深表感谢。谢谢你。

parallel-processing set seed r-caret reproducible-research

2015-01-14T13:53:20.690

0 投票

0 回答

280 浏览

r - install_bitbucket 或 install_github 并安装特定版本的依赖项

我有一个托管在 bitbucket 私有存储库上的包，并且想安装我的包以及在说明文件的 Depends 部分中指定的依赖项的特定版本：

有没有办法让 devtools 自动为 R 2.15.0 查找并安装 foo 版本 1.17-12？

我喜欢 devtools 能够从我的 bitbucket 存储库安装不同的参考（开发、主、我的功能分支等），然后安装它的所有依赖项，但是在不同的服务器上安装我的 R 包在不同的时间，意味着我可以轻松获取不需要的依赖包更改，并且我还需要让 R 始终保持最新状态，以便它找到所有包。

r devtools reproducible-research

2015-01-30T00:12:53.120

0 投票

1 回答

174 浏览

ruby - 将 dput() gists 从 github 读入 R

我正在尝试阅读包含dput来自 Github 的要点：

这会产生：

我认为这是一条Ruby错误消息，而不是 R 错误。现在考虑一下：

这似乎工作正常。前一个要点相当大，1.7mb。这可能是我无法从 Github 读取它的原因吗？如果不是，为什么？

ruby r reproducible-research

2015-02-09T20:02:57.633

问题标签 [reproducible-research]

Reference