问题标签 [targets-r-package]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 在 RStudio Cloud 上终止安装 tensorflow
与此处和此处的帖子类似,当我尝试在新的 RStudio Cloud 项目中安装 TensorFlow 时遇到更多麻烦。我知道我需要在本地设置 Miniconda 和虚拟环境,/cloud/project/
以便 Python 依赖项与云项目的副本保持一致。以下安装脚本的早期版本有效。
但是当我尝试安装 Python 的 TensorFlow 和 Keras 时,我在 Cloud 上遇到错误:
我本地 Ubuntu 机器上的相同脚本似乎成功了,但它忽略了我的本地虚拟环境,即使我设置了WORKON_HOME
.
使用这种通用方法的示例项目:https ://github.com/wlandau/targets-keras 。
r - 目标包中缺少文件时触发代码
考虑以下代码,我的targets
管道中有两个文件。
这适用于下游效果,即如果我修改b.csv
,则下游 ( ) 的相应分支data
再次运行。但是我将如何创建一个向上游传播的目标(即,如果b.csv
缺少,那么我希望运行一个规则来重新创建它)。
谢谢,
r - 如何在德雷克/目标管道中使用 rgrass7 从 R 运行并行 GRASS GIS 地图集?
我想使用目标管道中的包 rgrass7 并行化我的 GRASS GIS 分析和计算。由于我是 GRASS 的新手,我不确定如何在同一个 GRASSGIS 数据库中正确设置多个地图集。到目前为止,我尝试了以下代码:
由reprex 包于 2021-03-16 创建(v0.3.0)
我正在使用 rgrass7_0.2-5 和独立的 winGRASS 7.8.5-2 都安装在默认目录中
我真的很感激一些关于如何做到这一点的提示!
r - R针对多个文件输出
我正在考虑使用 R targets
,但我很难让它接受多个文件输出。
例如,我希望能够获取一个数据集,创建一个训练/测试拆分并将每个数据集写入一个单独的文件。
MWE 将是
_targets.R
其中split_dataset()
定义在R/functions.R
一种替代方法是使用列表list(train = train, test = test)
,但如果可能,我希望能够访问任一数据集并将数据集保存为单独的文件。
另一种替代方法是在目标列表中定义索引,拆分数据集并将每个数据集写入单独的目标中。如果可能的话,我想将这些步骤浓缩为一个(如上所示),以使目标文件更易于理解。
r - R 目标与 H2O
我targets
用作 ML 项目的流水线工具H2O
。在这里使用 H2O 的主要独特之处在于它创建了一个新的“集群”(据我所知,基本上是一个新的本地进程/服务器,它通过 Rest API 进行通信)。
我遇到的问题有两个。
- 如何以智能方式停止/操作目标框架内的集群
- 如何在目标框架中保存和加载数据/模型
MWE
我想出的最小工作示例如下所示(作为_targets.R
文件):
这有点工作,但面临我在上面和下面的两个问题......
广告 1 - 停止集群
通常我会h2o::h2o.shutdown(prompt = FALSE)
在我的脚本末尾输出 a ,但这在这种情况下不起作用。或者,我想出了一个始终运行的新目标。
这在我运行时有效,tar_make()
但在我使用时无效tar_visnetwork()
。
另一种选择是使用。
我想出的另一种选择是在目标之外处理服务器并仅连接到它。但我觉得这可能会破坏目标工作流程......
您还有其他想法如何处理吗?
广告 2 - 保存数据集和模型
MWE 中的代码不会以正确的格式 ( )保存目标model
的数据。有时(我认为当集群重新启动时),数据会“无效”并且 h2o 会引发错误。R 会话中 h2o 格式的数据是指向 h2o 数据帧的指针(另请参见docs)。predict
format = "qs"
对于类似将模型存储在 R 之外的 keras,有选项,它在幕后format = "keras"
调用。同样,对于数据集和模型keras::save_model_hdf5()
,H2O 需要h2o::h2o.exportFile()
and (另见文档)。h2o::h2o.importFile()
h2o::h2o.saveModel()
h2o::h2o.loadModel()
有没有办法创建其他格式tar_targets
或者我需要将数据写入文件并返回文件?_targets
如果我没记错的话,这样做的缺点是该文件位于文件夹系统之外。
r - 我可以使用 R {targets} 包为不同的目标设置不同的并行度吗?
我正在测试这个targets
包并且在自定义并行化方面遇到了问题。我的工作流程有两个步骤,我想将第一步并行化超过 4 个工作人员,第二步并行化超过 16 个工作人员。
我想知道我是否可以通过调用来解决问题tar_make_future()
,然后在调用中指定每个步骤需要多少工人tar_target
。我在下面有一个简单的示例,我希望data
使用 1 个工作人员执行该sums
步骤,以及使用 3 个工作人员执行该步骤。
我知道一种选择是在每个步骤中单独配置并行后端,然后调用tar_make()
以串行执行工作流。我很好奇我是否可以得到这种结果tar_make_future()
。
r - 结合嵌套 `tar_map` 调用的结果
我正在创建一个管道,允许放入任意数量的数据集名称,它们都将通过类似的清理过程。为此,我使用targets
包,并使用tar_map
from 中的函数tarchetypes
,对每个数据集进行一系列整理和整理函数。
我现在的问题是一个数据集需要按一个因子(a la )分成三个数据集,split
而其余的应该保持不变。然后,管道理论上将通过单独处理每个数据集(包括三个“女儿”数据集)继续前进。
这是我最好的尝试:
跳过方法有点笨拙,我可能也在想那个错误。
我显然试图通过将它们放在一个列表中,最后将代码组合得很差,但我不知道还能做什么。
数据集不能通过 组合rbind
,因为实际上它们是SummarizedExperiment
对象。
任何帮助表示赞赏 - 如果需要进一步澄清,请告诉我。
r - 制作“{targets}”R 包的首选方法是检测我自己开发的 R 数据包中对函数和导出数据集的更改
我是这个{targets}
包的初学者,我想知道在 R 数据包中注册我自己开发的函数(和数据集)的依赖关系的正确设置是什么。
我的想法是为我{targets}
的这个假设的 R 数据包开发生成多个导出数据集和磁盘上文件的有点复杂的工作流程:{MyRDataPackage}
. 而且我希望那些生成这些数据集/文件的data-raw/
函数从包本身导出函数,即我宁愿不让它们source("R/functions.R")
在_targets.R
.
通过阅读第 6.3 章 Dependencies,我觉得我可以采用这种方法:
但进一步阅读,即在第 6.5 章基于包的失效中,似乎我也可以将我的{MyRDataPackage
} 传递给imports
参数:
所以我的问题是:这两种方法都好吗?或者,有理由更喜欢其中一个吗?
r - 无法在目标管道中呈现蒸馏文章
我是目标生态系统的新手。我无法从我的目标管道创建蒸馏文章,尽管当我将输出设置为html_document
yaml 时它可以工作。我试过谷歌搜索,但找不到任何有用的东西。任何帮助,将不胜感激。
我的 RStudio 是 1.4.1717 版。运行时收到此错误消息tar_make()
:
这是一个最小的代码示例。
代码在_targets.R
这是我的 Rmd 文件的内容。其中大部分来自模板。
会话信息