问题标签 [ropensci]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在 ckanr 中创建、验证和比较数据模式(用于数据收集)
这是一个数据收集练习。下面的代码提取data
为 JSON。我想 (a) 将数据模式从这里打印/提取data
到Schema1
. 然后 (b) 将其与 some 进行比较Schema2
,因为我需要更改一些元数据标头名称和接受的值。Ckan 有一个 Python“IDatasetform”插件,我显然允许这种分析,但我不知道如何在 R 中执行此操作。谢谢
r - 如何在 R 的弹性包中使用 index_create() 索引数据
这是我在 R 中用于索引虹膜数据的代码。
但它给出了以下错误。
r - 弹性 with_position_offsets
当我在 R 中以弹性执行以下主体时出现错误。
错误信息是
错误:400 - [highlight] 无法解析字段 [fields]
没有"term_vector" : "with_positions_offsets",
我就不会出错。我怎样才能解决这个问题?我有弹性 v6。
r - 在 Linux 服务器上使用弹性时出错,但在 Windows 上没有错误
当我执行
在 linux 服务器上,我收到以下错误。
在windows上一切都很好。但是,如果我使用不同的主体执行 elastic::Search,它会起作用。所以这里是我的身体。
'{ "_source":["DOC_ID", "DELIVERY_ID", "CONTRIB_TS", "LANG", "SYS_NOT", "SURVEIL"], "query": { "bool": { "must": [ {"match_phrase ": { "CONTENT" : "XXX" }} ], "filter": [{ "term" : { "DELIVERY_ID" : "100" } },{ "term" : { "SYS_NOT" : "0" } } ] } }, "highlight": { "pre_tags" : [""], "post_tags" : [""], "fields" :{“内容”:{“片段大小”:200}}}}'
r - 将函数与 purrr 链接并引用嵌套变量
我正在从大型在线数据库 (GBIF) 中抓取数据,这需要三个步骤:(1) 将 GBIF“密钥”标识符与物种名称匹配,(2) 向数据库发送查询,获取下载密钥 (" res") 作为回报,以及 (3) 下载、导入和过滤与该物种相关的数据。我已经为其中的每一个编写了一个函数(不包括这里的实际代码,因为不幸的是它很长并且需要登录凭据):
我有数百个物种的列表,我想按顺序应用这三个函数。我知道它们单独工作,但我不知道如何将它们相互提供(可能使用purrr
?)并从前一个函数的嵌套输出中引用正确的输入。
因此,例如:
这就是我卡住的地方。我想将此列表结构中的键提供给下一个函数,但我不知道如何使用map
或其他函数正确引用它们。我可以通过手动为下一个函数创建一个新列表来做到这一点:
编辑:此输出的结构可能在这里造成问题。当我运行时listviewer::jsonedit(testres)
,它看起来就像一个普通的嵌套列表,其中条目 0 和 1 持有两个下载密钥。但是,当我运行时str(testres)
,我得到以下信息:
而且,对于第三个:
它成功地将带有所需数据的列表对象加载到 R 中(它有两个未命名的元素,0 和 1,每个元素都是每个物种的 28 个请求变量的列表)。get_gbif_key %>% get_gbif_res %>% get_gbif_dat
对以正确解压缩前面的列表结构的方式编写此工作流程的脚本有什么建议吗?
r - R drake 带有变量的文件名
我正在使用drake
创建多个输出文件,我想通过变量指定路径。就像是
但file_out
除了文字字符之外,似乎不适用于给它的参数。
举一个小代码示例:
代码设置
工作代码
直接指定文件:
失败代码
用于file.path
构造输出文件
我猜德雷克只找到文字字符串作为目标,而不是结果file.path(...)
,例如,这也失败了
知道如何解决吗?
r - 在 solr auery 中传递变量
我正在使用 r library solrium 使用 solr
在变量 conn1 中连接到 solr 后,我进行如下查询:
显然它不起作用。我尝试过在 Internet 上找到的技巧,例如 "price":p "price:${p}" "price":{p}
但这些都不起作用。
r - 停止德雷克计划使其重建之前已经建立的目标
我目前正在drake
运行一组 >1k 的模拟。我估计运行完整集大约需要两天时间,但我也预计我的计算机在此期间的任何时候都会崩溃,因为它已经崩溃了。
显然,停止该计划会丢弃任何已经构建的目标,因此本质上这意味着我不能将drake
其用于其预期目的。
我想我可以创建一个函数来实际编辑指定计划的 R 文件,以便drake
按顺序将目标添加到其缓存中,但这似乎完全不合时宜。
关于如何处理这个问题的任何想法?
编辑:实际问题似乎来自使用set.seed
我的数据生成函数内部。我知道drake
已经以确保可重复性的方式为用户执行此操作,但我认为如果我只是按照它们的方式保留函数,它不会改变任何东西,因为drake
将确保我选择的随机种子总是结束一样吗?猜不出来,但是由于我删除了该步骤,因此缓存很好,因此问题得到了解决。