问题标签 [microsoft-r]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 带有 R 的 SQL 2016 - 错误 HRESULT 0x80004004
我正在阅读一些关于使用 SQL 和 R 的教程。但是当我尝试运行 R 脚本以获取“ggplot”库时,我收到以下错误
原始脚本是
系统有 SQL 2016、SSMS 2017、MS R Open 3.4.0 与 R 的集成与 Visual Studio 2015 配合良好,没有错误。可以下载库包并运行没有错误的脚本。只有当我开始使用 SMSS 时,我才无法下载软件包
r - rxNeuralNet 中的反向鸢尾花公式
我试图弄清楚“R”如何将因子作为预测变量处理背后的机制。我在下面写的这些都不是好的做法,但是,这纯粹是出于好奇,所以会很感激任何想法。R 中的标准 Iris 数据集具有列:Sepal.Length、Sepal.Width、Petal.Length、Petal.Width、Species,其中最后一个是一个因素。处理这个数据集的标准方法是通过使用神经网络或树来演示分类算法,其中
我决定看看如果你把它反过来会发生什么:
rnn2 <- rnn1 <- rxNeuralNet(Petal.Width~Sepal.Length+Sepal.Width+Species,data = iris, numHiddenNodes = 100, numIterations = 1000,type = "regression")
然后我创建了我的测试数据框:
rxPredict() 然后给我一个物种“setosa”的分数 0.6058862。但是,很奇怪,这是我的问题,我可以为物种添加任何我想要的“字符串”,我仍然会得到一个预测。我输入Species="Jack"
, rxPredict 现在给出 1.545223 的分数。这很奇怪,因为在标准 R 中,如果您尝试针对任何不在原始数据集中的因素进行预测,它将引发因素错误。
有任何想法吗?
谢谢。
sql-server-2016 - Microsoft R 打开远程连接到 R-Server In-Database
我对不同的 R-Server 感到很困惑。有 Standalone 类型和 In-Database 类型。
我想要的是从带有 Microsoft R Open 3.3.3 的 R-Studio 到 R Server In-Database 类型(使用 mrsdeploy)而不是到 Standalone(我没有安装 Standalone)的连接。这甚至可能吗?还是 mrsdeploy 仅适用于独立类型?因为没有"Microsoft.RServer.Utils.AdminUtil.dll"
In-Database 类型,我可以在其中配置 webnode 和 cumputing 节点。
r - 在 R 中求和深度数据(连续行)
如何用 R 总结连续的深度数据?例如:
给定的输出应该是这样的:
首先用 去除负值cummax()
,因为深度只能在这种特殊情况下增加。因此:
现在通过 max-min ,您将获得的每个连续行的深度增加:(问题是如何执行此步骤)
最后总结这些最大值-最小值,输出就是上面给出的那个。
尝试实现输出的步骤:
例如,第一个明显的解决方案是 Air:
该解决方案消除了负面数据,由于预期的深度不断增加,这是必要的。问题是输出还考虑了每个连续子集之间的大步。因此,Air 的总和将是 12 而不是 7。
更糟糕的是使用aggreagte的解决方案,例如:
注意:过滤大跳跃的解决方案不是我想要的。当然,您可以再次为 Air 的示例硬编码一个限制,例如 <2:
为您提供几乎正确的结果,但无法正常工作。我很确定我正在寻找的功能已经有了,因为对于许多不同的任务来说这不是一个不常见的问题。
我想采用每种材料的每组连续行的最小值和最大值并将它们相加将是一种可能的解决方案,但我不确定如何仅将函数应用于连续子集。
r - splitting a XDF File / Dataset for training and testing
Is it possible to split a .xdf file in (the Microsoft RevoScaleR context) into a let's say 75% training and 25% test set? I know there is a function called rxSplit(), but, the documentation doesn't seem to apply to this case. Most of the examples online assign a column of random numbers to the dataset, and split it using that column.
Thanks. Thomas
sql-server - Microsoft R Server SQL NULL/缺失值
我在 Microsoft R 中使用 RxSqlServerData() 从 SQL Server 数据库导入表时遇到了一些问题。我在 SQL Server 中的数据库包含同时具有空白和 NULL 值的行。当我运行 RxSqlServerData 时,这些都被导入为“缺失”值,具体来说,<NA>
我可以在colInfo
参数中指定一些可以将这些作为因素导入的东西,比如“无”或类似的东西。
谢谢。
r - 在 SQL 和 R 中选择随机数据
我有这个 SQL-Server 代码:ABS(checksum(newid())%14
生成 0 到 13 之间的均匀分布的随机数。
更具体地说,我的 SQL 表中有一个包含这些随机数的列。在 R 中做一些分析,我现在已经使用 Microsoft-R / XDF 文件将此 SQL 表导入到 R 中。我想根据此列对 80%-20% 的数据创建一个测试和训练集。你知道我会怎么做吗?
谢谢。
r - XDF 文件:输出所有可能的组合
在base-R中,如果你有一个数据框并且想要输出所有可能的变量组合,你可以使用expand.grid()
在处理太大而无法存储在内存中的 XDF 文件时,我在 Microsoft R/RevoscaleR 中寻找类似的东西。
有任何想法吗?
谢谢!
r - 微软 rxNeuralNet 加速
在微软的 R NeuralNet 包中,有一个加速选项,您可以在其中指定“GPU”或“SSE”。我知道GPU是什么,有人知道SSE加速是什么吗?
谢谢!
r - 安装包的 mro 3.4.0 错误
R 3.4.0 的一般版本存在一个错误,该错误已针对 3.4.0 进行了修补,也包含在 3.4.1 中,但显然尚未针对 mro 3.4.0 进行修复。什么时候可以为 mro 提供修复/补丁?除了恢复到 mro 3.3.3 之外,还有什么解决方法?就目前而言,安装 mro 3.4.0 后,我无法安装任何软件包。
这是关于 R 3.4.0 的 SO 的类似帖子,但它没有涉及 Microsoft R Open。
这是关于 R 3.4.0/1 的错误修复的公告。 此版本修复了 R 3.4.0 发布后报告的一些小错误,包括尝试在 Windows 上安装软件包时有时会遇到的问题。
请注意,我也在MS R Open 论坛上发帖,但我想我可能更有可能在这里得到快速回复。
谢谢,
凯尔