“microsoft-r”的相关标签问题

0 投票

0 回答

197 浏览

r - 来自 RxSpssData 的变量信息中的舍入错误

我发现了我认为 MicrosoftR 处理来自 SPSS 的 .sav 文件的元数据的方式中的一个错误。

以下是变量视图的摘要：

我的代码：

数据读取良好：

然而，valueInfoCodes 不会：

在将数字列中的元数据转换为字符串之前，它似乎在使用某种楼层函数。

我试过使用options(scipen = 12)但rxOptions(numDigits = 12)没有成功。使用rxDataStep而rxImport不是不起作用。我相信错误出现在 RxSpssData() 函数中。

有没有人在使用 RxSpssData 或任何其他文件类型时遇到过这种情况？
有解决方法吗？
如果它是真正的错误，是否有正式的方式向 Microsoft 报告？

谢谢！

另外，我的会话信息：

编辑：在此处将示例 SAV 文件添加到 GitHub 存储库。

r microsoft-r

2017-04-19T16:59:30.260

0 投票

1 回答

2180 浏览

r - 微软 R .xdf 文件

我对 .xdf 文件有一些疑问：

这究竟是什么？
这种类型的文件是如何工作的？
Microsoft R 如何处理这种类型的文件？
data.frames 的优势是什么？

我真的很期待你的回答。

问候 R123456789

r microsoft-r

2017-04-20T20:33:33.560

0 投票

1 回答

282 浏览

r - 如何在 SQL Server 上为 hadoop 远程执行正常的 R 函数？

如何在不使用 Microsoft rx 函数的情况下在 SQL Server 上执行正常的 R 代码？我认为ComputeContext“RxInSqlServer”不是正确的吗？但我找不到关于其他 ComputeContext 选项的好信息。

本声明可以做到这一点吗？

还是我只能用它来执行 rx 功能？另一个选项可能是在 RStudio 或 VisualStudio 中设置服务器连接？

我的问题是：我想通过 SQL Server 上的 ODBC-Connection 分析来自 hadoop 的数据，所以我想使用远程 SQL Server 的性能而不是 SQL Server 中的数据。然后我想用 sparklyr 分析 hadoop 数据。

摘要：我想使用远程服务器的性能而不是 SQL Server 数据。所以 RStudio 不应该在本地运行，它应该执行和使用远程服务器的内存。

谢谢！

r hadoop rhadoop microsoft-r

2017-04-21T08:22:51.433

0 投票

2 回答

40216 浏览

sql-server - R：[unixODBC][驱动程序管理器]无法打开库“SQL Server”：找不到文件

这是我的代码。我在 R 中收到以下错误

[unixODBC][驱动程序管理器]无法打开库“SQL Server”：找不到文件

[unixODBC][驱动程序管理器]连接不存在 SQLDisconnect 中的 ODBC 错误无法打开数据源。doTryCatch(return(expr), name, parentenv, handler) 中的错误：无法打开数据源。

我已经在我的 linux 机器上安装了 MSSQL 和 unixODBC 驱动程序，它也在 /etc/odbc.ini 文件中得到反映

有人可以帮我吗？

sql-server r microsoft-r

2017-04-25T09:33:11.713

0 投票

1 回答

62 浏览

microsoft-r - 使用 rxSetVarInfo 更改动态变量名称

尝试使用 rxSetVarInfo 更改 XDF 的变量名称。

我想合并几个具有常见 var 名称的数据集。（我知道 rxMerge 可以/将在需要的地方附加到文件名。我希望拥有比这更多的控制权。）

这有效：

那就是我知道原始列名的地方，pct.A. 如果是动态的呢？outLetter如果这是在一个用不同的 's多次调用的函数中怎么办？（“A”没有硬编码。）
这不起作用：

也没有：

是的，我可以对所有排列进行硬编码。试图找到一种更优雅的方法。

microsoft-r

2017-04-27T22:07:39.177

0 投票

1 回答

366 浏览

azure-blob-storage - Reading sas file from blob storage in R

I am trying to read .sas7bdat file from default container. I have tried following till now:

sas_file <- RxSasData("wasbs://container@storageaccount.blob.core.windows.net/abc/xyz.sas7bdat")

sas_df <- rxImport(sas_file)

but I get following error:

The file 'wasbs://container@storageaccount.blob.core.windows.net/abc/xyz.sas7bdat' does not exist.

Could not open data source. Error in doTryCatch(return(expr), name, parentenv, handler) : Could not open data source.

File exists at the mentioned location in code. Still it throws error. Can someone please help me this?

azure-blob-storage microsoft-r

2017-04-28T13:00:03.733

0 投票

1 回答

97 浏览

r - 从源重新加载自定义 R 包

我创建了一个自定义包，并希望将其部署到远程机器上。这是我目前的长期工作流程：

创建自定义包'my_package_0.1.0.tar.gz'
scp 包到远程机器
创建远程会话
install.packages("/path/to/my_package0.1.0.tar.gz")
library('my_package')

当其他人连接到机器时，他们必须运行安装和库：

install.packages("/path/to/my_package0.1.0.tar.gz")
library('my_package')

有没有办法可以共享自定义包并使工作流程为：

创建远程会话
加载包library('my_package')

r microsoft-r deployr

2017-05-01T22:21:53.900

0 投票

0 回答

293 浏览

r - 当我将数据框拆分为 R 中的训练和测试集时，是否应该删除未使用的级别？

我正在建立一个决策树分类模型。我所有的特征变量和标签变量都是因子类型。当我将数据集拆分为训练集和测试集时，这两个子集将包含未使用的级别。如果我在两个子集上降低水平，预测结果将非常不同，准确度会更低。

我想知道在预测建模的情况下以及其他情况下，处理这个级别问题的正确方法是什么。有什么建议吗？

这是一个使用封装中焊料样本数据的可重现示例。rpart我选择Solder作为我的标签变量。这是一个平衡的数据集。

为什么在测试数据集中删除未使用的级别后会导致不同的预测结果？哪一种是进行预测的正确方法？

r machine-learning prediction microsoft-r

2017-05-02T03:22:53.647

0 投票

0 回答

396 浏览

r - 如何使用 rxExec 运行标准 R 遥控器？

我正在尝试通过函数“rxExec”调用标准 R 代码来执行代码远程。

我的计算上下文是 RxInSqlServer() 并且与服务器的连接很好。

这个电话一般可以吗？或者有没有更好的方法通过 SQL R 服务器服务执行标准 R 远程？

有一个类似的例子，但没有只用返回值编写 Data-Output ia 表，我得到了同样的错误

错误消息：警告：命名空间 'CompatibilityAPI' 不可用，并且在处理对象 'inputObject' 时已被替换为 .GlobalEnv

插槽中的错误（来自，什么）：类“RxSqlServerData”的这个对象没有名称为“maxColWidth”的插槽调用：源... anyStrings->validityMethod->as->asMethod->slot 执行停止

rxCompleteClusterJob（hpcServerJob，consoleOutput，autoCleanup）中的错误：没有可用的结果 - 最终作业状态：失败

谢谢！

r microsoft-r

2017-05-04T06:38:12.330

0 投票

0 回答

152 浏览

r - 在 Microsoft R 中，优化返回不可重现的结果

我正在使用minpack.lmMicrosoft 版本或 R 上的包运行非线性最小平方。但是，对于每个复制，使用相同的数据，输出会有所不同。事实上，我的兴趣在于第二个参数，然而，即使它也有一些变化。Basenlminb将返回相同的尴尬输出。

如果我使用 R 的 CRAN 版本，结果是可重现的。

可重现的例子：

使用的数据在这里。

难道我做错了什么？

r optimization intel-mkl non-linear-regression microsoft-r

2017-05-06T15:00:40.193

问题标签 [microsoft-r]

Reference