问题标签 [microsoft-r]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
197 浏览

r - 来自 RxSpssData 的变量信息中的舍入错误

我发现了我认为 MicrosoftR 处理来自 SPSS 的 .sav 文件的元数据的方式中的一个错误。

以下是变量视图的摘要:

我的代码:

数据读取良好:

然而,valueInfoCodes 不会:

在将数字列中的元数据转换为字符串之前,它似乎在使用某种楼层函数。

我试过使用options(scipen = 12)rxOptions(numDigits = 12)没有成功。使用rxDataSteprxImport不是不起作用。我相信错误出现在 RxSpssData() 函数中。

  • 有没有人在使用 RxSpssData 或任何其他文件类型时遇到过这种情况?
  • 有解决方法吗?
  • 如果它是真正的错误,是否有正式的方式向 Microsoft 报告?

谢谢!

另外,我的会话信息:

编辑:在此处将示例 SAV 文件添加到 GitHub 存储库

0 投票
1 回答
2180 浏览

r - 微软 R .xdf 文件

我对 .xdf 文件有一些疑问:

  1. 这究竟是什么?
  2. 这种类型的文件是如何工作的?
  3. Microsoft R 如何处理这种类型的文件?
  4. data.frames 的优势是什么?

我真的很期待你的回答。

问候 R123456789

0 投票
1 回答
282 浏览

r - 如何在 SQL Server 上为 hadoop 远程执行正常的 R 函数?

如何在不使用 Microsoft rx 函数的情况下在 SQL Server 上执行正常的 R 代码?我认为ComputeContext“RxInSqlServer”不是正确的吗?但我找不到关于其他 ComputeContext 选项的好信息。

本声明可以做到这一点吗?

还是我只能用它来执行 rx 功能?另一个选项可能是在 RStudio 或 VisualStudio 中设置服务器连接?

我的问题是:我想通过 SQL Server 上的 ODBC-Connection 分析来自 hadoop 的数据,所以我想使用远程 SQL Server 的性能而不是 SQL Server 中的数据。然后我想用 sparklyr 分析 hadoop 数据。

摘要:我想使用远程服务器的性能而不是 SQL Server 数据。所以 RStudio 不应该在本地运行,它应该执行和使用远程服务器的内存。

谢谢!

0 投票
2 回答
40216 浏览

sql-server - R:[unixODBC][驱动程序管理器]无法打开库“SQL Server”:找不到文件

这是我的代码。我在 R 中收到以下错误

[unixODBC][驱动程序管理器]无法打开库“SQL Server”:找不到文件

[unixODBC][驱动程序管理器]连接不存在 SQLDisconnect 中的 ODBC 错误无法打开数据源。doTryCatch(return(expr), name, parentenv, handler) 中的错误:无法打开数据源。

我已经在我的 linux 机器上安装了 MSSQL 和 unixODBC 驱动程序,它也在 /etc/odbc.ini 文件中得到反映

有人可以帮我吗?

0 投票
1 回答
62 浏览

microsoft-r - 使用 rxSetVarInfo 更改动态变量名称

尝试使用 rxSetVarInfo 更改 XDF 的变量名称。

我想合并几个具有常见 var 名称的数据集。(我知道 rxMerge 可以/将在需要的地方附加到文件名。我希望拥有比这更多的控制权。)

这有效:

那就是我知道原始列名的地方,pct.A. 如果是动态的呢?outLetter如果这是在一个用不同的 's多次调用的函数中怎么办?(“A”没有硬编码。)
这不起作用:

也没有:

是的,我可以对所有排列进行硬编码。试图找到一种更优雅的方法。

0 投票
1 回答
366 浏览

azure-blob-storage - Reading sas file from blob storage in R

I am trying to read .sas7bdat file from default container. I have tried following till now:

sas_file <- RxSasData("wasbs://container@storageaccount.blob.core.windows.net/abc/xyz.sas7bdat")

sas_df <- rxImport(sas_file)

but I get following error:

The file 'wasbs://container@storageaccount.blob.core.windows.net/abc/xyz.sas7bdat' does not exist.

Could not open data source. Error in doTryCatch(return(expr), name, parentenv, handler) : Could not open data source.

File exists at the mentioned location in code. Still it throws error. Can someone please help me this?

0 投票
1 回答
97 浏览

r - 从源重新加载自定义 R 包

我创建了一个自定义包,并希望将其部署到远程机器上。这是我目前的长期工作流程:

  • 创建自定义包'my_package_0.1.0.tar.gz'
  • scp 包到远程机器
  • 创建远程会话
  • install.packages("/path/to/my_package0.1.0.tar.gz")
  • library('my_package')

当其他人连接到机器时,他们必须运行安装和库:

  • install.packages("/path/to/my_package0.1.0.tar.gz")
  • library('my_package')

有没有办法可以共享自定义包并使工作流程为:

  • 创建远程会话
  • 加载包library('my_package')
0 投票
0 回答
293 浏览

r - 当我将数据框拆分为 R 中的训练和测试集时,是否应该删除未使用的级别?

我正在建立一个决策树分类模型。我所有的特征变量和标签变量都是因子类型。当我将数据集拆分为训练集和测试集时,这两个子集将包含未使用的级别。如果我在两个子集上降低水平,预测结果将非常不同,准确度会更低。

我想知道在预测建模的情况下以及其他情况下,处理这个级别问题的正确方法是什么。有什么建议吗?

这是一个使用封装中焊料样本数据的可重现示例。rpart我选择Solder作为我的标签变量。这是一个平衡的数据集。

为什么在测试数据集中删除未使用的级别后会导致不同的预测结果?哪一种是进行预测的正确方法?

0 投票
0 回答
396 浏览

r - 如何使用 rxExec 运行标准 R 遥控器?

我正在尝试通过函数“rxExec”调用标准 R 代码来执行代码远程。

我的计算上下文是 RxInSqlServer() 并且与服务器的连接很好。

这个电话一般可以吗?或者有没有更好的方法通过 SQL R 服务器服务执行标准 R 远程?

有一个类似的例子,但没有只用返回值编写 Data-Output ia 表,我得到了同样的错误

错误消息:警告:命名空间 'CompatibilityAPI' 不可用,并且在处理对象 'inputObject' 时已被替换为 .GlobalEnv

插槽中的错误(来自,什么):类“RxSqlServerData”的这个对象没有名称为“maxColWidth”的插槽调用:源... anyStrings->validityMethod->as->asMethod->slot 执行停止

rxCompleteClusterJob(hpcServerJob,consoleOutput,autoCleanup)中的错误:没有可用的结果 - 最终作业状态:失败

谢谢!

0 投票
0 回答
152 浏览

r - 在 Microsoft R 中,优化返回不可重现的结果

我正在使用minpack.lmMicrosoft 版本或 R 上的包运行非线性最小平方。但是,对于每个复制,使用相同的数据,输出会有所不同。事实上,我的兴趣在于第二个参数,然而,即使它也有一些变化。Basenlminb将返回相同的尴尬输出。

如果我使用 R 的 CRAN 版本,结果是可重现的。

可重现的例子:

使用的数据在这里

难道我做错了什么?