问题标签 [microsoft-r]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 来自 RxSpssData 的变量信息中的舍入错误
我发现了我认为 MicrosoftR 处理来自 SPSS 的 .sav 文件的元数据的方式中的一个错误。
以下是变量视图的摘要:
我的代码:
数据读取良好:
然而,valueInfoCodes 不会:
在将数字列中的元数据转换为字符串之前,它似乎在使用某种楼层函数。
我试过使用options(scipen = 12)
但rxOptions(numDigits = 12)
没有成功。使用rxDataStep
而rxImport
不是不起作用。我相信错误出现在 RxSpssData() 函数中。
- 有没有人在使用 RxSpssData 或任何其他文件类型时遇到过这种情况?
- 有解决方法吗?
- 如果它是真正的错误,是否有正式的方式向 Microsoft 报告?
谢谢!
另外,我的会话信息:
编辑:在此处将示例 SAV 文件添加到 GitHub 存储库。
r - 微软 R .xdf 文件
我对 .xdf 文件有一些疑问:
- 这究竟是什么?
- 这种类型的文件是如何工作的?
- Microsoft R 如何处理这种类型的文件?
- data.frames 的优势是什么?
我真的很期待你的回答。
问候 R123456789
r - 如何在 SQL Server 上为 hadoop 远程执行正常的 R 函数?
如何在不使用 Microsoft rx 函数的情况下在 SQL Server 上执行正常的 R 代码?我认为ComputeContext“RxInSqlServer”不是正确的吗?但我找不到关于其他 ComputeContext 选项的好信息。
本声明可以做到这一点吗?
还是我只能用它来执行 rx 功能?另一个选项可能是在 RStudio 或 VisualStudio 中设置服务器连接?
我的问题是:我想通过 SQL Server 上的 ODBC-Connection 分析来自 hadoop 的数据,所以我想使用远程 SQL Server 的性能而不是 SQL Server 中的数据。然后我想用 sparklyr 分析 hadoop 数据。
摘要:我想使用远程服务器的性能而不是 SQL Server 数据。所以 RStudio 不应该在本地运行,它应该执行和使用远程服务器的内存。
谢谢!
sql-server - R:[unixODBC][驱动程序管理器]无法打开库“SQL Server”:找不到文件
这是我的代码。我在 R 中收到以下错误
[unixODBC][驱动程序管理器]无法打开库“SQL Server”:找不到文件
[unixODBC][驱动程序管理器]连接不存在 SQLDisconnect 中的 ODBC 错误无法打开数据源。doTryCatch(return(expr), name, parentenv, handler) 中的错误:无法打开数据源。
我已经在我的 linux 机器上安装了 MSSQL 和 unixODBC 驱动程序,它也在 /etc/odbc.ini 文件中得到反映
有人可以帮我吗?
microsoft-r - 使用 rxSetVarInfo 更改动态变量名称
尝试使用 rxSetVarInfo 更改 XDF 的变量名称。
我想合并几个具有常见 var 名称的数据集。(我知道 rxMerge 可以/将在需要的地方附加到文件名。我希望拥有比这更多的控制权。)
这有效:
那就是我知道原始列名的地方,pct.A
. 如果是动态的呢?outLetter
如果这是在一个用不同的 's多次调用的函数中怎么办?(“A”没有硬编码。)
这不起作用:
也没有:
是的,我可以对所有排列进行硬编码。试图找到一种更优雅的方法。
azure-blob-storage - Reading sas file from blob storage in R
I am trying to read .sas7bdat file from default container. I have tried following till now:
sas_file <- RxSasData("wasbs://container@storageaccount.blob.core.windows.net/abc/xyz.sas7bdat")
sas_df <- rxImport(sas_file)
but I get following error:
The file 'wasbs://container@storageaccount.blob.core.windows.net/abc/xyz.sas7bdat' does not exist.
Could not open data source. Error in doTryCatch(return(expr), name, parentenv, handler) : Could not open data source.
File exists at the mentioned location in code. Still it throws error. Can someone please help me this?
r - 从源重新加载自定义 R 包
我创建了一个自定义包,并希望将其部署到远程机器上。这是我目前的长期工作流程:
- 创建自定义包'my_package_0.1.0.tar.gz'
- scp 包到远程机器
- 创建远程会话
install.packages("/path/to/my_package0.1.0.tar.gz")
library('my_package')
当其他人连接到机器时,他们必须运行安装和库:
install.packages("/path/to/my_package0.1.0.tar.gz")
library('my_package')
有没有办法可以共享自定义包并使工作流程为:
- 创建远程会话
- 加载包
library('my_package')
r - 当我将数据框拆分为 R 中的训练和测试集时,是否应该删除未使用的级别?
我正在建立一个决策树分类模型。我所有的特征变量和标签变量都是因子类型。当我将数据集拆分为训练集和测试集时,这两个子集将包含未使用的级别。如果我在两个子集上降低水平,预测结果将非常不同,准确度会更低。
我想知道在预测建模的情况下以及其他情况下,处理这个级别问题的正确方法是什么。有什么建议吗?
这是一个使用封装中焊料样本数据的可重现示例。rpart
我选择Solder作为我的标签变量。这是一个平衡的数据集。
为什么在测试数据集中删除未使用的级别后会导致不同的预测结果?哪一种是进行预测的正确方法?
r - 如何使用 rxExec 运行标准 R 遥控器?
我正在尝试通过函数“rxExec”调用标准 R 代码来执行代码远程。
我的计算上下文是 RxInSqlServer() 并且与服务器的连接很好。
这个电话一般可以吗?或者有没有更好的方法通过 SQL R 服务器服务执行标准 R 远程?
有一个类似的例子,但没有只用返回值编写 Data-Output ia 表,我得到了同样的错误
错误消息:警告:命名空间 'CompatibilityAPI' 不可用,并且在处理对象 'inputObject' 时已被替换为 .GlobalEnv
插槽中的错误(来自,什么):类“RxSqlServerData”的这个对象没有名称为“maxColWidth”的插槽调用:源... anyStrings->validityMethod->as->asMethod->slot 执行停止
rxCompleteClusterJob(hpcServerJob,consoleOutput,autoCleanup)中的错误:没有可用的结果 - 最终作业状态:失败
谢谢!
r - 在 Microsoft R 中,优化返回不可重现的结果
我正在使用minpack.lm
Microsoft 版本或 R 上的包运行非线性最小平方。但是,对于每个复制,使用相同的数据,输出会有所不同。事实上,我的兴趣在于第二个参数,然而,即使它也有一些变化。Basenlminb
将返回相同的尴尬输出。
如果我使用 R 的 CRAN 版本,结果是可重现的。
可重现的例子:
使用的数据在这里。
难道我做错了什么?