7

我在 Azure 机器学习的 Execute R 模块中操作的所有这些日期在输出中都写为空白 - 也就是说,这些日期列存在,但这些列中没有值。

包含我正在读入数据框中的日期信息的源变量有两种不同的日期格式。它们如下:

usage$Date1=c(‘8/6/2015’   ‘8/20/2015’  ‘7/9/2015’)
usage$Date2=c(‘4/16/2015 0:00’,  ‘7/1/2015 0:00’, ‘7/1/2015 0:00’) 

我检查了 AML 中的日志文件,但 AML 找不到本地时区。日志文件特别警告: [ModuleOutput] 1: In strptime(x, format, tz = tz) : [ModuleOutput] 无法识别当前时区 'C': [ModuleOutput] 请设置环境变量 'TZ' [ModuleOutput] [ModuleOutput ] 2:在 strptime(x, format, tz = tz) 中:未知时区'localtime'

我在这里提到了关于为 strptime 设置默认时区的另一个答案

R strptime/as.POSIXct 中的未知时区名称

我更改了代码以明确定义全局环境时间变量。

Sys.setenv(TZ='GMT')


####Data frame usage cleanup, format and labeling
usage<-as.data.frame(usage)
usage$Date1<-as.character(usage$Date1)
usage$Date1<-as.POSIXct(usage$Date1, "%m/%d/%Y",tz="GMT")
usage$Date1<-format(usage$Date1, "%m/%d/%Y")
usage$Date1<-as.Date(usage$Date1, "%m/%d/%Y")
usage<-as.data.frame(usage)

usage$Date2<- as.POSIXct(usage$Date2, "%m/%d/%Y",tz="GMT")
usage$Date2<- format(usage$Date2,"%m/%d/%Y")
usage$Date2<-as.Date(usage$Date2, "%m/%d/%Y")
usage<-as.data.frame(usage)

问题仍然存在 - 结果 AzureML 不会写出这些变量,而是将这些列写成空白。
(此代码在 R studio 中工作,我认为本地时间是从系统中获取的。)

在阅读了有关此问题的两篇博文后,Azure ML 似乎不支持某些日期时间格式:

http://blogs.msdn.com/b/andreasderuiter/archive/2015/02/03/troubleshooting-error-1000-rpackage-library-exception-failed-to-convert-robject-to-dataset-when-running- r-scripts-in-azure-ml.aspx

http://www.mikelanzetta.com/2015/01/data-cleaning-with-azureml-and-r-dates/

因此,我尝试在将其发送到输出流之前将其转换为 POSIXct,我的操作如下:tenantusage$Date1 = as.POSIXct(tenantusage$Date1, "%m/%d/%Y",tz = "EST5EDT "); 租户$Date2 = as.POSIXct(租户$Date2 , "%m/%d/%Y",tz = "EST5EDT");

但是遇到同样的问题。这些变量中的信息拒绝写入输出。Date1 和 Date2 列是空白的。

请指教!

谢谢

4

1 回答 1

1

嗨 SingingData 和 SochiX,

很遗憾听到这种挫败感!我发现 SingingData 的代码示例的以下变体对我有用(在 CRAN 3.1.0 模块中测试):

usage <- data.frame(list(Date1 = c('8/6/2015',   '8/20/2015',  '7/9/2015'),
                         Date2 = c('4/16/2015 0:00',  '7/1/2015 0:00', '7/1/2015 0:00')))
usage$Date1 <- as.POSIXlt(usage$Date1, "%m/%d/%Y",tz="GMT")
usage$Date2 <- as.POSIXlt(usage$Date2, "%m/%d/%Y",tz="GMT")

usage$Date1 <- format(usage$Date1, "%m/%d/%Y")
usage$Date2 <- format(usage$Date2,"%m/%d/%Y")

usage$Date1 <- as.Date(usage$Date1, "%m/%d/%Y")
usage$Date2 <- as.Date(usage$Date2, "%m/%d/%Y")

maml.mapOutputPort("usage");

我用过as.POSIXlt()而不是as.POSIXct(). 我希望这有助于解除您在 R 中的工作的障碍。

于 2016-10-10T17:47:29.863 回答