0

我在下面编写了函数(经过测试和工作):

import pandas as pd

def ConvertStrDateToWeekId(strDate):
    dateformat = '2016-7-15 22:44:09'
    aDate = pd.to_datetime(strDate)
    wk = aDate.isocalendar()[1]
    yr = aDate.isocalendar()[0]
    Format_4_5_4_date = str(yr) + str(wk)
    return Format_4_5_4_date'

从我在网上看到的情况来看,我应该能够以这种方式使用它:

ml_poLines = result.value.select('PURCHASEORDERNUMBER', 'ITEMNUMBER', PRODUCTCOLORID', 'RECEIVINGWAREHOUSEID', ConvertStrDateToWeekId('CONFIRMEDDELIVERYDATE'))

但是,当我“显示”我的数据框时,该"CONFIRMEDDELIVERYDATE"列是原始日期时间字符串!没有给出错误。

我也试过这个:

ml_poLines['WeekId'] = (ConvertStrDateToWeekId(ml_poLines['CONFIRMEDDELIVERYDATE']))

并得到以下错误:

"ValueError: Cannot convert column into bool: please use '&' for 'and', '|' for 'or', '~' for 'not' when building DataFrame boolean expressions." which makes no sense to me.

我也试过这个没有成功。

 x = ml_poLines.toPandas();
 x['testDates'] = ConvertStrDateToWeekId(x['CONFIRMEDDELIVERYDATE'])
 ml_poLines2 = spark.createDataFrame(x)
 ml_poLines2.show()

以上产生以下错误:

AttributeError: 'Series' object has no attribute 'isocalendar'

我做错了什么?

4

2 回答 2

1

您的函数ConvertStrDateToWeekId需要一个字符串。但在下一行中,函数调用的参数是一系列字符串:

x['testDates'] = ConvertStrDateToWeekId(x['CONFIRMEDDELIVERYDATE'])

此错误的可能解决方法是使用applypandas 的 -function:

x['testDates'] = x['CONFIRMEDDELIVERYDATE'].apply(ConvertStrDateToWeekId)

但是,如果没有有关您正在处理的数据类型的更多信息,就很难提供进一步的帮助。

于 2018-12-10T21:45:14.053 回答
0

这是我必须工作的解决方法:

`# convert the confirimedDeliveryDate to a WeekId
 x= ml_poLines.toPandas();
 x['WeekId'] = x[['ITEMNUMBER', 'CONFIRMEDDELIVERYDATE']].apply(lambda y:ConvertStrDateToWeekId(y[1]), axis=1)
 ml_poLines = spark.createDataFrame(x)
 ml_poLines.show()`

没有我想要的那么干净。也许其他人会提出更清洁的解决方案。

于 2018-12-11T21:47:49.450 回答