1

我正在尝试使用 Python 将一些数据从 CSV 文件逐行加载到 Azure 表存储中。字符串列被直接插入,但格式中源中提到的日期列2018-02-18T11:29:12.000Z仍作为字符串加载。这意味着我无法使用日期列查询记录。

有人可以告诉我是否有办法为表创建实体定义(列的数据类型)并使用它来加载记录以避免加载字符串类型的日期?

4

2 回答 2

1

我试图重现您的问题但失败了。我将csv文件加载到 Azure 表存储,并将数据列加载为DataTime类型。

你可以参考我的代码如下:

我的 csv 文件:

'tasksSeattle','001','jay1',100,2018-02-18T11:29:12.000Z
'tasksSeattle','002','jay2',100,2018-02-18T11:29:12.000Z
'tasksSeattle','003','jay3',100,2018-02-18T11:29:12.000Z
'tasksSeattle','004','jay4',100,2018-02-18T11:29:12.000Z
'tasksSeattle','005','jay5',100,2018-02-18T11:29:12.000Z

我的python代码:

from azure.cosmosdb.table.tableservice import TableService
from azure.cosmosdb.table.models import Entity
import csv
import sys
import codecs

table_service = TableService(connection_string='***')

reload(sys)
sys.setdefaultencoding('utf-8')
filename = "E:/jay.csv"

with codecs.open(filename, 'rb', encoding="utf-8") as f_input:
    csv_reader = csv.reader(f_input)
    for row in csv_reader:
        task = Entity()
        task.PartitionKey = row[0]
        task.RowKey = row[1]
        task.description = row[2]
        task.priority = row[3]
        task.logtime = row[4]
        table_service.insert_entity('tasktable', task)

加载结果:

在此处输入图像描述

希望它可以帮助你。


更新答案:

如果您观察上面屏幕截图中的数据类型选项框,不难看出表服务数据模型仅支持这 8 种类型:

  • Edm.Binary
  • Edm.布尔
  • 日期时间
  • Edm.Double
  • Edm.Guid
  • Edm.Int32
  • Edm.Int64
  • 编辑字符串

您可以使用此处entity.x = EntityProperty(EdmType.STRING, 'y')提到的函数来根据需要定义数据类型。

请参考我的示例代码如下:

with codecs.open(filename, 'rb', encoding="utf-8") as f_input:
    csv_reader = csv.reader(f_input)
    for row in csv_reader:
        task = Entity()
        task.PartitionKey = row[0]
        task.RowKey = row[1]
        task.description = row[2]
        task.priority = EntityProperty(EdmType.INT32, row[3])
        task.logtime = EntityProperty(EdmType.DATETIME, row[4])

        table_service.insert_entity('tasktable', task)

仅作总结:

我们可以将字符串转换为日期时间并获取日期片段,如下所示:

task.startDateTime = datetime(startDateFrag.year,startDateFrag.month,startDateFrag.day,startDateFrag.hour, startDateFrag.minute,startDateFrag.second)

于 2018-02-22T09:09:46.520 回答
0

由于缺乏声誉,我无法评论杰的回答,只需添加有关如何从字符串进行日期转换的代码部分。

from dateutil.parser import parse
from datetime import datetime

try:
    dt = parse(row[4]);
    if(isinstance(dt,datetime.date)):
        task.logtime = EntityProperty(EdmType.DATETIME, dt)
except ValueError as err:
    task.logtime=row[4] 

如果您在动态读取 json 时不知道每个字段的数据类型,则可以使用 try/except 块。

于 2018-09-11T09:54:04.377 回答