我在尝试查询 Denodo 中具有时间戳类型的数据字段时收到错误消息。我正在使用 python 3.7.3 和 jaydebeapi。
参考我在下面收到的错误,'%Y-%m-%d %H:%M:%S' 确实是该字段的格式,并且 '62690377-06-10 23:2' 没有出现在原始数据。
- 如果我将该字段转换为字符串,则查询可以正常工作。
- 我组中的其他用户能够使用相同版本的 Python 和 jaydebeapi 以及下面的代码片段来毫无问题地查询时间戳数据。
query_complete = (" Select \"DATE\" FROM \"ABC\".\"simple_table\" ")
cursor.execute(query_complete)
rows = cursor.fetchall()
complete_df = pd.DataFrame(rows, columns = list(zip(*cursor.description))[0]
ValueError Traceback (most recent call last)
<ipython-input-7-120011c28139> in <module>
21
22 cursor.execute(query_complete)
---> 23 rows = cursor.fetchall()
24 complete_df = pd.DataFrame(rows, columns = list(zip(*cursor.description))[0])
25
~\AppData\Local\Continuum\anaconda3\lib\site-packages\jaydebeapi\__init__.py in fetchall(self)
558 rows = []
559 while True:
--> 560 row = self.fetchone()
561 if row is None:
562 break
~\AppData\Local\Continuum\anaconda3\lib\site-packages\jaydebeapi\__init__.py in fetchone(self)
530 sqltype = self._meta.getColumnType(col)
531 converter = self._converters.get(sqltype, _unknownSqlTypeConverter)
--> 532 v = converter(self._rs, col)
533 row.append(v)
534 return tuple(row)
~\AppData\Local\Continuum\anaconda3\lib\site-packages\jaydebeapi\__init__.py in _to_datetime(rs, col)
582 if not java_val:
583 return
--> 584 d = datetime.datetime.strptime(str(java_val)[:19], "%Y-%m-%d %H:%M:%S")
585 d = d.replace(microsecond=int(str(java_val.getNanos())[:6]))
586 return str(d)
~\AppData\Local\Continuum\anaconda3\lib\_strptime.py in _strptime_datetime(cls, data_string, format)
575 """Return a class cls instance based on the input string and the
576 format string."""
--> 577 tt, fraction, gmtoff_fraction = _strptime(data_string, format)
578 tzname, gmtoff = tt[-2:]
579 args = tt[:6] + (fraction,)
~\AppData\Local\Continuum\anaconda3\lib\_strptime.py in _strptime(data_string, format)
357 if not found:
358 raise ValueError("time data %r does not match format %r" %
--> 359 (data_string, format))
360 if len(data_string) != found.end():
361 raise ValueError("unconverted data remains: %s" %
ValueError: time data '62690377-06-10 23:2' does not match format '%Y-%m-%d %H:%M:%S'`
我尝试制作一个虚拟数据集来说明这个问题。有时在这种情况下,如果数据集很小,我不会收到值错误但输出是乱码,如下面的两组数据比较时可以看到的。
在 Denodo 中格式化为文本时的查询结果:
timestamp_text
0 2017-04-06 12:23:56
1 1998-06-01 23:23:26
2 1990-04-28 15:23:56
3 2007-12-06 16:13:37
4 2010-08-27 17:30:09
在 Denodo 中格式化为时间戳时查询相同数据的结果:
timestamp
0 1970-01-18 06:18:01.436000
1 1970-01-01 00:00:00
2 None
3 None
4 None