我最近发现了提供 CSV 导出的芝加哥犯罪数据网站。使用 readr 导入 6.2M+ 记录后,我注意到无法读取时间在 12:00:00 PM 和 12:59:59 PM 之间的所有 Date 记录。
我使用以下导入:
chicagocrime = read_csv("~/R/chicago_Crime/Crimes_-_2001_to_present 20161203.csv", col_types = 列( 日期 = col_datetime(格式 = "%m/%d/%Y %H:%M:%S %p"), 位置 = col_skip(), `更新时间` = col_skip(), `X 坐标` = col_skip(), `Y 坐标` = col_skip() ) )
问题()显示以下内容:
问题(芝加哥犯罪) # 一个小标题:156 × 4 row col 预期 实际 1 12 日期有效日期 06/13/2005 12:40:00 PM 2 20 日期有效日期 04/06/2005 12:30:00 PM 3 24 日期有效日期 06/13/2005 12:45:00 PM 4 32 日期有效日期 06/12/2005 12:00:00 PM 5 43 日期有效日期 06/03/2005 12:00:00 PM 6 53 日期有效日期 03/20/2005 12:00:00 PM 7 61 日期有效日期 06/15/2005 12:33:00 PM 8 80 日期有效日期 06/13/2005 12:30:00 PM 9 104 日期有效日期 06/13/2005 12:46:17 PM 10 143 日期有效日期 06/12/2005 12:12:30 PM
所有其他时间导入没有问题。
输入文件具有以下格式的日期字段:“04/06/2005 12:30:00 PM”。任何帮助或意见?(Windows 10 上的 R 3.3.2,最新包)