我在使用 NSDataDetector 从文本中提取时间时注意到了一些事情,但我不确定我是否理解发生了什么。在我的情况下,我拥有的唯一信息是时间 - 没有额外的日/月/年日期信息。只是日期的时间部分——比如可能嵌入在文本字符串中的“11:30”。
从字符串中提取日期信息的示例函数:
-(NSString*)extractTime:(NSString*)value {
NSError *error = NULL;
NSDataDetector *detector = [NSDataDetector dataDetectorWithTypes:(NSTextCheckingTypes)NSTextCheckingTypeDate error:&error];
NSArray *matches = [detector matchesInString:value options:0 range:NSMakeRange(0, [value length])];
NSDate *dateValue;
for (NSTextCheckingResult *match in matches) {
if ([match resultType] == NSTextCheckingTypeDate) {
dateValue = [match date];
}
}
NSDateFormatter *formatter = [[NSDateFormatter alloc] init];
[formatter setDateFormat:@"HH:mm"];
NSString *time = [formatter stringFromDate:dateValue];
NSLog(@"original:%@ got_date:%@ formatted_time:%@", value, dateValue, time);
return time;
}
然后我有一个简单的测试函数来向检测器抛出一些时间字符串。
-(void)testTimeExtraction {
NSArray<NSString*>* times = @[@"07:30", @"8:30", @"9:30", @"10:30", @"11:30"];
for(NSString *time in times) {
NSLog(@"%@", [self extractTime:time]);
}
}
我期望的是 7:30、8:30、9:30 等的时间信息。或者,如果失败,至少在某种程度上是一致的时间(在同一时区)。
但是 - 我得到的内容因我的系统时钟而异。而且我不明白为什么或该怎么做。我的猜测是,在没有检测到日期的日期部分的情况下,日期被设置为当前的 UTC 日期,但我不明白为什么日期/时间会改变结果。日期似乎会根据系统时钟时间而变化,但并非全部。
如果我将系统时钟时间设置为:06:01AM、07:01AM或08:01AM (所有相同的结果)这些看起来“正确”,因为时间似乎是一致推断的。
- 原文:07:30 got_date:2016-06-18 12:30:00 +0000 formatted_time:07:30
- 原文:8:30 got_date:2016-06-18 13:30:00 +0000 formatted_time:08:30
- 原文:9:30 got_date:2016-06-18 14:30:00 +0000 formatted_time:09:30
- 原文:10:30 got_date:2016-06-18 15:30:00 +0000 formatted_time:10:30
- 原文:11:30 got_date:2016-06-18 16:30:00 +0000 formatted_time:11:30
系统时钟时间:美国中部时间上午 09:01 更改8:30 日期(但不更改 7:30、9:30、10:30 或 11:30)
- 原文:07:30 got_date:2016-06-17 12:30:00 +0000 formatted_time:07:30
- 原文:8:30 got_date: 2016-06-18 01:30:00 +0000 formatted_time: 20:30
- 原文:9:30 got_date:2016-06-17 14:30:00 +0000 formatted_time:09:30
- 原文:10:30 got_date:2016-06-17 15:30:00 +0000 formatted_time:10:30
- 原文:11:30 got_date:2016-06-17 16:30:00 +0000 formatted_time:11:30
系统时钟时间:美国中部时间上午 10:01(现在 8:30 和 9:30 已移动,但其他时间未移动)
- 原文:07:30 got_date:2016-06-17 12:30:00 +0000 formatted_time:07:30
- 原文:8:30 got_date: 2016-06-18 01:30:00 +0000 formatted_time: 20:30
- 原文:9:30 got_date: 2016-06-18 02:30:00 +0000 formatted_time: 21:30
- 原文:10:30 got_date:2016-06-17 15:30:00 +0000 formatted_time:10:30
- 原文:11:30 got_date:2016-06-17 16:30:00 +0000 formatted_time:11:30
系统时钟时间:美国中部上午 11:01(等等......)
- 原文:07:30 got_date:2016-06-17 12:30:00 +0000 formatted_time:07:30
- 原文:8:30 got_date: 2016-06-18 01:30:00 +0000 formatted_time: 20:30
- 原文:9:30 got_date: 2016-06-18 02:30:00 +0000 formatted_time: 21:30
- 原文:10:30 got_date: 2016-06-18 03:30:00 +0000 formatted_time: 22:30
- 原文:11:30 got_date:2016-06-17 16:30:00 +0000 formatted_time:11:30
我的假设是我只是不了解日期处理和日期提取的基本知识,但对我来说,只有检测到的日期的一个子集会根据系统时钟时间发生变化,这似乎真的很奇怪。
任何关于为什么会发生这种情况的线索将不胜感激。