我这里有点问题,我自己要放弃了,希望这里的专家能帮助我挽救我的数据。
我有一个程序来收集一些财务数据。数据格式如下
时间、数据
时间、数据
...
它是文本格式,我有大约 30 个文件,每个文件大约 1-2 GB。我遇到的问题是当我第一次启动它时,我不小心将其格式化为 12 小时时间格式“yyyy/MM/dd hh:mm:ss.fff”而不是 2400 小时时间“yyyy/MM/dd HH:mm :ss.fff”。
现在我的数据是没有上午/下午的 12 小时格式。
我现在需要编写一个程序将 12 小时格式转换为 2400 格式。我面临的问题如下:
数据大致按时间顺序排列。时间戳来自数据服务器,取决于互联网流量,顺序可能为 1 秒左右。但考虑到我收集的数据量,它可能有多达 100000 行乱序。
没有上午/下午,1200 可能是上午 1200(我需要从中减去 12 小时)或下午 1200,我什么都不做。
文件的开头可能在任何给定时间开始(我手动打开程序来收集,所以时间不准确),所以如果不向前看,看看天的变化,我不知道 10:00 是上午还是下午
我尝试转换之前的时间但不成功。任何人都可以通过提供一些代码或伪代码来帮助我吗?
编辑:现在我可以准确地说出我的问题,我需要从数据中确定我是处于 AM 模式还是 PM 模式,如果没有那么多行,我可能可以使用 excel 并更正它,手动查看下一个几行并推断它是AM模式还是PM模式。有 1/20 亿行,我需要对其进行逻辑编程以确定它是 AM 还是 PM 模式,我很难这样做。以及如何处理在过渡期间出现问题的那几分钟?