0

我遇到了一个问题,我找不到一个优雅的方法来解决它......

我们有一个应用程序可以监控音频输入并尝试根据声学指纹分配匹配项。

应用程序每隔几秒获取一个样本,然后进行查找并将时间戳结果存储在数据库中。

指纹识别并不总是准确的,因此可能会分配“错误”的项目。所以数据看起来像:

timestamp    foreign_id        my comment
--------------------------------------------------
12:00:00            17
12:00:10            17
12:00:20            17
12:00:30            17
12:00:40           723        wrong match
12:00:50            17
12:01:00            17
12:01:10            17
12:01:20          None        no match
12:01:30            17
12:01:40            18
12:01:50            18
12:02:00            18
12:02:10            18
12:02:20            18
12:02:30           992        wrong match
12:02:40            18
12:02:50            18

所以我正在寻找一种定期“清理”数据的方法。

谁能想象一个实现这一目标的好方法?在给定的示例中 -外国 ID723的条目应更正为17等。并且 - 如果可能的话 - 应考虑来回输入多少条目的阈值。

不确定我的问题是否足够清楚,但欢迎提出任何意见!

4

1 回答 1

0

多次检查数据库中是否有一个外国 id,然后检查这些时间是否接近?

为什么在使用数据时不忽略“坏”数据?

于 2013-06-18T15:54:14.950 回答