我遇到了一个问题,我找不到一个优雅的方法来解决它......
我们有一个应用程序可以监控音频输入并尝试根据声学指纹分配匹配项。
应用程序每隔几秒获取一个样本,然后进行查找并将时间戳结果存储在数据库中。
指纹识别并不总是准确的,因此可能会分配“错误”的项目。所以数据看起来像:
timestamp foreign_id my comment
--------------------------------------------------
12:00:00 17
12:00:10 17
12:00:20 17
12:00:30 17
12:00:40 723 wrong match
12:00:50 17
12:01:00 17
12:01:10 17
12:01:20 None no match
12:01:30 17
12:01:40 18
12:01:50 18
12:02:00 18
12:02:10 18
12:02:20 18
12:02:30 992 wrong match
12:02:40 18
12:02:50 18
所以我正在寻找一种定期“清理”数据的方法。
谁能想象一个实现这一目标的好方法?在给定的示例中 -外国 ID为723的条目应更正为17等。并且 - 如果可能的话 - 应考虑来回输入多少条目的阈值。
不确定我的问题是否足够清楚,但欢迎提出任何意见!