我编写了一个 perl 脚本,它读取 2 个不同的文件,比较这两个文件中的 ID,并且只打印 ID 匹配的数据。ID文件被读入一个数组,而数据文件被逐行读取。这一切都很好,但是现在我需要添加更多内容。在我的数据文件中,我有时会出现 ID 重复的行,因为该主题已经多次访问以提供样本。因此,我需要查找这些重复项并仅记录最近的访问日期。
所以我的数据文件看起来像这样:
ID DOV Data1 Data2 etc etc
现在我已经看到哈希是搜索重复项的方法,但是我看到的所有修复都是简单地不加选择地删除重复项,这不是我想要的。
有任何想法吗?