1

我有一些数据发送给我,无论出于何种原因,发件人设法将数据并排复制了 3 次,如下所示:

FileVersion 1   FileVersion 1   FileVersion 1   
FileRevision    0   FileRevision    0   FileRevision    0   
EDSVersion  4.0 EDSVersion  4.0 EDSVersion  4.0 
Description Gen4 (T,P,PS - DRL PMAC)26 April 2012 1 Description Gen4 (T,P,PS - DRL PMAC)26 April 2012 1 Description Gen4 (T,P,PS - DRL PMAC)26 April 2012 1 
CreationTime    02:02PM CreationTime    11:53AM CreationTime    06:28PM
CreationDate    02-27-2013  CreationDate    02-27-2013  CreationDate    02-26-2013

我需要删除每个重复项,数据中只有 22,000 多行。有没有办法在 Notepad++ 中删除一行上的重复短语?

4

2 回答 2

1

你可以这样做:

查找内容:^(.+)\1\1
替换为:$1

这将适用于除 CreationTime 和 CreationDate 之外的几乎所有行,因为这些行具有可变部分。

于 2015-04-22T11:09:48.980 回答
0

原来所有数据都是制表符分隔的,所以我将所有“\t”替换为“,”,在 Excel 中将其作为 CSV 打开并删除前两列之后的所有内容。像魅力一样工作。

于 2015-04-23T04:17:48.297 回答