0

我有一个 15 列的 excel 电子表格,其中之一是电子邮件地址,然后是 100,000 多条记录。

在我的数据中,我知道有很多重复的电子邮件地址。

有人可以告诉我如何提取一个不同的列表,其中每条记录仅由电子邮件地址表示一次?

或者,如果我将数据导入 SQL,我如何删除与电子邮件地址重复的记录,但如果找到 4 个则留下一条记录...

谢谢..

4

2 回答 2

1

在更简单的任务中,我建议使用openrowset。当然,您可以将其与之后的其他查询结合起来进行过滤,但在这种情况下,最好将 DTS 用于 MSSQL2000,将 SSIS 用于更高版本。

如何?
这个问题很复杂,并且有 2 个之前必须回答过的子问题。

  1. 如何删除重复项
  2. Excel 和 SQL

你可以阅读更多关于 SSIS https://stackoverflow.com/search?q=SSIS+Excel

于 2010-08-07T11:19:32.110 回答
0

请参阅有关如何在亚历山大的答案中删除重复项的链接,以在 SQL 中处理它。(请注意,链接的答案特定于 SQLServer - 如果您使用其他版本的 SQL,语法可能会略有不同。)

对于 Excel,我建议:

  1. 使用数据透视表,或
  2. 在 EmailAddress 上排序,插入一个额外的列,其中填充了类似于以下的公式:

    =IF(A1=A2,"","X")
    

    [- 第 2 行,假设 EmailAddress 在 A 列中;复制并粘贴该列的其余部分] 并使用自动过滤器选择 X 的计算值。

于 2010-08-09T12:00:30.013 回答