如何删除Table中的重复行 -

来源：百度文库编辑：神马文学网时间：2024/04/30 03:04:44

如何删除Table中的重复行

上一篇 / 下一篇 2010-06-07 17:27:16 / 个人分类：SQL Server技术

查看( 7 ) / 评论( 1 ) / 评分( 0 / 0 )

在写SQL的时候经常会有这样的需求: 在一个Table中会有多条重复的数据,如何有效的取出来不重复的数据,或者是删除掉重复的数据,或者取出某列重复值的第一条数据.

利用SQL Server 2005的新功能NOW_NUMBER和CTE可以很好的实现.

举例说明如下:

建立测试数据:

可以查看到重复的数据有:

SELECTCol1, Col2,COUNT(*)ASDupCount
FROMDup1
GROUPBYCol1, Col2
HAVINGCOUNT(*)>1

接下来介绍如何delete掉重复的数据:

1.NOW_NUMBER:SQL Server 2005添加了很好用的RANKING函数(NOW_NUMBER,RANK,DENSE_RANK,NTILE),利用NOW_NUMBER()OVER(PARTITION GY)最为直接,也最为方便,不能修改表或者产生多余的列.

首先会分配一个列号码,以Col1,Col2组合来分区排序.

SELECTCol1, Col2,
ROW_NUMBER()OVER(PARTITIONBYCol1, Col2ORDERBYCol1)ASrn
FROMDup1

得到的序号如下:

很明显的是重复列都分组分割排序,只需要delete掉排序序号>1的即可.

--用到CTEWITHDupsD
AS(
SELECTCol1, Col2,
ROW_NUMBER()OVER(PARTITIONBYCol1, Col2ORDERBYCol1)ASrn
FROMDup1
)
DELETEDupsD
WHERErn>1;--或者DELETEAFROM(
SELECTCol1, Col2,
ROW_NUMBER()OVER(PARTITIONBYCol1, Col2ORDERBYCol1)ASrn
FROMDup1) AWHEREA.rn>1

2.创建一个标识键唯一的表记一列.

ALTERTABLEdbo.Dup1
ADD
PKINTIDENTITY
NOTNULL
CONSTRAINTPK_Dup1PRIMARYKEY;
SELECT*
FROMDup1;

删除找出与Col1,Col2相同并且比Dup1.PK大的记录,也就是保留重复值中PK最小的记录.

DELETEDup1
WHEREEXISTS(SELECT*
FROMDup1ASD1
WHERED1.Col1=Dup1.Col1
ANDD1.Col2=Dup1.Col2
ANDD1.PK>Dup1.PK );

3.select distant into,这种方法借助一个新的table,把不重复的结果集转移到新table中.

SELECTdistinctCol1, Col2INTONoDups
FROMDup1;

select*fromNoDups

建议采用第一种和第三种方法,第一种多见于T-SQL的编程中,第三种在ETL中常常使用.

如何删除Table中的重复行 - 如何删除档案中的重复的行如何删除 OutLook 中的重复邮件? 如何从文本文件中删除所有重复行？如何从文本文件中删除所有重复行？删除mysql数据库中的重复数据记录_MySQL_网贝建站我是开发者 | Sql删除重复行如何在 Outlook 中删除导入的重复项如何根据当前MDB中的表生成对应的JET SQL DDL “CREATE TABLE”语句... 如何去删除对方qq中的自己如何去删除对方qq中的自己如何去删除对方qq中的自己如何去删除对方qq中的自己如何去删除对方中的自己如何去删除对方QQ中的自己如何去删除对方qq中的自己如何去删除对方qq中的自己如何去删除对方qq中的自己如何删除word中的空白页（转载）如何一次删除word文件中的空行如何快速处理 Excel 2007 表格中的重复数据如何删除WORD中的页眉页脚中的横线爱情中的“强迫性重复” 如何删除WORD中的空格和空段