databaseadmin | 17 七月, 2006 07:39
开发人员的噩梦——删除重复记录 想必每一位开发人员都有过类似的经历,在对数据库进行查询或统计的时候不时地会碰到由于表中存在重复的记录而导致查询和统计结果不准确。解决该问题的办法就是将这些重复的记录删除,只保留其中的一条。 在SQL Server中除了对拥有十几条记录的表进行人工删除外,实现删除重复记录一般都是写一段代码,用游标的方法一行一行检查,删除重复的记录。因为这种方法需要对整个表进行遍历,所以对于表中的记录数不是很大的时候还是可行的,如果一张表的数据达到上百万条,用游标的方法来删除简直是个噩梦,因为它会执行相当长的一段时间。 四板斧——轻松消除重复记录 殊不知在SQL Server中有一种更为简单的方法,它不需要用游标,只要写一句简单插入语句就能实现删除重复记录的功能。为了能清楚地表述,我们首先假设存在一个产品信息表Products,其表结构如下:
假设产品Chang和Tofu的记录在产品信息表中存在重复。现在要删除这些重复的记录,只保留其中的一条。步骤如下: 第一板斧——建立一张具有相同结构的临时表
第二板斧——为该表加上索引,并使其忽略重复的值 方法是在企业管理器中找到上面建立的临时表Products _temp,单击鼠标右键,选择所有任务,选择管理索引,选择新建。然后设置索引选项。 第三板斧——拷贝产品信息到临时表
此时SQL Server会返回如下提示: 服务器: 消息 3604,级别 16,状态 1,行 1 已忽略重复的键。 它表明在产品信息临时表Products_temp中不会有重复的行出现。 第四板斧——将新的数据导入原表 将原产品信息表Products清空,并将临时表Products_temp中数据导入,最后删除临时表Products_temp。
这样就完成了对表中重复记录的删除。无论表有多大,它的执行速度都是相当快的,而且因为几乎不用写语句,所以它也是很安全的。 小提示:上述方法中删除重复记录取决于创建唯一索引时选择的字段,在实际的操作过程中读者务必首先确认创建的唯一索引字段是否正确,以免将有用的数据删除。 |
jackyyen | 10/09/2007, 17:09
寻花 | 15/09/2007, 15:32
哥哥 姐姐们 小弟我今天才学 想问问 数据库用数字命名为什么不能用这个语句drop database删除 我在SQL建了一个新的数据库用的是13这个数字,命名的 用drop database 语句却删不了
游客 | 13/11/2007, 17:40
不错
LS的可以用 Drop DataBase [13]试试
123 | 05/06/2008, 21:33
办法不错,但是不知道能比游标快多少!
大法官 | 24/10/2008, 19:09
还不错嘛
zzy | 12/11/2008, 09:24
数据库联机下能这么用吗?
wwz | 10/06/2009, 08:29
是啊,这样做是可以的,但是从原理上好像并不会比游标快出一个数量级,因为执行的是相同的操作。
啊娘喂 | 21/07/2009, 09:52
如果重复列是ntext,nvarchar(max)等又如何?不可以建立索引的哟
| « | 三月 2010 | » | ||||
|---|---|---|---|---|---|---|
| 一 | 二 | 三 | 四 | 五 | 六 | 日 |
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 | ||||
不错,非常实用。