《Mysql學習SQL查找刪除重復的數據行》要點:
本文介紹了Mysql學習SQL查找刪除重復的數據行,希望對您有用。如果有疑問,可以聯(lián)系我們。
導讀:本節(jié)內容:查找并刪除重復行的辦法.一,如何查找重復行第一步是定義什么樣的行才是重復行.多數情況下很簡單:它們某一列具有相同的值.本...
本節(jié)內容:
查找并刪除重復行的辦法.MYSQL學習
一,如何查找重復行
第一步是定義什么樣的行才是重復行.
多數情況下很簡單:它們某一列具有相同的值.MYSQL學習
本文采用這必定義,或許你對“重復”的定義比這復雜,你需要對sql做些修改.MYSQL學習
要用到的數據樣本:
?MYSQL學習
create table test(id int not null primary key, day date not null);?
?
insert into test(id, day) values(1, '2006-10-08');?
insert into test(id, day) values(2, '2006-10-08');?
insert into test(id, day) values(3, '2006-10-09');?
?
select * from test;?
+----+------------+?
| id | day??????? |?
+----+------------+?
|? 1 | 2006-10-08 |?
|? 2 | 2006-10-08 |?
|? 3 | 2006-10-09 |?
+----+------------+?
前面兩行在day字段具有相同的值,因此如何將他們當做重復行,這里有一查詢語句可以查找.
查詢語句使用GROUP BY子句把具有相同字段值的行歸為一組,然后計算組的大小.
例句:
?MYSQL學習
?select day, count(*) from test GROUP BY day;?
+------------+----------+?
| day??????? | count(*) |?
+------------+----------+?
| 2006-10-08 |??????? 2 |?
| 2006-10-09 |??????? 1 |?
+------------+----------+?
重復行的組大小大于1.
如何希望只顯示重復行,必須使用HAVING子句,好比:
?MYSQL學習
select day, count(*) from test group by day HAVING count(*) > 1;?
+------------+----------+?
| day??????? | count(*) |?
+------------+----------+?
| 2006-10-08 |??????? 2 |?
+------------+----------+?
基本的技巧:根據具有相同值的字段分組,然后知顯示大小大于1的組.MYSQL學習
二,為什么不能使用WHERE子句?
因為WHERE子句過濾的是分組之前的行,HAVING子句過濾的是分組之后的行.MYSQL學習
三,如何刪除重復行
一個常見的任務是,重復行只保存一行,其他刪除,然后可以創(chuàng)建適當的索引,防止以后再有重復的行寫入數據庫.
同樣,首先是弄清楚重復行的定義.
要保存的是哪一行呢?第一行,或者某個字段具有最大值的行?MYSQL學習
本文中,假設要保存的是第一行——id字段具有最小值的行,意味著你要刪除其他的行.MYSQL學習
也許最簡單的辦法是通過臨時表.MYSQL學習
尤其對于MYSQL,有些限制是不能在一個查詢語句中select的同時update一個表.
在另一篇文章 MySQL SELECT同時UPDATE同一張表 中,講述了如何繞過這些限制.MYSQL學習
簡單起見,這里只用到了臨時表的辦法.MYSQL學習
任務:刪除所有重復行,除了分組中id字段具有最小值的行.MYSQL學習
因此,需要找出大小大于1的分組,以及希望保存的行.
可以使用MIN()函數.這里的語句是創(chuàng)建臨時表,以及查找需要用DELETE刪除的行.MYSQL學習
例句:
?MYSQL學習
create temporary table to_delete (day date not null, min_id int not null);?
?
insert into to_delete(day, min_id)?
?? select day, MIN(id) from test group by day having count(*) > 1;?
?
select * from to_delete;?
+------------+--------+?
| day??????? | min_id |?
+------------+--------+?
| 2006-10-08 |????? 1 |?
+------------+--------+?
有了這些數據,可以開始刪除“臟數據”行了.
可以有幾種辦法,各有優(yōu)劣,這里不做詳細比較,只是說明在支持查詢子句的關系數據庫中,使用的標準辦法.MYSQL學習
例句:
?MYSQL學習
delete from test?
?? where exists(?
????? select * from to_delete?
????? where to_delete.day = test.day and to_delete.min_id <> test.id?
?? )?
四,如何查找多列上的重復行MYSQL學習
有人問過以下的問題:MYSQL學習
一個表上有兩個字段b和c,分別關聯(lián)到其他兩個表的b和c字段.我想要找出在b字段或者c字段上具有重復值的行.
咋看很難明白,通過對話后我理解了:他想要對b和c分別創(chuàng)建unique索引.MYSQL學習
如上所述,查找在某一字段上具有重復值的行很簡單,只要用group分組,然后計算組的大小.
并且查找全部字段重復的行也很簡單,只要把所有字段放到group子句.但如果是判斷b字段重復或者c字段重復,問題困難得多.MYSQL學習
提問者用到的樣本數據:
?MYSQL學習
create table a_b_c(?
?? a int not null primary key auto_increment,?
?? b int,?
?? c int?
);?
?
insert into a_b_c(b,c) values (1, 1);?
insert into a_b_c(b,c) values (1, 2);?
insert into a_b_c(b,c) values (1, 3);?
insert into a_b_c(b,c) values (2, 1);?
insert into a_b_c(b,c) values (2, 2);?
insert into a_b_c(b,c) values (2, 3);?
insert into a_b_c(b,c) values (3, 1);?
insert into a_b_c(b,c) values (3, 2);?
insert into a_b_c(b,c) values (3, 3);?
現在,可以輕易看到表里面有一些重復的行,但找不到兩行具有相同的二元組{b, c}.這便是為什么問題會變得困難了.MYSQL學習
2,錯誤的查詢語句MYSQL學習
如果把兩列放在一起分組,你會得到不同的結果,具體看如何分組和計算大小.
提問者恰恰是困在了這里.有時候查詢語句找到一些重復行卻漏了其他的.MYSQL學習
這是他用到的查詢:
?MYSQL學習
select b, c, count(*) from a_b_c?
group by b, c?
having count(distinct b > 1)?
?? or count(distinct c > 1);?
結果返回所有的行,因為CONT(*)總是1.為什么?因為 >1 寫在COUNT()里面.
這個錯誤很容易被忽略,事實上等效于:
?MYSQL學習
select b, c, count(*) from a_b_c?
group by b, c?
having count(1)?
?? or count(1);?
為什么?因為(b > 1)是一個布爾值,根本不是想要的結果.MYSQL學習
必要的是:
?MYSQL學習
select b, c, count(*) from a_b_c?
group by b, c?
having count(distinct b) > 1?
?? or count(distinct c) > 1;?
返回空結果.MYSQL學習
很顯然,因為沒有重復的{b,c}.
這人試了很多其他的OR和AND的組合,用來分組的是一個字段,計算大小的是另一個字段,像這樣:
?MYSQL學習
select b, count(*) from a_b_c group by b having count(distinct c) > 1;?
+------+----------+?
| b??? | count(*) |?
+------+----------+?
|??? 1 |??????? 3 |?
|??? 2 |??????? 3 |?
|??? 3 |??????? 3 |?
+------+----------+?
沒有一個能夠找出全部的重復行.
而且,對于某些情況,這種語句是有效的,如果錯誤地以為便是這么寫法,然而對于另外的情況,很可能得到錯誤結果.
事實上,單純用GROUP BY 是不可行的.
為什么?
因為當對某一字段使用group by時,就會把另一字段的值分散到不同的分組里.
對這些字段排序可以看到這些效果,正如分組做的那樣.
MYSQL學習
《Mysql學習SQL查找刪除重復的數據行》是否對您有啟發(fā),歡迎查看更多與《Mysql學習SQL查找刪除重復的數據行》相關教程,學精學透。維易PHP學院為您提供精彩教程。
轉載請注明本頁網址:
http://www.snjht.com/jiaocheng/13708.html