欢迎各位兄弟 发布技术文章

这里的技术是共享的

You are here

MySQL Distinct 去掉查询结果重复记录

shiping1 的头像

MySQL Distinct 去掉查询结果重复记录

DISTINCT

使用 DISTINCT 关键字可以去掉查询中某个字段的重复记录。

语法:

SELECT DISTINCT(column) FROM tb_name

例子:

假定 user 表有如下记录:

uidusername
1小李
2小张
3小李
4小王
5小李
6小张

SQL 语句:

SELECT DISTINCT(username) FROM user

返回查询结果如下:

username
小李
小张
小王

提示

使用 DISTINCT 关键字去掉重复记录具有较大的局限性。DISTINCT() 只能包含一个字段且查询结果也只返回该字段而非数据完整记录(如上例所示)。

可以尝试使用如下语法:

SELECT DISTINCT(column),column1,column2,... FROM tb_name

该查询结果将返回列出的所有字段,但该查询往往使 column 的唯一性失效,且 column 1,column 2,… 不能放在 DISTINCT(column) 之前。

上面的例子如果要返回如下结果(这往往是期望中的):

uidusername
1小李
2小张
3小王

这时候就要用到 GROUP BY 关键字。

来自 http://www.5idev.com/p-php_mysql_distinct.shtml
 

mysql distinct 用法详解及优化

分类: mysql sql 5041人阅读 评论(0) 收藏 举报

本事例实验用表task,结构如下

 mysql> desc task;

+-------------+------------+------+-----+-------------------+-------+

| Field       | Type       | Null | Key | Default           | Extra |

+-------------+------------+------+-----+-------------------+-------+

| PLAYER_ID   | bigint(20) | NO   | PRI | NULL              |       |

| TASK_ID     | int(11)    | NO  | PRI | NULL              |       |

| TASK_STATUS | tinyint(4) |NO   |    | NULL              |       |

| CREATE_DATE | datetime   | YES |     | NULL              |       |

| UPDATE_DATE |timestamp  | NO   |    | CURRENT_TIMESTAMP |       |

+-------------+------------+------+-----+-------------------+-------+

  

1  Distinct 位置

  单独的distinct只能放在开头,否则报错,语法错误

mysql> Select  player_id,distinct(task_id) from task;

ERROR 1064 (42000): You havean error in your SQL syntax; check the manual that

corresponds to your MySQLserver version for the right syntax to use near 'disti

nct(task_id) from task' atline 1

现在把distinct放在开头

mysql> Select  distinct(task_id),taskid from task;

查询成功

与其他函数使用时候,没有位置限制如下

  Select player_id,count(distinct(task_id))from task;

这种情况下是正确的,可以使用。

2  Distinct用法

a.在count计算不重复的记录的时候能用到
比如SELECT COUNT( DISTINCT player_id ) FROM task;
就是计算talbebname表中id不同的记录有多少条

b,在需要返回记录不同的id的具体值的时候可以用
比如SELECT DISTINCT player_id FROM task;
返回talbebname表中不同的id的具体的值

c.上面的情况2对于需要返回mysql表中2列以上的结果时会有歧义
比如SELECT DISTINCT player_id, task_id FROM task;
实际上返回的是player_id与task_id同时不相同的结果,也就是DISTINCT同时作用了两个字段,必须得player_id与task_id都相同的才被排除了,与我们期望的结果不一样,我们期望的是player_id不同被过滤

  在这种情况下,distinct同时作用了两个字段,player_id,task_id

d.这时候可以考虑使用group_concat函数来进行排除,不过这个mysql函数是在mysql4.1以上才支持的

e. 其实还有另外一种解决方式,就是使用
SELECT player_id, task_id, count(DISTINCT player_id) FROM task.
虽然这样的返回结果多了一列无用的count数据(有时也许就需要这个数据)

f 同时我们还可以利用下面的方式解决b遇到的歧义问题通过group by 分组

  select player_id,task_id from task group by player_id

distinct 优化

请参考:http://isky000.com/database/mysql_distinct_implement 

对distinct的原理 及优化分析的很好,大家可以查看。
来自 http://blog.csdn.net/aeolus_pu/article/details/7818559


Mysql中count(*),DISTINCT的使用方法和效率研究

发布时间:July 27, 2007 分类:MySQL

CSS在IE6,IE7,FIREFOX中的区别

博客日历问题的PHP实现Calendar函数

在处理一个大数据量数据库的时候
突然发现mysql对于count(*)的不同处理会造成不同的结果

比如执行
SELECT count(*) FROM tablename
即使对于千万级别的数据mysql也能非常迅速的返回结果
而对于
SELECT count(*) FROM tablename WHERE.....
mysql的查询时间开始攀升

仔细查阅累下手册,发现当没有WHERE语句对于整个mysql的表进行count运算的时候
MyISAM类型的表中保存有总的行数,而当添加有WHERE限定语句的时候Mysql需要对整个表进行检索
从而得出count的数值

突然又想起来看到的不少新兴的php程序对于count的处理并没有很好的意识到这点
记录下

顺便提下mysql的DISTINCT的关键字有很多你想不到的用处
1.在count 不重复的记录的时候能用到
比如SELECT COUNT( DISTINCT id ) FROM tablename;
就是计算talbebname表中id不同的记录有多少条

2,在需要返回记录不同的id的具体值的时候可以用
比如SELECT DISTINCT id FROM tablename;
返回talbebname表中不同的id的具体的值

3.上面的情况2对于需要返回mysql表中2列以上的结果时会有歧义
比如SELECT DISTINCT id, type FROM tablename;
实际上返回的是 id与type同时不相同的结果,也就是DISTINCT同时作用了两个字段,必须得id与tyoe都相同的才被排除了,与我们期望的结果不一样

4.这时候可以考虑使用group_concat函数来进行排除,不过这个mysql函数是在mysql4.1以上才支持的

5.其实还有另外一种解决方式,就是使用
SELECT id, type, count(DISTINCT id) FROM tablename
虽然这样的返回结果多了一列无用的count数据(或许你就需要这个我说的无用数据)
返回的结果是 只有id不同的所有结果和上面的4类型可以互补使用,就是看你需要什么样的数据了

PS:
越来越发现有很多细节是需要去探究的,
越来越发现自己写文字真的很杂乱,
有空研究下DISTINCT的效率

Tags: MySQL优化, MySQL效率


已有 5 条评论 »

  1. billbill

    谢谢分享。

  2. s7v7nislandss7v7nislands

    5.其实还有另外一种解决方式,就是使用
    SELECT id, type, count(DISTINCT id) FROM tablename
    虽然这样的返回结果多了一列无用的count数据(或许你就需要这个我说的无用数据)

    SELECT id, type from tablename group by id;
    这样貌似也可以

    用distinct的时候,如果它有索引,mysql会把它转成group by的方式执行。

  3. kimikimi

    感谢楼上的 又学习了

  4. iranwiranw

    谢谢分享
    SELECT id, type from tablename group by id;

    SELECT id, type, count(DISTINCT id) FROM tablename
    那个效率高呢?
    有测试过吗?

  5. 诚易诚易

    其实简单的方法最好,一律使用count(*)就可以了。使用0或1什么的,都不是正道。

来自 http://www.ccvita.com/156.html

 

普通分类: