星期一, 2013-05-06 17:04 — adminshiping1

mysql分组取每组前几条记录(排名) 附group by与order by的研究

--按某一字段分组取最大(小)值所在行的数据

/*
数据如下：
name val memo
a    2   a2(a的第二个值)
a    1   a1--a的第一个值
a    3   a3:a的第三个值
b    1   b1--b的第一个值
b    3   b3:b的第三个值
b    2   b2b2b2b2
b    4   b4b4
b    5   b5b5b5b5b5

--创建表并插入数据：

create table tb(name varchar(10),val int,memo varchar(20))
insert into tb values('a',    2,   'a2(a的第二个值)')
insert into tb values('a',    1,   'a1--a的第一个值')
insert into tb values('a',    3,   'a3:a的第三个值')
insert into tb values('b',    1,   'b1--b的第一个值')
insert into tb values('b',    3,   'b3:b的第三个值')
insert into tb values('b',    2,   'b2b2b2b2')
insert into tb values('b',    4,   'b4b4')
insert into tb values('b',    5,   'b5b5b5b5b5')

--一、按name分组取val最大的值所在行的数据。

--方法1：

select a.* from tb a where val = (select max(val) from tb where name = a.name) order by a.name
--方法2：
select a.* from tb a where not exists(select 1 from tb where name = a.name and val > a.val)
--方法3：
select a.* from tb a,(select name,max(val) val from tb group by name) b where a.name = b.name and a.val = b.val order by a.name
--方法4：
select a.* from tb a inner join (select name , max(val) val from tb group by name) b on a.name = b.name and a.val = b.val order by a.name
--方法5
select a.* from tb a where 1 > (select count(*) from tb where name = a.name and val > a.val ) order by a.name
/*
name       val         memo
---------- ----------- --------------------
a          3           a3:a的第三个值
b          5           b5b5b5b5b5

本人推荐使用1,3,4,结果显示1,3,4效率相同，2，5效率差些，不过我3,4效率相同毫无疑问，1就不一样了，想不搞了。

--二、按name分组取val最小的值所在行的数据。

--方法1：

select a.* from tb a where val = (select min(val) from tb where name = a.name) order by a.name
--方法2：
select a.* from tb a where not exists(select 1 from tb where name = a.name and val < a.val)
--方法3：
select a.* from tb a,(select name,min(val) val from tb group by name) b where a.name = b.name and a.val = b.val order by a.name
--方法4：
select a.* from tb a inner join (select name , min(val) val from tb group by name) b on a.name = b.name and a.val = b.val order by a.name
--方法5
select a.* from tb a where 1 > (select count(*) from tb where name = a.name and val < a.val) order by a.name
/*
name       val         memo
---------- ----------- --------------------
a          1           a1--a的第一个值
b          1           b1--b的第一个值

--三、按name分组取第一次出现的行所在的数据。

select a.* from tb a where val = (select top 1 val from tb where name = a.name) order by a.name
/*
name       val         memo
---------- ----------- --------------------
a          2           a2(a的第二个值)
b          1           b1--b的第一个值

--四、按name分组随机取一条数据。

select a.* from tb a where val = (select top 1 val from tb where name = a.name order by newid()) order by a.name

/*
name       val         memo
---------- ----------- --------------------
a          1           a1--a的第一个值
b          5           b5b5b5b5b5

--五、按name分组取最小的两个(N个)val

select a.* from tb a where 2 > (select count(*) from tb where name = a.name and val < a.val ) order by a.name,a.val

select a.* from tb a where val in (select top 2 val from tb where name=a.name order by val) order by a.name,a.val
select a.* from tb a where exists (select count(*) from tb where name = a.name and val < a.val having Count(*) < 2) order by a.name
/*
name       val         memo
---------- ----------- --------------------
a          1           a1--a的第一个值
a          2           a2(a的第二个值)
b          1           b1--b的第一个值
b          2           b2b2b2b2

--六、按name分组取最大的两个(N个)val

select a.* from tb a where 2 > (select count(*) from tb where name = a.name and val > a.val ) order by a.name,a.val
select a.* from tb a where val in (select top 2 val from tb where name=a.name order by val desc) order by a.name,a.val
select a.* from tb a where exists (select count(*) from tb where name = a.name and val > a.val having Count(*) < 2) order by a.name
/*
name       val         memo
---------- ----------- --------------------
a          2           a2(a的第二个值)
a          3           a3:a的第三个值
b          4           b4b4
b          5           b5b5b5b5b5

--七，假如整行数据有重复，所有的列都相同（例如下表中的第5,6两行数据完全相同）。

按name分组取最大的两个(N个)val

1  /*
2 数据如下：
3 name val memo
4 a    2   a2(a的第二个值)
5 a    1   a1--a的第一个值
6 a    1   a1--a的第一个值
7 a    3   a3:a的第三个值
8 a    3   a3:a的第三个值
9 b    1   b1--b的第一个值
10 b    3   b3:b的第三个值
11 b    2   b2b2b2b2
12 b    4   b4b4
13 b    5   b5b5b5b5b5
14
15 */
16

附：mysql “group by ”与"order by"的研究－－分类中最新的内容

这两天让一个数据查询难了。主要是对group by 理解的不够深入。才出现这样的情况

这种需求，我想很多人都遇到过。下面是我模拟我的内容表

我现在需要取出每个分类中最新的内容

select * from test group by category_id order by `date`

结果如下

明显。这不是我想要的数据，原因是msyql已经的执行顺序是

引用

写的顺序：select ... from... where.... group by... having... order by..
执行顺序：from... where...group by... having.... select ... order by...

所以在order by拿到的结果里已经是分组的完的最后结果。
由from到where的结果如下的内容。

到group by时就得到了根据category_id分出来的多个小组

到了select的时候，只从上面的每个组里取第一条信息结果会如下

即使order by也只是从上面的结果里进行排序。并不是每个分类的最新信息。
回到我的目的上－－分类中最新的信息
根据上面的分析，group by到select时只取到分组里的第一条信息。有两个解决方法
1，where+group by（对小组进行排序）
2，从form返回的数据下手脚（即用子查询）

由where+group by的解决方法
对group by里的小组进行排序的函数我只查到group_concat()可以进行排序，但group_concat的作用是将小组里的字段里的值进行串联起来。

select group_concat(id order by `date` desc) from `test` group by category_id

再改进一下

select * from `test` where id in(select SUBSTRING_INDEX(group_concat(id order by `date` desc),',',1) from `test` group by category_id ) order by `date` desc

子查询解决方案

select * from (select * from `test` order by `date` desc) `temp` group by category_id order by `date` desc

来自 http://www.jb51.net/article/23969.htm

mysql GROUP BY 与 ORDER BY数据排序问题

在做一个数据分组查询时发现我们要出来的数据不是最新版本，结果我再利用GROUP BY 与 ORDER BY数据排序但还不是最新的数据，那么要如何解决呢

有两个解决方法

1，where+group by（对小组进行排序）
2，从form返回的数据下手脚（即用子查询）
由where+group by的解决方法
对group by里的小组进行排序的函数我只查到group_concat()可以进行排序，但group_concat的作用是将小组里的字段里的值进行串联起来。

代码如下	复制代码
select group_concat(id order by `date` desc) from `test` group by category_id

再改进一下

代码如下	复制代码
select * from `test` where id in(select SUBSTRING_INDEX(group_concat(id order by `date` desc),',',1) from `test` group by category_id ) order by `date` desc

子查询解决方案

代码如下	复制代码
select * from (select * from `test` order by `date` desc) `temp` group by category_id order by `date` desc

自己例子

代码如下

复制代码

SELECT *
FROM (

SELECT *
FROM `ecm_copy_goods_change`
ORDER BY `cid` DESC
) `ecm_copy_goods_change`
GROUP BY goods_id
ORDER BY `cid` DESC

一个dz论坛使用调最后发布内容的案例分析

在使用mysql排序的时候会想到按照降序分组来获得一组数据，而使用order by往往得到的不是理想中的结果，那么怎么才能使用group by 和order by得到理想中的数据结果呢？

例如有一个帖子的回复表，posts（ id , tid , subject , message , dateline ） ,

id为自动增长字段， tid为该回复的主题帖子的id（外键关联）, subject 为回复标题， message 为回复内容， dateline 为回复时间，用UNIX 时间戳表示，

现在要求选出前十个来自不同主题的最新回复

代码如下	复制代码
SELECT * FROM posts GROUP BY tid LIMIT 10

这样一个sql语句选出来的并非你想要的最新的回复，而是最早的回复，实际上是某篇主题的第一条回复记录！

也就是说 GROUP BY 语句没有排序，那么怎么才能让 GROUP 按照 dateline 倒序排列呢？加上 order by 子句？

看下面：

代码如下	复制代码
SELECT * FROM posts GROUP BY tid ORDER BY dateline DESC LIMIT 10

这条语句选出来的结果和上面的完全一样，不过把结果倒序排列了，而选择出来的每一条记录仍然是上面的记录，原因是 group by 会比 order by 先执行，这样也就没有办法将 group by 之前，也就是在分组之前进行排序了，有网友会写出下面的sql 语句：

代码如下	复制代码
SELECT * FROM posts GROUP BY tid DESC ORDER BY dateline DESC LIMIT 10

也就是说在 GROUP BY 的字段 tid 后面加上递减顺序，这样不就可以取得分组时的最后回复了吗？这个语句执行结果会和上面的一模一样，这里加上 DESC 和ASC对执行结果没有任何影响！其实这是一个错误的语句，原因是GROUP BY 之前并没有排序功能，mysql 手册上面说，GROUP BY 时是按照某种顺序排序的，某种顺序到底是什么顺序？其实根本没有顺序，因为按照tid分组，其实也就是说，把tid相等的归纳到一个组，这样想的话，GROUP BY tid DESC 可以认为是在按照 tid 分组的时候，按照tid进行倒序排列，这不扯吗，既然是按照tid分组，当然是tid相等的归到一组，而这时候按照tid倒叙还是升序有个P用！

有网友发明下面的语句：

代码如下	复制代码
SELECT * FROM posts GROUP BY tid , dateline DESC ORDER BY dateline DESC LIMIT 10

心想这样我就可以在分组前按照 dateline 倒序排列了，其实这个语句并没有起到按照tid分组的作用，原因还是上面的，在group by 字段后加 desc 还是 asc 是错误的写法，而这种写法网友本意是想按照 tid 分组，并且在分组的时候按照 dateline排倒序！而实际这句相当于下面的写法：（去掉 GROUP BY 字段后面的 DESC）

代码如下	复制代码
SELECT * FROM posts GROUP BY tid , dateline ORDER BY dateline DESC LIMIT 10

也就是说，按照 tid 和 dateline 联合分组，只有在记录tid和dateline 同时相等的时候才归纳到一组，这显然不可能，因为 dateline 时间线基本上是唯一的！

有人写出下面的语句：

代码如下	复制代码
SELECT *,max(dateline) as max_line FROM posts GROUP BY tid ORDER BY dateline DESC LIMIT 10

这条语句的没错是选出了最大发布时间，但是你可以对比一下 dateline 和 max_dateline 并不相等！(可能有相当的情况，就是分组的目标记录只有一条的时候！)

为什么呢？原因很简单，这条语句相当于是在group by 以后选出本组的最大的发布时间！对分组没有起到任何影响！因为SELECT子句是最后执行的！

后来更有网友发明了下面的写法！

代码如下	复制代码
SELECT *,max(dateline) as max_line FROM posts GROUP BY tid HAVING dateline=max(dateline) ORDER BY dateline DESC LIMIT 10

这条语句的预期结果和想象中的并不相同！因为你会发现，分组的结果中大量的记录没有了！为什么？因为 HAVING 是在分组的时候执行的，也就说：在分组的时候加上一个这样的条件：选择出来的 dateline 要和本组最大的dateline 相等，执行的结果和下面的语句相同：

代码如下	复制代码
SELECT ,max(dateline) as max_line FROM posts GROUP BY tid HAVING count()=1 ORDER BY dateline DESC LIMIT 10

看了这条sql语句是不是明白了呢？

dateline=max(dateline) 只有在分组中的记录只有一条的时候才成立，原因很明白吧！只有一条他才会和本组的最大发布时间相等阿，（默认dateline为不重复的值）

原因还是因为 group by 并没有排序功能，所有的这些排序功能只是错觉，所以你最终选出的 dateline 和max(dateline) 永远不可能相等，除非本组的记录只有一条！GROUP BY 在分组的时候，可能是一个一个来找的，发现有相等的tid，去掉，保留第一个发现的那一条记录，所以找出来的记录永远只是按照默认索引顺序排列的！

那么说了这么多，到底有没有办法让 group by 执行前分组阿？有的，子查询阿！

最简单的：

代码如下	复制代码
SELECT * FROM (SELECT * FROM posts ORDER BY dateline DESC) GROUP BY tid ORDER BY dateline DESC LIMIT 10

来自 http://www.111cn.net/database/mysql/62313.htm

普通分类:

mysql

You are here

mysql分组取每组前几条记录(排名) 附group by与order by的研究有大用

mysql分组取每组前几条记录(排名) 附group by与order by的研究

mysql GROUP BY 与 ORDER BY数据排序问题

友情链接

搜索表单

用户登录

You are here

mysql分组取每组前几条记录(排名) 附group by与order by的研究 有大用

mysql分组取每组前几条记录(排名) 附group by与order by的研究

mysql GROUP BY 与 ORDER BY数据排序问题

友情链接

mysql分组取每组前几条记录(排名) 附group by与order by的研究有大用