GROUP BY表分组的用法
GROUP BY 子句:
GROUP BY (EXPRESSION)
你可以用group by 子句把表分成更小的组。这个子句有些要注意的地方:
1.在selelct 列表中的任何列或表达式,它们都必须出现在group by子句中或者是group function中,但是group by子句中可以出现非select列表中的列或表达式。
select 列表中的列都在group by子句和group function中,所以成功执行。
SQL> select department_id,avg(salary) from employees
2 group by department_id
3 order by department_id;
DEPARTMENT_ID AVG(SALARY)
------------- - ----------
10 4400
20 9500
30 4150
40 6500
50 3475.55556
60 5760
70 10000
80 8955.88235
90 19333.3333
100 8601.33333
110 10154
DEPARTMENT_ID AVG(SALARY)
------------- -----------
7000
12 rows selected.
没有将job_id列放在group by子句或group function中,所以执行失败。
SQL> select department_id, job_id,avg(salary) from employees
2 group by department_id;
select department_id, job_id,avg(salary) from employees
*
ERROR at line 1:
ORA-00979: not a GROUP BY expression
在group by 子句中可以有非select列表中的列,所以执行成功。
SQL> select avg(salary) from employees group by department_id;
AVG(SALARY)
-----------
8601.33333
4150
7000
9500
10000
19333.3333
10154
3475.55556
6500
8955.88235
4400
AVG(SALARY)
-----------
5760
12 rows selected.
2.在where子句中不可以使用别名,同样在group by 子句中也不可以使用。order by 子句中可以使用别名。
SQL> select department_id as DD,avg(salary) from employees
2 group by DD;
group by DD
*
ERROR at line 2:
ORA-00904: "DD": invalid identifier
这是为什么?主要是执行顺序的原因:
SQL Select语句完整的执行顺序:
1、from子句组装来自不同数据源的数据;
2、where子句基于指定的条件对记录行进行筛选;
3、group by子句将数据划分为多个分组;
4、使用聚集函数进行计算;
5、使用having子句筛选分组;
6、计算所有的表达式;
7、select 的字段;
8、使用order by对结果集进行排序。
SQL语言不同于其他编程语言的最明显特征是处理代码的顺序。在大多数据库语言中,代码按编码顺序被处理。但在SQL语句中,第一个被处理的子句式FROM,而不是第一出现的SELECT。SQL查询处理的步骤序号:
(8)
1 SELECT (9) DISTINCT (11) <TOP_specification> <select_list>
2 (1) FROM <left_table>
3 (3) <join_type> JOIN <right_table>
4 (2) ON <join_condition>
5 (4) WHERE <where_condition>
6 (5) GROUP BY <group_by_list>
7 (6) WITH {CUBE | ROLLUP}
8 (7) HAVING <having_condition>
9 (10) ORDER BY <order_by_list>
以上每个步骤都会产生一个虚拟表,该虚拟表被用作下一个步骤的输入。这些虚拟表对调用者(客户端应用程序或者外部查询)不可用。只有最后一步生成的表才会会给调用者。如果没有在查询中指定某一个子句,将跳过相应的步骤。
3.按多列分组
对GROUP BY 子句的强大扩充就是使用多个分组特性。Oracle允许将数据集划分为多组,并且允许使用不同的分组特性将这些组进一步划分成子组。
SQL> select department_id,job_id,sum(salary) from employees
2 group by department_id,job_id
3 order by department_id;
DEPARTMENT_ID JOB_ID SUM(SALARY)
------------- ---------- -----------
10 AD_ASST 4400
20 MK_MAN 13000
20 MK_REP 6000
30 PU_CLERK 13900
30 PU_MAN 11000
40 HR_REP 6500
50 SH_CLERK 64300
50 ST_CLERK 55700
50 ST_MAN 36400
60 IT_PROG 28800
70 PR_REP 10000
DEPARTMENT_ID JOB_ID SUM(SALARY)
------------- ---------- -----------
80 SA_MAN 61000
80 SA_REP 243500
90 AD_PRES 24000
90 AD_VP 34000
100 FI_ACCOUNT 39600
100 FI_MGR 12008
110 AC_ACCOUNT 8300
110 AC_MGR 12008
SA_REP 7000
20 rows selected.
先是用department_id进行分组,然后再在这个分组的基础上用job_id分组,划分更小的组。