MySQL学习:联合查询效率分析
user表:
id | name |
1 | libk |
2 | zyfon |
3 | daodao |
user_action表
user_id | action |
1 | jump |
1 | kick |
1 | jump |
2 | run |
4 | swim |
sql语句:
SELECT id, name, action
from user as u left join user_action a on u.id = a.user_id
结果:
id | name | action |
1 | libk | jump |
1 | libk | kick |
1 | libk | jump |
2 | zyfon | run |
3 | daodao | null |
分析:
注意到user_action中还有一个user_id=4, action=swim的记录,但是没有在结果中出现,而user表中id=3,name=daodao的用户再user_action中没有相应的记录,但是却出现在结果集中,因为现在是left join,所有的工作以left表为准。
结论:
left join是这样工作的:从左表读出一条,选出所有与on匹配的右表记录(n条)进行连接,形成n条记录(包括重复的行)。如果右边没有与on条件匹配的表,那连接的字段都是null。然后继续读下一条。
引申:
可以在上面的SQL语句后面加个WHERE条件或者LIMIT等关键字,像一般SQL语句一样对结果集做一个范围限制。
我们可以用右表没有on匹配则显示null的规律,来找出所有在左表,不在右表的记录,注意用来判断的那列必须声明为not null的。
sql语句:
SELECT id, name, action
FROM user as u left join user_action a on u.id = a.user.id
WHERE a.user_id is NULL
注意:
1、列值ewingnull应该是用is null 而不能用 = NULL
2、这里a.user_id列必须声明为NOT NULL的
结果:
id | name | action |
3 | daodao | NULL |
技巧:
1、on a.c1 = b.c1 等同于 using(c1)
2、INNER JOIN和,(英文逗号)在语义上是等同的
3、当从一个表中恢复/检索信息时,可以提供提示,MySQL应使用哪个索引。通过指定USER INDEX(key_list),可以告知MySQL只使用一个索引来查找表中的行。另一种语法IGNORE INDEX(key_list)可以告知MySQL不要使用某些特定的索引。如果EXPLAIN显示MySQL正在使用来自索引清单中的错误索引时,这些提示会有用处。
也可以使用FORCE INDEX,其作用接近USE INDEX(key_list),不过增加了一项作用,一次表扫描被假设为代价很高。换句话说,只有当无法使用一个给定的索引来查找表中的行时,才使用表扫描。
注意:当MySQL决定如何在表中查找行并决定如何进行联合时,使用USE INDEX、IGNORE INDEX和FORCE INDEX只会影响使用哪些索引。当分解一个ORDER BY或GROUP BY时,这些语句不会影响某个索引是否被使用。
例子:
SELECT * FROM table1, table2 WHERE table1.id=table2.id;
SELECT * FROM table1 LEFT JOIN table2 ON table1.id=table2.id;
SELECT * FROM table1 LEFT JOIN table2 USING(id);
SELECT * FROM table1 LEFT JOIN table2 ON table1.id=table2.id
LEFT JOIN table3 ON table2.id=table3.id
SELECT * FROM table1 USE INDEX(key1, key2) WHERE key1=1 AND key2=2 AND key3=3
SELECT * FROM table1 IGNORE INDEX(key3) WHERE key1=1 AND key2=2 AND key3=3
MySQL如何优化LEFT JOIN和RIGHT JOIN
在MySQL中,A LEFT JOIN B join_condition执行过程如下:
- 根据表A和A依赖的所有表设置表B
- 根据LEFT JOIN条件中使用的所有表(除了B)设置表A
- LEFT JOIN条件用于确定如何从表B搜索行(换句话说,不使用WHERE子句中的任何条件)。
- 可以对所有标准联接进行优化,只是从它所依赖的所有表读取的表例外。如果出现循环依赖关系,MySQL提示出现一个错误。
- 进行所有标准WHERE优化
- 如果A中有一行匹配WHERE子句,但B中没有一行匹配ON条件,则生成另一个B行,其中所有列设置为NULL。
- 如果使用LEFT JOIN找出在某些表中不存在的行,并且进行了下面的测试,WHERE 部分的col_name is NULL,其中col_name是一个声明为NOT NULL的列,MySQL找到匹配LEFT JOIN条件的一行后停止(为具体的关键字组合)搜索其它行。
RIGHT JOIN的执行类似LEFT JOIN,只是表的角色反过来。
联接优化器计算表应联接的顺序。LEFT JOIN和STRAIGHT_JOIN强制的表读顺序可以帮助联接优化器更快地工作,因为检查的表交换更少。请注意这说明。如果执行下面类型的查询,MySQL进行b全扫描,因为LEFT JOIN强制它在d之前读取:
SELECT * FROM a, b LEFT JOIN c ON (c.key=a.key) LEFT JOIN d ON (d.key=a.key)
WHERE b.key=d.key;
在这种情况下,修复时用a的相反顺序,b列于FROM子句中
SELECT * FROM b, a LEFT JOIN c ON (c.key=a.key) LEFT JOIN d on (d.key=a.key)
WHERE b.key=d.key
MySQL可以进行下面的LEFT JOIN优化,如果对于产生的NULL行,WHERE条件总为假,LEFT JOIN变为普通联接。
例如,在下面的查询中如果t2.column1为NULL,WHERE子句将为false:
SELECT * FROM t1 LEFT JOIN t2 ON (column1) WHERE t2.column2=5;
因此,可以安全地将查询转换为普通联接:
SELECT * FROM t1, t2 WHERE t2.column2=5 AND t1.column1=t2.column1;
这样可以更快,因为如果可以使查询更佳,MySQL可以在表t1之前使用表t2。为了强制使用表顺序,使用STRAIGHT_JOIN
补充:数据库,mysql教程