最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 科技 - 知识百科 - 正文

MySQL避免索引列使用OR条件

来源:动视网 责编:小采 时间:2020-11-09 09:11:06
文档

MySQL避免索引列使用OR条件

MySQL避免索引列使用OR条件:这个亏已经吃过很多次了,在开发以前的sql代码里面,许多以 or 作为where条件的查询,甚至更新。这里举例来说明使用 or 的弊端,以及改进办法。select f_crm_id from d_dbname1.t_tbname1 where f_xxx_id = 926067 and (f_mob
推荐度:
导读MySQL避免索引列使用OR条件:这个亏已经吃过很多次了,在开发以前的sql代码里面,许多以 or 作为where条件的查询,甚至更新。这里举例来说明使用 or 的弊端,以及改进办法。select f_crm_id from d_dbname1.t_tbname1 where f_xxx_id = 926067 and (f_mob


这个亏已经吃过很多次了,在开发以前的sql代码里面,许多以 or 作为where条件的查询,甚至更新。这里举例来说明使用 or 的弊端,以及改进办法。

select f_crm_id from d_dbname1.t_tbname1 where f_xxx_id = 926067 and (f_mobile ='12345671' or f_phone ='12345671' ) limit 1

从查询语句很容易看出,f_mobile和f_phone两个字段都有可能存电话号码,一般思路都是用 or 去一条sql解决,但表数据量一大简直是灾难:

t_tbanme1上有索引 idx_id_mobile(f_xxx_id,f_mobile) , idx_phone(f_phone) , idx_id_email(f_id,f_email) ,explain 的结果却使用了 idx_id_email 索引,有时候运气好可能走 idx_id_mobile f_xxx_id

因为mysql的每条查询,每个表上只能选择一个索引。如果使用了 idx_id_mobile 索引,恰好有一条数据,因为有 limit 1 ,那么恭喜很快得到结果;但如果 f_mobile 没有数据,那 f_phone 字段只能在f_id条件下挨个查找,扫描12w行。 or 跟 and 不一样,甚至有开发认为添加 (f_xxx_id,f_mobile,f_phone) 不就完美了吗,要吐血了~

<!-- more -->

那么优化sql呢,很简单( 注意f_mobile,f_phone上都要有相应的索引 ), 方法一 :

(select f_crm_id from d_dbname1.t_tbname1 where f_xxx_id = 926067 and f_mobile ='12345671' limit 1 ) UNION ALL 
(select f_crm_id from d_dbname1.t_tbname1 where f_xxx_id = 926067 and f_phone ='12345671' limit 1 )

两条的sql都能用上索引,分查询各自limit,如果都有结果集返回,随便取一条就行。

还有一种优化办法,如果这种查询特别频繁(又无缓存),改成单独的sql执行,比如大部分号码值都在f_mobile上,那就先执行分sql1,有结果则结束,判断没有结果再执行分sql2 ,能减少数据库查询速度,让代码去处理更多的事情, 方法二 伪代码:

sql1 = select f_crm_id from d_dbname1.t_tbname1 where f_xxx_id = 926067 and f_mobile ='12345671' limit 1;
sq1.execute();
if no result sql1:
 sql1 = select f_crm_id from d_dbname1.t_tbname1 where f_xxx_id = 926067 and f_phone ='12345671' limit 1;
 sql1.execute();

复杂一点的场景是止返回一条记录那么简单,limit 2:

select a.f_crm_id from d_dbname1.t_tbname1 as a where (a.f_create_time > from_unixtime('14397527') or a.f_modify_time > from_unixtime('14397527') ) limit 0,200

这种情况方法一、二都需要改造,因为 f_create_time,f_modify_time 都可能均满足判断条件,这样就会返回重复的数据。

方法一需要改造:

(select a.f_crm_id from d_dbname1.t_tbname1 as a where a.f_create_time > from_unixtime('14397527') limit 0,200 ) UNION ALL
(select a.f_crm_id from d_dbname1.t_tbname1 as a where a.f_modify_time > from_unixtime('14397527')and a.f_create_time <= from_unixtime('14397527') limit 0,200)

有人说 把 UNION ALL 改成 UNION 不就去重了吗?如果说查询比较频繁,或者limit比较大,数据库还是会有压力,所以需要做trade off。

这种情况更多还是适合方法二,包括有可能需要 order by limit 情况。改造伪代码:

sql1 = (select a.f_crm_id from d_dbname1.t_tbname1 as a where a.f_create_time > from_unixtime('14397527') limit 0,200 );
sql1.execute();
sql1_count = sql1.result.count
if sql1_count < 200 :
 sql2 = (select a.f_crm_id from d_dbname1.t_tbname1 as a where a.f_modify_time > from_unixtime('14397527') 
 and a.f_create_time <= from_unixtime('14397527') limit 0, (200 - sql1_count) );
 sql2.execute();

final_result = paste(sql1,sql2);

or条件在数据库上很难优化,能在代码里优化逻辑,不至于拖垮数据库。只有在 or 条件下无需索引时(且需要比较的数据量小),才考虑。

相同字段 or 可改成 in,如 f_id=1 or f_id=100 -> f_id in (1,100) 。 效率问题见文章 mysql中or和in的效率问题 。

上述优化情景都是存储引擎在 InnoDB 情况下,在MyISAM有不同,见 mysql or条件可以使用索引而避免全表 。

文档

MySQL避免索引列使用OR条件

MySQL避免索引列使用OR条件:这个亏已经吃过很多次了,在开发以前的sql代码里面,许多以 or 作为where条件的查询,甚至更新。这里举例来说明使用 or 的弊端,以及改进办法。select f_crm_id from d_dbname1.t_tbname1 where f_xxx_id = 926067 and (f_mob
推荐度:
标签: 使用 避免 条件
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top