06丨数据过滤:SQL数据过滤都有哪些方法?
06丨数据过滤:SQL数据过滤都有哪些方法?
讲述:陈旸
时长08:48大小8.04M
比较运算符
逻辑运算符
使用通配符进行过滤
总结
赞 35
提建议
精选留言(148)
- 一步2019-06-24就是要避免全表扫描,所以我们会考虑在 WHERE 及 ORDER BY 涉及到的列上增加索引 ----------------------------------------------- where 条件字段上加索引是可以明白的,但是为什么 order by 字段上还要加索引呢?这个时候已经通过 where条件过滤得到了数据,已经不需要在筛选过滤数据了,只需要在排序的时候根据字段排序就好了。不是很明白
作者回复: 这是一个很好的问题,关于ORDER BY字段是否增加索引: 在MySQL中,支持两种排序方式:FileSort和Index排序。Index排序的效率更高, Index排序:索引可以保证数据的有序性,因此不需要再进行排序。 FileSort排序:一般在内存中进行排序,占用CPU较多。如果待排结果较大,会产生临时文件I/O到磁盘进行排序,效率较低。 所以使用ORDER BY子句时,应该尽量使用Index排序,避免使用FileSort排序。 当然具体优化器是否采用索引进行排序,你可以使用explain来进行执行计划的查看。 优化建议: 1、SQL中,可以在WHERE子句和ORDER BY子句中使用索引,目的是在WHERE子句中避免全表扫描,ORDER BY子句避免使用FileSort排序。 当然,某些情况下全表扫描,或者FileSort排序不一定比索引慢。但总的来说,我们还是要避免,以提高查询效率。 一般情况下,优化器会帮我们进行更好的选择,当然我们也需要建立合理的索引。 2、尽量Using Index完成ORDER BY排序。 如果WHERE和ORDER BY相同列就使用单索引列;如果不同使用联合索引。 3、无法Using Index时,对FileSort方式进行调优。
共 5 条评论102 - Samson2019-06-24老师,似乎有个问题:“(%)和(_)的区别在于,(%)代表一个或多个字符,而(_)只代表一个字符。” %似乎是代表0个或任意正整数个字符,而不是一个或多个,因为如果是一个或多个的话,那么第一个例子中的太乙真人就匹配不到了。共 1 条评论56
- 极客星星2019-06-25你好 老师 不是很明白您说的对where语句建索引是什么意思 通过sql语句怎么实现 谢谢
作者回复: 多谢提问,这句话我说的比较省略。想表达的意思是,如果你使用了WHERE子句,对于某个字段进行了条件筛选,那么这个字段你可以通过建立索引的方式进行SQL优化。 因为我们在进行SQL优化的时候,应该尽量避免全表扫描。所以当我们使用WHERE子句对某个字段进行了条件筛选时,如果我们没有对这个字段建立索引,就会进入到全表扫描,因此可以考虑对这个字段建立索引。 当然你也需要注意 索引是否会失效。因此除了考虑建立字段索引以外,你还需要考虑: 1、不要在WHERE子句后面对字段做函数处理,同时也避免对索引字段进行数据类型转换 2、避免在索引字段上使用<>,!=,以及对字段进行NULL判断(包括 IS NULL, IS NOT NULL) 3、在索引字段后,慎用IN和NOT IN,如果是连续的数值,可以考虑用BETWEEN进行替换 因为在WHERE子句中,如果对索引字段进行了函数处理,或者使用了<>,!=或NULL判断等,都会造成索引失效。
54 - 陈扬鸿2019-06-25老师,你好,现在mysql8已经没有frm文件,一旦数据字典丢失,没有表结构就无法恢复单个ibd文件的数据,如何通过mysql8的 sdi文件生成创建表的ddl语句。
作者回复: 在MySQL8.0版本之前,当我们ALTER TABLE时系统崩溃了,则会遗留.frm,.ibd文件。而在8.0版本之后,MySQL默认的InnoDB存储引擎实现了原子DDL。原子 DDL 操作写入了内部隐藏的系统表,即mysql.innodb_ddl_log中,也就是说明在DDL执行过程中如果出现了失败,是可以回滚的。 需要说明的是:DDL如果正常运行结束后,ddl_log中的相应日志也会被删除。如果这中间崩溃了,重启时会根据事务是否提交了来判断是做redo,还是undo DLL操作。
33 - Abyssknight2019-06-24关于通配符匹配里的 % 相当于正则表达式里的 .* 表示匹配大于等于0个任意字符, 所以 % 太 % 匹配的是 [大于等于0个任意字符]太[大于等于0个任意字符],[东皇]太[一] 和 []太[乙真人]都符合; 而 _% 相当于正则表达式里的 .+ 表示匹配至少一个,即大于等于1个, 所以 '_% 太 % 匹配的是 [大于等于1个字符]太[大于等于0个字符],只有 [东皇]太[一] 符合。展开
作者回复: 对的 解释正确
共 6 条评论33 - 怪兽宇2019-06-26老师好, 平日因业务考核需要,一条查询语句查询条件需要写 30 多个 like "%A%" ,语句跑起来特别慢,请问有什么优化方法吗?
作者回复: 可以考虑: 1、建立索引 2、使用函数来替代LIKE, 如果是MySQL的话:可以考虑locate, position, instr, find_in_set 如果是SQL Server,可以考虑charindex, patindex
共 7 条评论30 - Goal2019-06-24老师关于通配符给的解释,不够清晰! 说明如下: SQL:SELECT name FROM heros WHERE name LIKE '_% 太 %' 因为太乙真人的太是第一个字符,而_%太%中的太不是在第一个字符,所以匹配不到“太乙真人”,只可以匹配上“东皇太一”。 说明: "_":匹配任意一个字符,包括可以匹配到“太乙真人”的太字。 但是,整体的通配符 '_% 太 %',需要后面继续匹配到一个"太"字符,显然,"太乙真人"不符合了,如果是,"太乙真人太太",就可以匹配到。展开
作者回复: 哈哈 太乙真人太太 这个解释的好。也就是在第一个字符之后能匹配上“太”字。
共 3 条评论26 - stormsc2019-06-25有个问题想问老师: SELECT name,role_main,role_assist from heros where role_assist is not null LIMIT 5 这样限定的查询结果为5条数据,是随机选择的5条数据吗?
作者回复: 感谢提问,不是随机的5条。最简单的方式,你可以多重复几次,然后看下结果有没有变化。你会发现,每次运行的结果都是一样的,因此不是随机的。 如果想实现随机5条数据,可以采用下面的方式: SELECT name,role_main,role_assist, RAND() as r FROM heros WHERE role_assist IS NOT NULL ORDER BY r LIMIT 5
22 - 看,有只猪2019-06-25解答一下对使用DATE函数的疑问: birthdate字段可能会有时间包含在里面,如2019-01-01 00:00:00,如果直接和2019-01-01比较是会失败的,用DATE函数可以提取出原始数据的日期部分
作者回复: 解释的很好,关于为什么使用DATE函数的说明可以看下这个
共 3 条评论20 - 杯莫停2020-09-08列举5个索引失效的场景,附SQL: #创建二级索引name_index(name) CREATE INDEX name_index ON heros(name); #创建二级索引mp_max_index(mp_max) CREATE INDEX mp_max_index ON heros(mp_max); #创建二级索引hp_start_index(hp_start) CREATE INDEX hp_start_index ON heros(hp_start); (1)模糊匹配导致索引失效(左匹配和全匹配) #索引失效 EXPLAIN SELECT name,hp_growth,mp_max FROM heros WHERE name LIKE '%太%'; EXPLAIN SELECT name,hp_growth,mp_max FROM heros WHERE name LIKE '%太'; (2)表达式计算导致的索引失效 EXPLAIN SELECT name,hp_growth,mp_max FROM heros WHERE hp_start+1=3308; (3)联合索引导致的索引失效(最左匹配) #删除name_index DROP INDEX name_index ON heros; #创建联合索引 ALTER TABLE heros ADD INDEX name_mp_start_index (name,mp_start); #使用右边的mp_start索引失效 EXPLAIN SELECT hp_start,hp_growth,mp_max FROM heros WHERE mp_start=430; #使用左边的name索引正常使用 EXPLAIN SELECT hp_start,hp_growth,mp_max FROM heros WHERE name='程咬金'; (4) 条件语句中对索引字段使用函数导致索引失效 #使用函数索引失效 EXPLAIN SELECT name,hp_growth,mp_max,hp_start FROM heros WHERE LEFT (hp_start,2)=33; (5) 强制类型转换 EXPLAIN SELECT hp_start,hp_growth,mp_max FROM heros WHERE name=1;展开共 1 条评论13
- Jeric2019-07-16老师你好,学到目前为止课程貌似是默认大家都知道如何安装运行MYSQL,Oracle,navicat等软件。但实际作为一个初学者,我前几节课根本不知道在哪运行代码。后来自己网上找了教程安装和连接之后运行成功,不知老师是否考虑到这点,谢谢。共 5 条评论12
- stormsc2019-06-25作业 mysql: select name 英雄名称, role_main 主要定位, role_assist 次要定位,hp_max 最大生命值,mp_max 最大法力值 from heros where (role_main in ('坦克','战士') AND role_assist is not null) AND (hp_max > 8000 or mp_max <1500) ORDER BY (hp_max+mp_max) DESC
作者回复: 正确,同时采用了列别名的方式。
共 4 条评论11 - hlz-1232019-06-24where子句WHERE 子句中比较运算符、逻辑运算符和通配符这三者各自作用? 1、比较运算符,比较数值的大小,数值类型可以是整数,浮点数,字符串,布尔类型等等。 2、逻辑运算符,定义where子句中多个条件之间的关系。 3、通配符,对文本类型字段进行模糊查询。 Mysql查询语句: SELECT name,role_main,role_assist,hp_max,mp_max FROM heros WHERE (role_main in ('坦克','战士') AND role_assist is not null) AND (hp_max>8000 OR mp_max<1500) order by (hp_max+mp_max) DESC;展开
作者回复: 解释的很好,最后一个SQL查询也正确
9 - 一步2019-06-24所以使用到了 DATE 函数,将字段 birthdate 转化为日期类型再进行比较 ------------------------------------------------- 对于日期的比较,不是可以直接进行比较吗? 对于上面的例子,直接可以使用 birthdate 字段进行时间比较,为什么还要使用DATE函数转换一下呢?共 4 条评论8
- 华夏2019-06-30SELECT name, role_main, role_assist, hp_max, mp_max FROM heros WHERE (role_main IN ('坦克', '战士') AND role_assist IS NOT NULL) AND (hp_max > 8000 OR mp_max < 1500) ORDER BY (hp_max+mp_max) DESC; +-----------+-----------+-------------+--------+--------+ | name | role_main | role_assist | hp_max | mp_max | +-----------+-----------+-------------+--------+--------+ | 牛魔 | 坦克 | 辅助 | 8476 | 1926 | | 刘邦 | 坦克 | 辅助 | 8073 | 1940 | | 程咬金 | 坦克 | 战士 | 8611 | 0 | | 张飞 | 坦克 | 辅助 | 8341 | 100 | | 亚瑟 | 战士 | 坦克 | 8050 | 0 | | 吕布 | 战士 | 坦克 | 7344 | 0 | | 关羽 | 战士 | 坦克 | 7107 | 10 | | 花木兰 | 战士 | 刺客 | 5397 | 100 | +-----------+-----------+-------------+--------+--------+ 8 rows in set (0.00 sec)展开
作者回复: 正确
共 3 条评论5 - 晓涛2019-08-16sql建立索引是什么意思,老师能详细解释下不?
作者回复: 就是在数据库中对某个字段创建索引,索引是一种查找方式,方便后续按照索引进行条件查找
共 2 条评论4 - 不负2019-06-27过滤上线时间 DATE(birthdate) NOT BETWEEN '2016-01-01' AND '2017-01-01',是MySQL里date类型可以直接与字符串进行比较运算?那这里birthdate可以不用 DATE 函数转换了;Oracle中日期的比较就比较严格,TO_DATE、TO_CHAR 效率也不同
作者回复: 是的,在ORACLE中可以使用TO_CHAR, TO_DATE做转换: TO_CHAR 把日期或数字转换为字符串 TO_DATE 把字符串转换为日期类型 同时在MySQL中也有类似的函数 DATE_FORMAT(date,'%Y-%m-%d') 对应 TO_CHAR STR_TO_DATE(date,'%Y-%m-%d') 对应 TO_DATE 比如 SELECT DATE_FORMAT(NOW(),'%m-%d-%Y') AS result SELECT STR_TO_DATE('2017-01-01 00:10:10','%Y-%m-%d %H:%i:%s') AS result
3 - 南辞2020-05-24关于使用函数instr(),locate()、position()、find_in_set() 函数的效率比较like 的效率更高,我用文中的例子做了尝试: SELECT * FROM heros WHERE INSTR(`name`,'太'); SELECT * FROM heros WHERE `name` LIKE '%太%'; SELECT * FROM heros WHERE LOCATE('太',`name`); SELECT * FROM heros WHERE POSITION('太'IN `name`); SELECT * FROM heros WHERE FIND_IN_SET('太',`name`); 但是最后一条语句结果出来是空的,老师能不能具体的解释一下这几个函数?展开2
- ballgod2019-07-13关于通配符的问题想问一下老师,有看过python的正则表达式,评论第三位的解释中,+是一个或无穷个,*是零个或无穷个。按照老师说的%和_的含义,_%太%应该是匹配
作者回复: _%太% 匹配东皇太一,不会匹配到太乙真人。因为_相当于至少要匹配一个字符,所以除了第一个字符以外,需要有“太”字,也就是东皇太一。
2 - ꯭J꯭I꯭N꯭🙃2019-06-25SELECT name, role_main, role_assist,hp_max,mp_max FROM heros WHERE (role_main IN ('坦克','战士') AND role_assist IS NOT NULL) AND (hp_max > 8000 or mp_max < 1500) ORDER BY (hp_max+mp_max) DESC;
作者回复: Good Job
3