WHERE子句中对列使用函数(如DATE(created_at))会导致索引失效,应改用范围查询;子查询需谓词下推、避免SELECT *、慎用BETWEEN处理日期边界。 WHERE 子句里写 DATE(created_at) 会让索引失效 很多开发者习惯在WHERE条件里直接调用函数处理列,比如D

DATE(created_at) 会让索引失效很多开发者习惯在WHERE条件里直接调用函数处理列,比如DATE(created_at)。但这么写,数据库优化器基本就“傻眼”了。无论是MySQL还是PostgreSQL,一旦列被函数包裹,建立在它上面的B-tree索引大概率会失效。执行计划里,你往往会看到type: ALL(全表扫描)或者扫描行数rows飙升。
长期稳定更新的攒劲资源: >>>点此立即查看<<<
正确的思路是什么?把函数从列身上挪开,改用清晰的范围比较。看个对比:
WHERE DATE(created_at) = '2024-05-20'WHERE created_at >= '2024-05-20' AND created_at < '2024-05-21'WHERE created_at >= '2024-05-20 00:00:00' AND created_at < '2024-05-21 00:00:00'这样一来,数据库就能轻松利用索引进行范围扫描(Range Scan)。更重要的是,这种写法为“谓词下推”扫清了障碍——外层的过滤条件有机会更早地作用于子查询,效率提升立竿见影。
IN (SELECT ...) 配日期条件容易触发全表扫描嵌套查询本身就需要谨慎,如果再配上日期过滤,很容易踩坑。当外层查询的WHERE条件依赖于子查询的结果,而子查询内部又用了日期函数时,数据库优化器可能会选择放弃“谓词下推”。尤其是在MySQL 5.7或更早的版本中,Using temporary; Using filesort这样的提示会频繁出现。
怎么办?优先考虑改用EXISTS或显式的JOIN,并且确保子查询内部的日期条件已经采用了上面提到的范围写法。
WHERE id IN (SELECT user_id FROM logs WHERE DATE(log_time) = '2024-05-20')JOIN logs ON t.id = logs.user_id AND logs.log_time >= '2024-05-20' AND logs.log_time < '2024-05-21'EXISTS (SELECT 1 FROM logs WHERE logs.user_id = t.id AND logs.log_time >= '2024-05-20' AND logs.log_time < '2024-05-21')虽然PostgreSQL对IN子查询的下推支持相对好一些,但为了代码的清晰度和执行计划的可控性,统一使用“范围比较 + JOIN”依然是更稳妥的选择。
另一个常见的性能陷阱出现在子查询的派生表(Derived Table)上。比如,你写了一个子查询:(SELECT user_id, MAX(created_at) AS last_login FROM users GROUP BY user_id) t。这里的t.last_login是一个计算字段,数据库不会自动为它创建索引。
如果此时在外层查询中加上WHERE t.last_login > '2024-01-01',那么整个子查询必须先全部执行完毕,生成一个中间结果集,然后才能对这个结果集进行过滤。数据量一大,性能瓶颈就出现了。
WHERE created_at > '2024-01-01'这个条件放在子查询的GROUP BY之前。last_login),可以考虑物化策略。MySQL 8.0+可以使用WITH子句配合MATERIALIZED提示;PostgreSQL则可以创建临时表并手动为其添加索引。SELECT *,只选取真正需要的字段,这能有效减少中间结果集的体积,减轻内存压力。这里需要明确一点:谓词下推不是“写了WHERE就自动生效”的魔法。它严重依赖于列是否可被索引、是否被函数“污染”、以及它出现在查询的哪个位置。这些细节,都需要开发者自己来把关。
BETWEEN 处理不一致,慎用于日期边界BETWEEN看起来简洁,但在处理日期时却是个“暗坑”。BETWEEN '2024-05-20' AND '2024-05-20'这条语句,在PostgreSQL中等价于>= '2024-05-20' AND <= '2024-05-20'。然而,MySQL默认会将没有时间的日期字面量截断为'2024-05-20 00:00:00',这会导致查询漏掉当天00:00:00之后的所有数据。
WHERE created_at BETWEEN '2024-05-20' AND '2024-05-20'created_at >= '2024-05-20' AND created_at < '2024-05-21''2024-05-20 00:00:00' 和 '2024-05-21 00:00:00'这个细节在跨数据库迁移、或者读写分离(主从库数据库类型可能不同)的场景下特别容易引发问题——明明SQL语句一模一样,查询结果却差了几个小时的数据,排查起来相当棘手。
侠游戏发布此文仅为了传递信息,不代表侠游戏网站认同其观点或证实其描述