首页 > 数据库 >如何用SQL按年龄段分段统计人数？

如何用SQL按年龄段分段统计人数？

来源：互联网 2026-06-19 08:53:13

在日常的数据统计工作中，按年龄段分组统计是最常见的需求之一。最佳实践是直接在 SELECT 里嵌套 CASE WHEN，配合 GROUP BY 的分组别名来完成——这种方式兼容性最好，MySQL、PostgreSQL、SQL Server 都能跑通。关键在于把年龄段边界定清楚、处理掉 NULL 和异

在日常的数据统计工作中，按年龄段分组统计是最常见的需求之一。最佳实践是直接在 SELECT 里嵌套 CASE WHEN，配合 GROUP BY 的分组别名来完成——这种方式兼容性最好，MySQL、PostgreSQL、SQL Server 都能跑通。关键在于把年龄段边界定清楚、处理掉 NULL 和异常值，并且尽量先用 WHERE 过滤数据来提升性能。下面展开聊聊具体的写法、常见的坑以及进阶方案。

如何用SQL按年龄段分段统计人数？

长期稳定更新的攒劲资源： >>>点此立即查看<<<

用 CASE WHEN 实现年龄段分组统计

直接在 SELECT 中写 CASE WHEN 是最通用的办法，不依赖窗口函数或 CTE，什么数据库都能跑。很多新手容易犯两个错误：一是直接把年龄字段丢进 GROUP BY，结果每岁一行，根本分不了段；二是漏写 ELSE，导致 NULL 或异常值被丢弃，统计总数变少。要避免这些坑，需注意以下几点：

年龄段边界必须明确闭合——比如 0-17 写成 age < 18，18-25 写成 age BETWEEN 18 AND 25，不能有重叠或遗漏。
一定要配合 GROUP BY 的分组别名（比如 age_group），不能直接对 CASE 表达式本身分组。
示例语句如下：

SELECT  
  CASE  
    WHEN age < 18 THEN '未成年'  
    WHEN age BETWEEN 18 AND 35 THEN '青年'  
    WHEN age BETWEEN 36 AND 59 THEN '中年'  
    ELSE '老年'  
  END AS age_group,  
  COUNT(*) AS cnt  
FROM users  
GROUP BY age_group;

WHERE 过滤后再统计更高效

如果报表只关心某几个年龄段（比如只看 18–45 岁），先用 WHERE 筛掉无关数据，再分组统计，性能要比全表扫描加 CASE 判断好得多，尤其在大表上效果显著。不过要注意，WHERE 只能排除数据，不能代替 CASE 的分类——比如想看 18–25 和 26–35 两组的人数，不能只靠 WHERE age >= 18 搞定。适合的场景是：需求固定、只展示几个区间，并且 age 字段建了索引（比如 B-tree）。
另外，千万别在 WHERE 里写函数，比如 WHERE FLOOR(age/10)*10 = 20，这会导致索引失效。正确的写法类似这样（查 18–45 岁内的细分段）：

SELECT  
  CASE  
    WHEN age < 25 THEN '18-24'  
    WHEN age < 35 THEN '25-34'  
    ELSE '35-45'  
  END AS range,  
  COUNT(*)  
FROM users  
WHERE age BETWEEN 18 AND 45  
GROUP BY range;

用 WITH RECURSIVE 构造连续分段（高级但少用）

当分段规则复杂、需要很多区间（比如从 0 到 100 按每 5 岁一档），硬写几十个 WHEN 不仅容易出错，维护起来也头疼。这时候可以用递归 CTE 先生成一个分段维度表，然后 LEFT JOIN 到目标表上。需要注意的是，SQLite 和旧版 MySQL 不支持 WITH RECURSIVE；PostgreSQL 以及 MySQL 8.0+ 虽然能用，但性能不一定比静态 CASE 好，所以只适合动态配置场景。关键地方有两点：

递归终止条件必须写清楚（比如 upper_bound <= 100），否则会无限循环。
JOIN 时用 ON u.age >= d.lower AND u.age < d.upper，注意开闭区间要一致。

简单示意一下（非完整可执行的代码）：

WITH RECURSIVE age_ranges AS (  
  SELECT 0 AS lower, 5 AS upper  
  UNION ALL  
  SELECT lower + 5, upper + 5 FROM age_ranges WHERE upper < 100  
)  
SELECT r.lower, r.upper, COUNT(u.id)  
FROM age_ranges r  
LEFT JOIN users u ON u.age >= r.lower AND u.age < r.upper  
GROUP BY r.lower, r.upper;

NULL 和异常值必须显式处理

真实数据里，age 字段常有 NULL、0、负数甚至 999 这种超大值。如果没有写 ELSE，这些记录不会进入任何 WHEN 分支，直接消失，导致统计总数对不上。调试时发现总数变少，第一反应就是检查 SELECT COUNT(*), COUNT(age) FROM users 是否相等——不等说明有 NULL 在捣乱。