新闻中心 分类>>

SQL分组统计怎么做_真实案例解析强化复杂查询思维【指导】

2025-12-21 00:00:00
浏览次数:
返回列表
SQL分组统计核心是GROUP BY搭配聚合函数,关键在于明确分组维度、统计指标和过滤时机:WHERE筛行、GROUP BY分组、HAVING筛聚合结果。

SQL分组统计核心是 GROUP BY 搭配聚合函数(如 COUNT、SUM、AVG 等),但真正难的是“想清楚要按什么分、统计什么、怎么过滤结果”。下面用一个真实业务场景,带你一步步拆解逻辑,强化复杂查询思维。

明确业务目标:先想清楚“要算什么”

假设你手上有销售订单表 orders

  • order_id(订单ID)
  • customer_id(客户ID)
  • product_name(商品名)
  • amount(订单金额)
  • order_date(下单日期)

老板问:“上个月每个客户的总消费额是多少?只看消费超500元的客户。”

这里的关键动作有三步:
→ 按客户分组(GROUP BY customer_id
→ 算每人总金额(SUM(amount)
→ 过滤分组后结果(HAVING SUM(amount) > 500,不是 WHERE!)

写对 GROUP BY 和 HAVING 的位置关系

常见错误是把过滤条件写在 WHERE 里,比如想筛“上个月”,却忘了 WHERE 在分组前执行,会漏掉部分数据逻辑。正确写法:

SELECT 
  customer_id,
  SUM(amount) AS total_spent
FROM orders
WHERE order_date >= '2025-04-01' 
  AND order_date < '2024-05-01'
GROUP BY customer_id
HAVING SUM(amount) > 500;

注意:
→ WHERE 筛原始行(比如时间范围、状态=已完成)
→ GROUP BY 分组
→ HAVING 筛分组后的聚合结果
→ SELECT 中所有非聚合字段必须出现在 GROUP BY 中(否则报错或结果不可靠)

进阶:多维度分组 + 衍生指标

再加一层需求:“按客户+商品类别统计销量和平均单价,并标记‘高价值客户’(该客户总消费 ≥ 2000)。”

这时需要:
→ 关联商品分类表(假设叫 products)
→ 先分组统计基础指标
→ 再用窗口函数或子查询打标签

简化版(不关联表,用 product_name 粗略分大类):

SELECT 
  customer_id,
  CASE 
    WHEN product_name LIKE '%手机%' THEN '数码'
    WHEN product_name LIKE '%书%' THEN '图书'
    ELSE '其他'
  END AS category,
  COUNT(*) AS order_count,
  AVG(amount) AS avg_order_amount
FROM orders
WHERE order_date >= '2025-04-01'
GROUP BY 
  customer_id,
  CASE 
    WHEN product_name LIKE '%手机%' THEN '数码'
    WHEN product_name LIKE '%书%' THEN '图书'
    ELSE '其他'
  END;

重点:
→ 多字段 GROUP BY 用逗号分隔
→ CASE 表达式也可用于分组,但需确保逻辑一致、无歧义
→ 若需“客户总消费”作为额外列,可用窗口函数:SUM(amount) OVER (PARTITION BY customer_id)

避坑提醒:GROUP BY 常见失控行为

  • SELECT 里写了 product_name 却没放 GROUP BY 中 → 报错(MySQL 5.7+ 严格模式)或返回随机值
  • 用 WHERE 过滤聚合结果(如 WHERE SUM(amount)>500)→ 语法错误,必须用 HAVING
  • 忘记处理 NULL:COUNT(*) 统计所有行,COUNT(column) 忽略 NULL;分组时 NULL 会被单独归为一组
  • 日期截取不统一:用 YEAR(order_date)、MONTH(order_date) 分组,不如用 DATE_FORMAT(order_date, '%Y-%m') 更可控

基本上就这些。分组统计不复杂,但容易忽略“执行顺序”和“语义边界”。多练几个带业务含义的真实问题,思维自然就稳了。

搜索