博客
关于我
SQL必知必会 第10课 分组数据
阅读量:179 次
发布时间:2019-02-28

本文共 694 字,大约阅读时间需要 2 分钟。

数据分组与过滤

在数据分析中,合理的分组和过滤是提升效率的关键步骤。以下是关于SQL分组的详细指导。

10.2 创建分组

GROUP BY子句用于将数据按指定字段分组。以下示例展示了如何按vend_id分组并计算每个供应商的产品数量:

select vend_id, count(*) as num_prodsfrom productsgroup by vend_id;

10.3 过滤分组

对于分组后的数据,HAVING子句用于进行组级过滤。要过滤出订单数超过2的客户,可以使用以下查询:

select cust_id, count(*) as ordersfrom ordersgroup by cust_idhaving count(*) >= 2;

10.4 分组与排序

GROUP BY和ORDER BY的主要区别在于作用时间和排序方式。

特性 GROUP BY ORDER BY
作用 分组数据 排序输出
可用字段 只能使用选择列或表达式 可以使用任何字段
是否需要 不需要 可选

在使用GROUP BY时,建议配合ORDER BY子句使用,以确保输出的数据按指定顺序排列。

10.5 SELECT子句顺序

SELECT子句中的子句顺序不影响结果,但理解每个子句的作用对写出高效查询至关重要。

子句 说明 是否必须使用
SELECT 返回的列或表达式
FROM 数据源表 仅在选择数据时使用
WHERE 行级过滤
GROUP BY 分组说明 仅在需要聚集时使用
HAVING 组级过滤
ORDER BY 排序 可选

通过合理配置这些子句,可以高效地组织和分析数据。

转载地址:http://jgpn.baihongyu.com/

你可能感兴趣的文章
Numpy.VisibleDeproationWarning:从不整齐的嵌套序列创建ndarray
查看>>
Numpy:按多个条件过滤行?
查看>>
Numpy:条件总和
查看>>
numpy、cv2等操作图片基本操作
查看>>
numpy中的argsort的用法
查看>>
NumPy中的精度:比较数字时的问题
查看>>
numpy判断对应位置是否相等,all、any的使用
查看>>
Numpy多项式.Polynomial.fit()给出的系数与多项式.Polyfit()不同
查看>>
Numpy如何使用np.umprod重写range函数中i的python
查看>>
numpy学习笔记3-array切片
查看>>
numpy数组替换其中的值(如1替换为255)
查看>>
numpy数组索引-ChatGPT4o作答
查看>>
numpy最大值和最大值索引
查看>>
NUMPY矢量化np.prod不能构造具有超过32个操作数的ufunc
查看>>
Numpy矩阵与通用函数
查看>>
numpy绘制热力图
查看>>
numpy转PIL 报错TypeError: Cannot handle this data type
查看>>
Numpy闯关100题,我闯了95关,你呢?
查看>>
nump模块
查看>>
Nutch + solr 这个配合不错哦
查看>>