SQL 分组统计重复值怎么办？_技术教程_内江振祥营销策划有限公司

答案：使用GROUP BY配合聚合函数统计重复值，通过HAVING过滤重复组，可结合多字段分组、子查询或窗口函数查看明细，用ROW_NUMBER等方法去重。

遇到 SQL 分组统计重复值的问题，核心思路是使用 GROUP BY 配合聚合函数（如 COUNT）来识别和统计重复数据。关键在于明确“按哪些字段分组”以及“如何定义重复”。

假设你有一张用户表 users，想找出姓名重复的记录及其出现次数：

SELECT name, COUNT(*) as count FROM users GROUP BY name HAVING COUNT(*) > 1;

说明：GROUP BY name 将相同姓名归为一组，COUNT(*) 统计每组行数，HAVING 过滤出大于1的组，即存在重复的数据。

如果重复是基于多个字段共同决定的，比如姓名和邮箱都相同才算重复：

SELECT name, email, COUNT(*) as count FROM users GROUP BY name, email HAVING COUNT(*) > 1;

这样可以精准识别复合条件下的重复记录。

上面的查询只返回分组结果，若要看到每一条重复的原始数据，可以用子查询：

SELECT * FROM users WHERE name IN (SELECT name FROM users GROUP BY name HAVING COUNT(*) > 1);

或者使用窗口函数更精确地标记每行是否重复：

SELECT *, COUNT(*) OVER (PARTITION BY name) as cnt FROM users WHERE cnt > 1;

统计之后常需要处理重复项。保留一条去重可用 ROW_NUMBER：

DELETE FROM users WHERE id NOT IN (SELECT MIN(id) FROM users GROUP BY name);

或者用窗口函数定位重复行进行删除。

基本上就这些。关键是理解 GROUP BY 和 HAVING 的配合使用，根据业务定义“重复”，再决定是统计、查明细还是清理。不复杂但容易忽略细节。