MySQL 删除重复数据保留一条

介绍

在数据处理和管理过程中，经常会遇到需要删除数据库中的重复数据的情况。MySQL 是一种常用的关系型数据库管理系统，它提供了多种删除重复数据的方法。本文将详细介绍如何使用 MySQL 删除重复数据并保留一条作为参考。

场景描述

假设我们有一个名为 students 的数据库表，包含以下字段：

id：学生ID，唯一标识符
name：学生姓名
age：学生年龄
gender：学生性别

在 students 表中可能存在重复的记录，即多个学生拥有相同的姓名、年龄和性别。我们的目标是删除这些重复记录，并保留其中一条作为参考。

解决方案

1. 查找重复记录

首先，我们需要找出表中的重复记录。可以使用以下 SQL 语句查询出所有的重复记录：

SELECT name, age, gender, COUNT(*) FROM students
GROUP BY name, age, gender HAVING COUNT(*) > 1;

该查询语句会根据姓名、年龄和性别进行分组，并统计每组中的记录数。只有记录数大于 1 的分组才会被返回，从而找出了所有重复记录。

2. 删除重复记录

接下来，我们需要删除所有的重复记录，保留一条作为参考。可以使用以下 SQL 语句将重复记录删除：

DELETE FROM students WHERE id NOT IN (
  SELECT MIN(id) FROM students
  GROUP BY name, age, gender HAVING COUNT(*) > 1
);

上述语句中使用了子查询，首先找出每组重复记录中最小的学生ID（即保留的记录），然后将其余记录删除。

3. 运行示例

为了验证上述解决方案的有效性，我们可以创建一个示例数据库并插入一些重复记录。下面是示例代码：

-- 创建示例数据库
CREATE DATABASE example;

-- 切换到示例数据库
USE example;

-- 创建 students 表并插入一些数据
CREATE TABLE students (
  id INT AUTO_INCREMENT PRIMARY KEY,
  name VARCHAR(50),
  age INT,
  gender VARCHAR(10)
);

INSERT INTO students (name, age, gender)
VALUES ('张三', 18, '男'),
       ('李四', 20, '男'),
       ('王五', 18, '男'),
       ('张三', 18, '男'),
       ('李四', 20, '男');

-- 查看表中的数据
SELECT * FROM students;

上述示例代码创建了一个名为 example 的数据库，并在其中创建了一个名为 students 的表，并插入了一些重复记录。

接下来，我们可以运行之前提到的查找和删除重复记录的 SQL 语句：

-- 查找重复记录
SELECT name, age, gender, COUNT(*) FROM students
GROUP BY name, age, gender HAVING COUNT(*) > 1;

-- 删除重复记录
DELETE FROM students WHERE id NOT IN (
  SELECT MIN(id) FROM students
  GROUP BY name, age, gender HAVING COUNT(*) > 1
);

-- 再次查看表中的数据
SELECT * FROM students;

运行以上代码后，我们可以看到删除了其中的重复记录，只保留了一条作为参考。