SQL Primary Key详解|极客笔记

SQL Primary Key详解

1. 什么是Primary Key

Primary Key（主键）是SQL表中的一个列或者一组列，用于唯一标识表中的每一行数据。它具有以下特点：

Primary Key的值不能重复，每个表只能有一个主键
Primary Key不能为NULL，即不能为空值
Primary Key可以是一个列，也可以是多个列的组合

Primary Key在数据库中起到了非常重要的作用，它可以用来确保表中的数据完整性和一致性。在实际应用中，我们可以根据具体的业务需求来选择合适的列来作为Primary Key。

2. Primary Key的优点

唯一性：Primary Key可以保证每一行数据的唯一性，避免了数据冗余和重复插入的问题。
快速检索：数据库会自动为主键创建索引，这样可以大大提高数据的检索效率。
数据完整性：Primary Key禁止空值和重复值的插入，确保了数据的完整性和一致性。
外键引用：Primary Key常用于作为外键的参照，用来在多个表之间建立关联关系。

3. 如何定义Primary Key

在创建表的时候，可以通过以下两种方式来定义Primary Key：

在创建表的时候指定主键：在CREATE TABLE语句中使用PRIMARY KEY约束来指定一个或多个列作为主键。
示例代码：

CREATE TABLE students (
  id INT PRIMARY KEY,
  name VARCHAR(50),
  age INT
);

创建表之后指定主键：通过ALTER TABLE语句来添加主键约束。
示例代码：

ALTER TABLE students
ADD PRIMARY KEY (id);

4. Primary Key和Unique Key的区别

Primary Key和Unique Key都可以用来确保数据的唯一性，但它们之间存在一些区别：

Primary Key是表的主键，一个表只能有一个主键；而Unique Key是表的候选键，一个表可以有多个Unique Key。
Primary Key不能为NULL，而Unique Key可以为NULL。
Primary Key会自动创建一个索引，而Unique Key并不会自动创建索引。

5. 主键冲突的处理方式

如果在插入数据的时候，违反了主键的唯一性约束，数据库会抛出一个错误，并提示主键冲突。我们可以通过以下几种方式来处理主键冲突：

忽略冲突的行：使用INSERT IGNORE语句来忽略掉冲突的行。
示例代码：

INSERT IGNORE INTO students (id, name, age)
VALUES (1, 'Alice', 20),
       (2, 'Bob', 22),
       (1, 'Charlie', 25); -- 忽略掉id为1的冲突行

更新冲突的行：使用ON DUPLICATE KEY UPDATE语句来更新冲突的行。
示例代码：

INSERT INTO students (id, name, age)
VALUES (1, 'Alice', 20),
       (2, 'Bob', 22),
       (1, 'Charlie', 25)
ON DUPLICATE KEY UPDATE age = VALUES(age); -- 更新id为1的冲突行的age列

6. 主键的注意事项

在设计和使用Primary Key的时候，需要注意以下几点：

不要将业务相关的字段定义为主键：主键应该是一个无意义的、唯一的标识符，而不应该与具体业务相关。如果将业务相关的字段作为主键，在后续的业务变更中可能会受到限制。
尽量选择较短的数据类型：主键列的数据类型对于表的性能会有影响，尽量选择较短的数据类型（如INT、VARCHAR(50)等），可以减少存储空间的占用和索引的大小。
避免频繁更新主键列的值：主键列是用来唯一标识每一行数据的，频繁更新主键列的值可能会导致性能问题。
尽量避免使用自增主键：自增主键（AUTO_INCREMENT）是一种常见的方式，它可以自动为每一行数据生成一个唯一的、递增的值。但是在分布式数据库或者数据库集群的场景下，自增主键可能会引发冲突和性能问题。

7. 总结

本文详细介绍了SQL Primary Key的概念、优点、定义方式、与Unique Key的区别、主键冲突的处理方式以及使用Primary Key的注意事项。Primary Key作为数据库中的一个重要概念和约束，它在确保数据完整性和一致性方面发挥着重要作用。在数据库的设计和应用过程中，我们应该合理选择和使用Primary Key，遵循良好的设计原则。