SQL 如何更快地执行 SQL ‘NOT IN’ 查询

在本文中，我们将介绍如何更高效地执行 SQL 中的 ‘NOT IN’ 查询。’NOT IN’ 查询是 SQL 语言中常用的一种查询方式，它用于从一个表中筛选出不包含在另一个表或子查询结果中的数据。然而，在处理大量数据时，’NOT IN’ 查询可能会引发性能问题。下面将介绍几种方法来提高 ‘NOT IN’ 查询的执行速度。

阅读更多：SQL 教程

1. 使用 ‘NOT EXISTS’ 进行查询

在 SQL 中，使用 ‘NOT IN’ 查询时，数据库引擎需要对被查询表（子查询中的表）进行全表扫描，然后逐行比较。这种全表扫描的操作会导致查询时间较长。相比之下，使用 ‘NOT EXISTS’ 子查询可以避免进行全表扫描，从而提高查询性能。

以下是一个使用 ‘NOT IN’ 查询和 ‘NOT EXISTS’ 查询的示例：

-- 使用 'NOT IN' 查询
SELECT *
FROM table1
WHERE column1 NOT IN (SELECT column1 FROM table2);

-- 使用 'NOT EXISTS' 查询
SELECT *
FROM table1 t1
WHERE NOT EXISTS (SELECT 1 FROM table2 t2 WHERE t1.column1 = t2.column1);

由于 ‘NOT EXISTS’ 查询只需要确定结果是否为空，而不需要对所有行进行比较，因此效率更高。推荐在性能要求较高的场景下使用 ‘NOT EXISTS’ 进行查询。

2. 使用 ‘LEFT JOIN’ 进行查询

另一种提高 ‘NOT IN’ 查询性能的方法是使用 ‘LEFT JOIN’。通过对两个表进行连接，并筛选出无匹配的行，可以达到相同的效果。这种方法通常比 ‘NOT IN’ 查询更高效。

以下是一个使用 ‘LEFT JOIN’ 查询的示例：

SELECT t1.*
FROM table1 t1
LEFT JOIN table2 t2 ON t1.column1 = t2.column1
WHERE t2.column1 IS NULL;

通过将两个表进行连接，并筛选出没有匹配结果的行（即右表中位 NULL 的行），可以得到与 ‘NOT IN’ 查询相同的结果，但是查询速度更快。

3. 使用临时表或表变量

当 ‘NOT IN’ 查询针对的是一个非常大的表时，有时在执行查询之前先将被查询的表的数据存储在一个临时表或表变量中，可以提高查询的效率。这是因为将数据存储在临时表或表变量中可以减少查询的次数，避免重复的数据读取操作。

以下是一个使用临时表的示例：

-- 创建临时表
CREATE TABLE #temp (column1 datatype, ...);

-- 将数据存储到临时表中
INSERT INTO #temp (column1, ...)
SELECT column1, ...
FROM table2;

-- 使用临时表进行查询
SELECT *
FROM table1
WHERE column1 NOT IN (SELECT column1 FROM #temp);

-- 删除临时表
DROP TABLE #temp;

通过将被查询表的数据存储在临时表中，可以大大减少查询时间。