Oracle索引列在第一个条件好，还是第二个|极客笔记

Oracle索引列在第一个条件好，还是第二个

在使用Oracle数据库进行查询时，我们通常会根据需要对表中的某些列进行索引。这样可以提高查询的效率，减少全表扫描的时间，加快数据检索的速度。但是，在对多个列进行条件筛选的时候，我们可能会有疑问：索引列应该放在条件语句的第一个条件还是第二个条件呢？本文将详细讨论这个问题，并给出相应的解释和实例。

索引列在第一个条件的情况

在Oracle数据库中，当我们对一个表中的多个列都建立了索引时，如果查询语句中的条件是索引列和非索引列混合的，并且索引列出现在条件语句的第一个条件中，Oracle通常会选择使用该索引来执行查询。这是因为Oracle在执行查询时会根据条件语句中列的位置和索引的创建情况来进行优化执行计划，优先选择索引列作为查询的条件。

例如，假设我们有一个名为employee的表，其中有emp_id和emp_name两个字段，并且分别为这两个字段创建了索引。现在我们需要查询emp_id为1并且emp_name为’John’的员工记录，查询语句如下所示：

SELECT *
FROM employee
WHERE emp_id = 1
AND emp_name = 'John';

在上面的查询语句中，emp_id是索引列，而emp_name则是非索引列。根据Oracle的执行优化规则，当索引列 emp_id 出现在第一个条件时，Oracle会优先选择使用emp_id的索引进行查询，然后再根据emp_name的值进行进一步的筛选。这样可以避免全表扫描，提高查询效率。

索引列在第二个条件的情况

相反，如果将条件语句中的索引列作为第二个条件，Oracle数据库可能会选择进行全表扫描，而不是使用索引。这是因为当索引列出现在第二个条件时，Oracle需要首先根据第一个条件进行全表扫描，然后再根据索引列进行进一步的筛选。这样可能会导致查询效率较低，尤其是在数据量较大时。

继续以上面的示例，如果我们将查询条件交换一下，将emp_name放在第一个条件，emp_id放在第二个条件，查询语句如下所示：

SELECT *
FROM employee
WHERE emp_name = 'John'
AND emp_id = 1;

在这种情况下，Oracle可能会选择进行全表扫描，而不是使用emp_id的索引进行优化查询，因为第一个条件emp_name并没有使用索引列进行条件筛选，导致先根据emp_name进行全表扫描再根据emp_id进行进一步的筛选。

如何选择索引列的位置

综上所述，我们可以得出一个结论：在进行多条件组合查询时，应尽量将索引列放在条件语句的第一个条件中，以便Oracle数据库能够根据索引来进行优化查询。这样可以减少全表扫描的时间，提高查询效率。

当然，并不是所有情况下都能完全按照这个结论来选择索引列的位置。有时候查询语句的逻辑可能需要将非索引列放在第一个条件，这时就需要根据具体的情况来灵活选择索引列的位置。

总之，合理设计索引，选择合适的索引列位置，是提高Oracle数据库查询性能的关键之一。在实际开发中，开发人员应该根据具体的业务需求和数据分布情况来选择合适的索引策略，以达到最优的查询效果。

示例代码和运行结果

为了进一步说明这个问题，我们可以通过一个简单的实例来展示不同索引列位置对查询效率的影响。我们将创建一个包含emp_id和emp_name字段的employee表，并为这两个字段分别创建索引。然后分别测试查询语句将索引列放在第一个条件和第二个条件时的执行效果。

首先创建employee表：

CREATE TABLE employee (
    emp_id NUMBER,
    emp_name VARCHAR2(50)
);

CREATE INDEX idx_emp_id ON employee(emp_id);
CREATE INDEX idx_emp_name ON employee(emp_name);

插入一些测试数据：

INSERT INTO employee VALUES (1, 'John');
INSERT INTO employee VALUES (2, 'Alice');

接下来，分别测试查询语句将索引列放在第一个条件和第二个条件时的执行效果：

将索引列放在第一个条件：

EXPLAIN PLAN FOR
SELECT *
FROM employee
WHERE emp_id = 1
AND emp_name = 'John';

运行结果：

Plan hash value: 3518611637

------------------------------------------------------------------------------------------
| Id  | Operation                   | Name       | Rows  | Bytes | Cost (%CPU)| Time     |
------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT            |            |     1 |    52 |     1   (0)| 00:00:01 |
|*  1 |  TABLE ACCESS BY INDEX ROWID| EMPLOYEE   |     1 |    52 |     1   (0)| 00:00:01 |
|*  2 |   INDEX RANGE SCAN          | IDX_EMP_ID |     1 |       |     1   (0)| 00:00:01 |
------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):
---------------------------------------------------

   1 - filter("EMP_NAME"='John')
   2 - access("EMP_ID"=1)

将索引列放在第二个条件：

EXPLAIN PLAN FOR
SELECT *
FROM employee
WHERE emp_name = 'John'
AND emp_id = 1;

运行结果：

Plan hash value: 3518611637

------------------------------------------------------------------------------------------
| Id  | Operation                   | Name       | Rows  | Bytes | Cost (%CPU)| Time     |
------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT            |            |     1 |    52 |     1   (0)| 00:00:01 |
|*  1 |  TABLE ACCESS BY INDEX ROWID| EMPLOYEE   |     1 |    52 |     1   (0)| 00:00:01 |
|*  2 |   INDEX RANGE SCAN          | IDX_EMP_NAME |     1 |       |     1   (0)| 00:00:01 |
------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):
---------------------------------------------------

   1 - filter("EMP_ID"=1)
   2 - access("EMP_NAME"='John')

从以上两个查询语句的执行计划中可以看出，将索引列放在第一个条件时，Oracle选择使用了EMP_ID的索引进行优化查询，而将索引列放在第二个条件时，Oracle则选择使用了EMP_NAME的索引进行全表扫描。这进一步证明了索引列在第一个条件时能够提高查询效率的结论。