本文共 655 字,大约阅读时间需要 2 分钟。
我们写一个查询语句,语句中会有投影和约束条件,这些都需要在执行器中进行计算之后才能获得它们的值,这些就是我们所说的表达式,比如:
SELECT a, b+c FROM TEST_A WHERE d > 0;
这样的一个语句中我们说有 3 个表达式:
* 对 a 进行求值的表达式* 对 b+c 进行求值的表达式* 对 d > 0 进行求值的表达式
执行器通过 Seq Scan on test_a 表来获得一条元组之后,由于我们已经记录了 a、b、c、d 这些列的编号(也就是它们是表的第几列),因而可以从获得的元组中把 a、b、c、d 对应的值取出来,然后用这些值进行计划,这就是表达式计算的过程。
也就是说每次从 TEST_A 表中取到一条元组,都需要执行一次表达式,它需要先计算 d > 0,如果该元组的确满足 d > 0 的约束条件,然后就需要计算投影,从元组中取出 a 的值作为投影,从元组中取出b、c的值开始计算 b+c 的值来作为投影,如果 TEST_A 表中有 10000 条元组,那么像 d>0 这样的表达式就需要执行 10000 次,而投影中的表达式执行的次数取决于 d>0 这个约束条件的选择率。
在约束条件中,优化器尝试将约束条件进行规范化,主要包括 3 个功能:
转载地址:http://zoyni.baihongyu.com/