CREATE AGGREGATE

Name

CREATE AGGREGATE -- 定义一个新的聚集函数

Synopsis

CREATE AGGREGATE name (
    BASETYPE = input_data_type,
    SFUNC = sfunc,
    STYPE = state_data_type
    [ , FINALFUNC = ffunc ]
    [ , INITCOND = initial_condition ]
    [ , SORTOP = sort_operator ]
)

描述

CREATE AGGREGATE定义一个新的聚集函数。 一些常用的聚集函数已经包含在基础软件包里了;在 Section 9.15 里有文档记录。 如果你需要定义一个新类型或需要一个还没有提供的聚集函数,这时便可用 CREATE AGGREGATE 来提供我们所需要的特性。

如果给出了一个模式的名字(比如,CREATE AGGREGATE myschema.myagg ...),那么该聚集函数是在指定模式中创建的。 否则它是在当前模式中创建的。

一个聚集函数是用它的名字和输入数据类型来标识的。 同一模式中如果两个聚集处理的输入数据不同,它们可以有相同的名字。 一个聚集函数的输入数据类型必须和所有同一模式中的普通函数的名字和输入类型不同。

一个聚集函数是用一个或两个普通函数做成的: 一个状态转换函数 sfunc, 和一个可选的终计算函数 ffunc. 它们是这样使用的:

sfunc( internal-state, next-data-item ) ---> next-internal-state
ffunc( internal-state ) ---> aggregate-value

PostgreSQL 创建一个类型为 stype的临时变量。 它保存这个聚集的当前内部状态。 对于每个输入数据条目, 都调用状态转换函数计算内部状态值的新数值。 在处理完所有数据后,调用一次最终处理函数以计算聚集的返回值。 如果没有最终处理函数,那么将最后的状态值当做返回值。

一个聚集函数还可能提供一个初始条件,也就是说,所用的该内部状态值的初始值。 这个值是作为一个类型为 text 的字段存储在数据库里的, 不过它们必须是状态值数据类型的合法的外部表现形式的常量。 如果没有提供状态,那么状态值初始化为 NULL。

如果该状态转换函数被定义为 "strict", 那么就不能用 NULL 输入调用它。这个时候,带有这样的转换函数的聚集执行起来的现象如下所述。 NULL 输入的值被忽略(不调用此函数并且保留前一个状态值)。如果初始状态值是 NULL,那么由第一个非 NULL 值替换该状态值, 而状态转换函数从第二个非 NULL 的输入值开始调用。这样做让我们比较容易实现象 max 这样的聚集。 请注意这种行为只是当 state_typeinput_data_type 相同的时候才表现出来。 如果这些类型不同,你必须提供一个非 NULL 的初始条件或者使用一个非strice的状态转换函数。

如果状态转换函数不是 strict(严格)的, 那么它将无条件地为每个输入值调用, 并且必须自行处理 NULL 输入和 NULL 转换值, 这样就允许聚集的作者对聚集中的空值有完全的控制。

如果终转换函数定义为"strict",则如果最终状态值是 NULL 时就不会调用它; 而是自动输出一个NULL的结果。(当然,这才是 strict 函数的正常特征。) 不管是那种情况,终处理函数可以选择返回 NULL。比如, avg 的终处理函数在零输入记录时就会返回 NULL。

行为类似 MIN 或者 MAX 的聚集有时候可以优化为使用索引, 而不用扫描每个输入行。如果这个聚集可以如此优化,则用一个排序操作符标识它。 这里基本的要求是聚集必须以操作符归纳出来的排序顺序生成第一个元素;换句话说

SELECT agg(col) FROM tab;

必须等于

SELECT col FROM tab ORDER BY col USING sortop LIMIT 1;

更多的假设是聚集忽略空值输入,并且只有在输入没有非空的数值的时候,它才生成空值结果。 通常,数据类型的 < 操作符是 MIN 的适用排序操作符, 而 >MAX 的适用操作符。请注意, 除非声明的操作符是 btree 索引操作符表(opclass)的"小于"或者"大于"策略号, 否则这种优化将不会生效。

参数

name

要创建的聚集函数名(可以有模式修饰的)。

input_data_type

本聚集函数要处理的基本数据类型。 对于不检查输入类型的聚集来说,这个参数可以声明为"ANY"。 (比如 count(*))。

sfunc

用于处理源数据列里的每一个输入数据的状态转换函数名称。 它通常是一个双参数的函数,第一个参数的类型是 state_data_type 而第二个参数的类型是 input_data_type. 另外,对于一个不检查输入数据的聚集,该函数只接受一个类型为 state_data_type 的参数。 不管是哪种情况,此函数必须返回一个类型为 state_data_type的值。 这个函数接受当前状态值和当前输入数据条目,而返回下个状态值。

state_data_type

聚集的状态值的数据类型。

ffunc

在转换完所有输入域/字段后调用的最终处理函数。它计算聚集的结果。 此函数必须接受一个类型为 state_data_type 的参数。 聚集的输出数据类型被定义为此函数的返回类型。 如果没有声明 ffunc 则使用聚集结果的状态值作为聚集的结果,而输出类型为 state_data_type

initial_condition

状态值的初始设置(值)。它必须是一个数据类型 state_data_type 可以接受的文本常量值。 如果没有声明,状态值初始为 NULL。

sort_operator

用于 MIN 或者 MAX 类型的聚集的相关的排序操作符。 这个只是一个操作符名(可以有模式修饰)。 这个操作符假设接受和聚集一样的输入数据类型。

CREATE AGGREGATE 的参数可以以任何顺序书写,而不只是上面显示的顺序。

注意

使用 DROP AGGREGATE 删除聚集函数。

例子

参阅 Section 32.10

兼容性

CREATE AGGREGATEPostgreSQL 语言的扩展。 在 SQL92 里没有 CREATE AGGREGATE

又见

ALTER AGGREGATE, DROP AGGREGATE