5.3. 字符类型

Table 5-4. 字符类型

类型名描述
character(n), char(n)定长,不足补空白
character varying(n), varchar(n)变长,有长度限制
text变长,无长度限制

Table 5-4 显示了 在 PostgreSQL 里可用的一般用途的 字符类型。

SQL 定义了两种基本的字符类型∶ character(n)character varying(n), 这里的 n 是一个正整数.两种类型都可以存储 最多 n 个字符长的字串. 试图存储更长的字串到这些类型的字段里会产生一个错误, 除非超出长度的字符都是空白,这种情况下该字串将被截断为最大 长度.(这个看上去有点怪异的例外是SQL标准要求的.) 如果要存储的字串比声明的长度短, 类型为 character 的数值将会用空白填满; 而类型为 character varying 的数值将只是 存储短些的字串.

注意: 如果我们明确地把一个数值转换成 character(n) 或者 character varying(n),那么超长的数值 将被截断成 n 个字符,而不会抛出错误。(这也是SQL标准的要求。)

注意: PostgreSQL7.2 以前,太长的字串总会被不声不响地咔喳掉, 而且不会生成错误。不管是明确的还是隐含的转换情况下。

char(n)varchar(n) 的概念分别是 character(n)character varying(n) 的别名, 没有长度声明词的character 等于 character(1);如果不带长度说明词使用 character varying,那么该类型接受任何长度的字串. 后者是PostgreSQL的扩展.

另外,PostgreSQL 支持更通用的 text 类型,它可以存储任何长度的字串. 和 character varying 不同的是,text 不需要明确地声明字串尺寸的上限.尽管类型 text 不是SQL标准,但是许多其它 RDBMS 包也有它.

请参考 Section 1.1.2.1 获取关于字串文本 的语法的信息,以及参阅 Chapter 6 获取关于 可用操作符和函数的信息.

这些类型的存储需求是 4 字节加上实际的字串,如果是 character 的话再加上填充的字节.长的字串将会自动被系统压缩,因此在磁盘上的 物理需求可能会更少些。长的数值也会存储在后台表里面,这样它们就不会 干扰对短字段值的快速访问。 不管怎样,允许存储的最长字串大概是 1 GB. (允许在数据类型声明中出现的的 n 的最大值比这还小. 修改这个行为没有甚么意义,因为在多字节编码下字符和字节的数目可能差别 很大.如果你想存储没有特定上限的长字串,那么使用 text 或者没有长度声明词的 character varying, 而不要选择一个任意长度限制.)

提示: 这三种类型之间没有性能差别,只不过是在使用填充空白的类型的时候 增加了存储尺寸.

Example 5-1. 使用字符类型

CREATE TABLE test1 (a character(4));
INSERT INTO test1 VALUES ('ok');
SELECT a, char_length(a) FROM test1; -- (1)
  a   | char_length
------+-------------
 ok   |           4

CREATE TABLE test2 (b varchar(5));
INSERT INTO test2 VALUES ('ok');
INSERT INTO test2 VALUES ('good      ');
INSERT INTO test2 VALUES ('too long');
ERROR:  value too long f或者 type character varying(5)
INSERT INTO test2 VALUES ('too long'::varchar(5)); -- 明确截断
SELECT b, char_length(b) FROM test2;
   b   | char_length
-------+-------------
 ok    |           2
 good  |           5
 too l |           5
(1)
函数 char_lengthSection 6.4中讨论.

PostgreSQL 里 另外还有两种定长字符类型. 在 Table 5-5 里显示。 name类型用于内部表名字 并且不是给一般用户使用的. 该类型长度当前定为 64 字节 (63 可用字符加结束符) 但应该使用常量 NAMEDATALEN 引用.这个长度是在编译的时候设置的, (因而可以为特殊用途调整); 缺省的最大长度在以后的版本可能会改变. 类型 "char" (注意引号)和 char(1) 是不一样的,它只用了一个字节的存储空间.它在系统内部用于系统表 当做穷人的枚举类型用.

Table 5-5. 特殊字符类型

字符类型存储空间描述
"char"1 字节单字节内部类型
name64 字节六十四字符内部类型