16.3. 启动数据库服务器

在任何人可以访问数据库前,你必须启动数据库服务器。 数据库服务器叫 postmasterpostmaster 必须知道到哪里能找到她要用的数据。这是利用 -D 选项来实现的。 因此,启动服务器的最简单的方法是,比如象下面这样:

$ postmaster -D /usr/local/pgsql/data

这样将把服务器放在前台运行。这个步骤同样必须以PostgreSQL 用户帐户登录来做。没有 -D 选项,服务器将使用环境变量 PGDATA 命名的目录; 如果这个环境变量也没有,服务器将失败。

通常,最好在后台启动 postmaster, 使用下面的 shell 语法:

$ postmaster -D /usr/local/pgsql/data > logfile 2>&1 &

把服务器的stdoutstderr放到某个地方是非常重要的,就象在上面建议的这样。 这样做既可以帮助审计又可以帮助诊断问题。 (参阅 Section 22.3 获取有关日志文件处理的更完整的讨论。)

postmaster 还接受一些其他的一些命令行选项。 更多的信息请参考手册页 postmaster 和下面的 Chapter 17

这些 shell 语法很容易让人觉得无聊。因此我们提供了封装程序 pg_ctl 以简化一些任务。比如,

pg_ctl start -l logfile

将在后台启动服务器并且把输出放到指定的日志文件中。 -D 选项和你直接运行postmaster时的意思是一样的。 pg_ctl 还可以用于关闭服务器。

通常,你会希望在计算机启动的时候启动数据库服务器。 自动启动脚本是与操作系统相关的。 PostgreSQL 自己带了几个, 放在 contrib/start-scripts 目录里。 要想安装其中一个,会需要 root 权限。

不同的系统在引导的时候有不同的启动守护进程的方法,所以我们建议你先熟悉它们。 许多系统有名字称为 /etc/rc.local/etc/rc.d/rc.local 这样的文件, 其它的还有 rc.d 目录。 不管你怎么干,都要记住服务器必须以 PostgreSQL 用户帐户而不是以 root或者其他任何用户的身份运行。 这样,你可能总是要用下面这行的样子构造你的命令: su -c '...' postgres。比如:

su -c 'pg_ctl -D /usr/local/pgsql/data -l serverlog' postgres

下面是一些比较详细的与操作系统相关的建议。(每个例子里我们使用具体数值的时候,都请注意把这些替换成合适的安装路径和用户名。)

postmaster 运行的时候,它的PID是保存在数据目录里的文件 postmaster.pid 里的。这样做是为了避免多个postmaster在同一个数据目录内运行,此文件同样可以用于关闭postmaster

16.3.1. 服务器启动失败

有几个非常常见的原因会导致 postmaster 启动失败。 通过检查 postmaster 日志或者使用手工启动的方法(不做 stdoutstderr 的重定向), 就可以看到错误信息。下面我们更详细地解释了其中一些错误信息。

LOG:  could not bind IPv4 socket: Address already in use
HINT:  Is another postmaster already running on port 5432? If not, wait a few seconds and retry.
FATAL:  could not create TCP/IP listen socket

就象它提示的那样:你试图在已经有一个 postmaster 运行着的端口上再运行了一个 postmaster。不过,如果内核的错误信息不是 Address already in use 或者是其它的变种,那就有可能是别的毛病。 比如,试图在一个保留的端口上运行postmaster会收到下面这样的信息:

$ postmaster -p 666
LOG:  could not bind IPv4 socket: Permission denied
HINT:  Is another postmaster already running on port 666? If not, wait a few seconds and retry.
FATAL:  could not create TCP/IP listen socket

象这样的信息

FATAL:  could not create shared memory segment: Invalid argument
DETAIL:  Failed system call was shmget(key=5440001, size=4011376640, 03600).

可能意味着你的内核对共享内存区的限制小于PostgreSQL 试图分配的缓冲区大小(本例中是 4011376640 字节)。 或者可能意味着你根本就没有配置System-V风格的共享内存支持。 作为一个临时的解决办法,你可以试着以小于正常数量的缓冲区数(shared_buffers)启动服务器。 你最终还是会希望重新配置你的内核,以增加共享内存的尺寸。如果你试图在同一台机器上启动多个服务器, 而且她们所需的总空间超过了内核的限制,也会报这个错。

象下面这样的错误

FATAL:  could not create semaphores: No space left on device
DETAIL:  Failed system call was semget(5440126, 17, 03600).

意味着着你已经用光磁盘空间了。 它的意思是你的内核的System V信号灯的限制小于 PostgreSQL 想创建的数量。和上面一样,你可以通过减少允许的连接数(max_connections)来绕开, 但最终你还是会希望增加内核的限制。

如果你收到一个 "illegal system call" 错误,那么很有可能是你的内核根本不支持共享内存或者信号灯。 如果是这样的话,你的唯一选择就是重新配置你的内核并且把这些特性打开。

关于配置系统System V IPC资源的细节见 Section 16.4.1

16.3.2. 客户端联接问题

尽管可能在客户端出现的错误条件范围宽广,而且还和应用相关,但的确有几种错误与服务器的启动方式直接相关。 除了下面提到的几种错误以外的问题都应该在相应的客户端应用的文档中。

psql: could not connect to server: Connection refused
        Is the server running on host "server.joe.com" and accepting
        TCP/IP connections on port 5432?

这是纯粹的 "我找不到可以交谈的服务器"错误。 当试图进行 TCP/IP 通讯时它看起来象上面的样子。 常见的错误是忘记把服务器配置成允许 TCP/IP 联接。

另外,当试图通过一个 Unix 套接字与本机服务器通讯时,你会看到这个:

psql: could not connect to server: No such file or directory
        Is the server running locally and accepting
        connections on Unix domain socket "/tmp/.s.PGSQL.5432"?

最后一行可以有效地验证客户端进行联接尝试时是否连对了位置。 如果实际上没有服务器在那里运行,典型的内核错误是象上面显示的那样或者是 Connection refused 或者是 No such file or directory。 (尤其要注意的是这种环境下 Connection refused 的信息显示并意味着服务器收到你的联接然后拒绝了联接。 那样的话会产生一个不同的信息,象 Section 20.3 里面显示的那样) 其它象 Connection timed out 这样的信息表示更基本的问题,比如缺少网络联接等。