什么是systemd service
systemd是一个Linux系统初始化的系统和服务管理器,它为系统的引导和服务管理提供了新的解决方案。systemd service是systemd管理下的服务,是一种与传统init.d脚本不同的服务管理方式。
与init.d脚本相比,systemd service具有以下优势:
- 支持并行启动服务,加快系统启动速度;
- 支持前置和后置依赖关系,有利于服务的启动顺序管理;
- 支持动态的服务控制,如启动、停止、重启和重载配置等;
启动服务
对于那些支持 systemd 的软件,安装的时候,会自动在/usr/lib/systemd/system目录添加一个配置文件。
如果你想让该软件开机启动,就执行下面的命令(以nginx.service为例)。
1 | $ sudo systemctl enable nginx |
上面的命令相当于在/etc/systemd/system目录添加一个符号链接,指向/usr/lib/systemd/system里面的nginx.service文件。
这是因为开机时,systemd只执行/etc/systemd/system目录里面的配置文件。这也意味着,如果把修改后的配置文件放在该目录,就可以达到覆盖原始配置的效果。
设置开机启动以后,软件并不会立即启动,必须等到下一次开机。如果想现在就运行该软件,那么要执行systemctl start
命令。
1 | $ sudo systemctl start nginx |
执行上面的命令以后,有可能启动失败,因此要用systemctl status命令查看一下该服务的状态。
1 | $ sudo systemctl status nginx |
上面的输出结果含义如下。
- Loaded行:配置文件的位置,是否设为开机启动
- Active行:表示正在运行
- Main PID行:主进程ID
- Status行:由应用本身(这里是 nginx )提供的软件当前状态
- CGroup块:应用的所有子进程
- 日志块:应用的日志
停止服务
终止正在运行的服务,需要执行systemctl stop命令。
1 | $ sudo systemctl stop nginx.service |
有时候,该命令可能没有响应,服务停不下来。这时候就不得不”杀进程”了,向正在运行的进程发出kill信号。
1 | $ sudo systemctl kill nginx.service |
此外,重启服务要执行systemctl restart命令。
1 | $ sudo systemctl restart nginx.service |
service文件
一个服务怎么启动,完全由它的配置文件决定。下面就来看,配置文件有些什么内容。
第三方软件编写的配置文件主要放在/usr/lib/systemd/system目录,我们自己写的配置文件最好放在/etc/systemd/system目录。
systemctl cat命令可以用来查看配置文件。
1 | $ sudo systemctl cat sshd |
上面我们查看了sshd和nginx的配置文件,可以看到,配置文件主要分为3个区块,每个区块包含若干条键值对。
接下来我们看看这些区块的含义,这里以sshd.service为例。
[Unit]
区块:启动顺序与依赖关系。
[Unit]
部分:指定服务描述、启动顺序、依赖关系,包括 Description、Documentation、After、Before、Wants、Requires
Description字段
给出当前服务的简单描述
Documentation字段
指定服务的文档,可以是一个或多个文档的URL,可选,一般不用配置该项。
After字段
接下来的设置是启动顺序和依赖关系,都比较重要。
After字段表示如果network.target或auditd.service需要启动,那么sshd.service应该在它们之后启动。可以指定多个服务,以空格隔开。
Before字段
相应地,还有一个Before字段,定义sshd.service应该在哪些服务之前启动。可以设置多个,以空格隔开,可选,根据实际需要配置。
注意,After和Before字段只涉及启动顺序,不涉及依赖关系。
举例来说,某 Web 应用需要 postgresql 数据库储存数据。在配置文件中,它只定义要在 postgresql 之后启动,而没有定义依赖 postgresql 。上线后,由于某种原因,postgresql 需要重新启动,在停止服务期间,该 Web 应用就会无法建立数据库连接。
Wants字段和Requires字段
设置依赖关系,需要使用Wants字段和Requires字段。想要添加多个服务,可以多次使用此选项,也可以设置一个空格分隔的服务列表。
Wants字段
比如
Wants=sshd-keygen.service
就表示当前服务与sshd-keygen.service之间存在”弱依赖”关系,即如果”sshd-keygen.service”启动失败或停止运行,不影响sshd.service继续执行。Requires字段则表示”强依赖”关系,比如
Requires=sshd-keygen.service
,即如果sshd-keygen.service启动失败或异常退出,那么当前服务也必须退出。
注意,Wants字段与Requires字段只涉及依赖关系,与启动顺序无关,默认情况下是同时启动的。
[Service]
区块:启动行为
Service区块定义如何启动当前服务。
EnvironmentFile字段
许多软件都有自己的环境参数文件,该文件可以用EnvironmentFile字段读取。 该文件内部的key=value键值对,可以用$key的形式,在当前配置文件中获取。
ExecStart字段
配置文件里面最重要的字段是ExecStart,它定义启动进程时执行的命令。
在ssh.service中,启动sshd执行的命令是/usr/sbin/sshd -D $SSHD_OPTS
,其中的变量$SSHD_OPTS就来自EnvironmentFile字段指定的环境参数文件。
与之作用相似的,还有如下这些字段。
- ExecReload字段:重启服务时执行的命令。还有一个特殊的环境变量 $MAINPID 可用于表示主进程的PID,例如可以这样使用:
/bin/kill -HUP $MAINPID
。强烈建议将ExecReload=
设为一个能够确保重新加载配置文件的操作同步完成的命令行。 - ExecStop字段:停止服务时执行的命令
- ExecStartPre字段:启动服务之前执行的命令
- ExecStartPost字段:启动服务之后执行的命令
- ExecStopPost字段:停止服务之后执行的命令
请看下面的例子。
1 | [Service] |
上面这个配置文件,第二行ExecStart设为空值,等于取消了第一行的设置,运行结果如下。
1 | execstart2 |
所有的启动设置之前,都可以加上一个连词号(-),表示”抑制错误”,即发生错误的时候,不影响其他命令的执行。比如,EnvironmentFile=-/etc/default/ssh(注意等号后面的那个连词号),就表示即使/etc/default/ssh文件不存在,也不会抛出错误。
Type字段
Type字段定义启动类型。它可以设置的值如下。
- simple(默认值):ExecStart字段启动的进程为主进程
- exec:exec与simple类似,不同之处在于,只有在该服务的主服务进程执行完成之后,systemd才会认为该服务启动完成。 其他后继单元必须一直阻塞到这个时间点之后才能继续启动。
- forking:ExecStart字段将以fork()方式启动,此时父进程将会退出,子进程将成为主进程
- oneshot:类似于simple,但只执行一次,只有在该服务的主服务进程退出之后,systemd才会认为该服务启动完成,才会开始启动后继单元。此种类型的服务通常需要设置RemainAfterExit=选项。当Type= 与 ExecStart=都没有设置时,Type=oneshot 就是默认值。
- dbus:类似于simple,但会等待 D-Bus 信号后启动
- notify:类似于simple,启动结束后会发出通知信号,然后 Systemd 再启动其他服务
- idle:类似于simple,但是要等到其他任务都执行完,才会启动该服务。一种使用场合是为让该服务的输出,不与其他服务的输出相混合
建议对长时间持续运行的服务尽可能使用Type=simple(这是最简单和速度最快的选择)。
注意,因为simple类型的服务无法报告启动失败,也无法在服务完成初始化后对其他单元进行排序,所以,当客户端需要通过仅由该服务本身创建的IPC通道(而非由systemd创建的套接字或D-bus之类)连接到该服务的时候,simple类型并不是最佳选择。
在这种情况下, notify或dbus(该服务必须提供D-Bus接口)才是最佳选择, 因为这两种类型都允许服务进程精确的安排何时算是服务启动成功、何时可以继续启动后继单元。
notify类型需要服务进程明确使用sd_notify()函数或类似的API,否则,可以使用forking作为替代(它支持传统的UNIX服务启动协议)。
最后,如果能够确保服务进程调用成功、服务进程自身不做或只做很少的初始化工作(且不大可能初始化失败),那么exec将是最佳选择。注意,因为使用任何 simple 之外的类型都需要等待服务完成初始化,所以可能会减慢系统启动速度。 因此,应该尽可能避免使用 simple 之外的类型(除非必须)。
另外,也不建议对长时间持续运行的服务使用 idle 或 oneshot 类型。
下面是一个oneshot的例子,笔记本电脑启动时,要把触摸板关掉,配置文件可以这样写。
1 | [Unit] |
上面的配置文件,启动类型设为oneshot,就表明这个服务只要运行一次就够了,不需要长期运行。
如果关闭以后,将来某个时候还想打开,配置文件修改如下。
1 | [Unit] |
上面配置文件中,RemainAfterExit字段设为yes,表示进程退出以后,服务仍然保持执行。这样的话,一旦使用systemctl stop命令停止服务,ExecStop指定的命令就会执行,从而重新开启触摸板。
KillMode字段、Restart字段和RestartSec字段
Service区块有一些字段,定义了重启行为。
KillMode字段:定义 Systemd 如何停止 sshd 服务。
在ssh.service定义中,将KillMode设为process,表示只停止主进程,不停止任何sshd 子进程,即子进程打开的 SSH session 仍然保持连接。这个设置不太常见,但对 sshd 很重要,否则你停止服务的时候,会连自己打开的 SSH session 一起杀掉。
KillMode字段可以设置的值如下。
- control-group(默认值):当前控制组里面的所有子进程,都会被杀掉
- process:只杀主进程
- mixed:主进程将收到 SIGTERM 信号,子进程收到 SIGKILL 信号
- none:没有进程会被杀掉,只是执行服务的 stop 命令。
Restart字段:定义了 sshd 退出后,systemd 的重启方式。
在ssh.service定义中,Restart设为on-failure,表示任何意外的失败,都将重启sshd。如果 sshd 正常停止(比如执行systemctl stop命令),它就不会重启。
Restart字段可以设置的值如下。
- no(默认值):退出后不会重启
- on-success:只有正常退出时(退出状态码为0),才会重启
- on-failure:非正常退出时(退出状态码非0),包括被信号终止和超时,才会重启
- on-abnormal:只有被信号终止和超时,才会重启
- on-abort:只有在收到没有捕捉到的信号终止时,才会重启
- on-watchdog:超时退出,才会重启
- always:不管是什么退出原因,总是重启
对于守护进程,推荐设为on-failure。对于那些允许发生错误退出的服务,可以设为on-abnormal。
RestartSec字段
最后是RestartSec字段。
RestartSec字段:表示 Systemd 重启服务之前,需要等待的秒数。
[Install]
区块
Install区块,定义如何安装这个配置文件,即怎样做到开机启动。只有在systemctl的enable与disable命令在启用/停用单元时才会使用此部分。
WantedBy字段
表示该服务所在的 Target。
Target的含义是服务组,表示一组服务。WantedBy=multi-user.target指的是 sshd 所在的 Target 是multi-user.target。
这个设置非常重要,因为执行systemctl enable sshd.service
命令时,sshd.service
的一个符号链接,就会放在/etc/systemd/system
目录下面的multi-user.target.wants
子目录之中。
Systemd 有默认的启动 Target。
1 | $ systemctl get-default |
上面的结果表示,默认的启动 Target 是multi-user.target。在这个组里的所有服务,都将开机启动。这就是为什么systemctl enable命令能设置开机启动的原因。
使用 Target 的时候,systemctl list-dependencies
命令和systemctl isolate
命令也很有用。
1 | # 查看 multi-user.target 包含的所有服务 |
一般来说,常用的 Target 有两个:一个是multi-user.target,表示多用户命令行状态;另一个是graphical.target,表示图形用户状态,它依赖于multi-user.target。官方文档有一张非常清晰的 Target 依赖关系图。
修改配置文件后重启
修改配置文件以后,需要重新加载配置文件,然后重新启动相关服务。
1 | # 重新加载配置文件 |
Target 的配置文件
Target 也有自己的配置文件。
1 | $ systemctl cat multi-user.target |
注意,Target 配置文件里面没有启动命令。
上面输出结果中,主要字段含义如下。
- Requires字段:要求basic.target一起运行。
- Conflicts字段:冲突字段。如果rescue.service或rescue.target正在运行,multi-user.target就不能运行,反之亦然。
- After:表示multi-user.target在basic.target 、 rescue.service、 rescue.target之后启动,如果它们有启动的话。
- AllowIsolate:允许使用systemctl isolate命令切换到multi-user.target。