linux中systemd及其service文件

  |  

什么是systemd service

systemd是一个Linux系统初始化的系统和服务管理器,它为系统的引导和服务管理提供了新的解决方案。systemd service是systemd管理下的服务,是一种与传统init.d脚本不同的服务管理方式。

与init.d脚本相比,systemd service具有以下优势:

  1. 支持并行启动服务,加快系统启动速度;
  2. 支持前置和后置依赖关系,有利于服务的启动顺序管理;
  3. 支持动态的服务控制,如启动、停止、重启和重载配置等;

启动服务

对于那些支持 systemd 的软件,安装的时候,会自动在/usr/lib/systemd/system目录添加一个配置文件。

如果你想让该软件开机启动,就执行下面的命令(以nginx.service为例)。

1
$ sudo systemctl enable nginx

上面的命令相当于在/etc/systemd/system目录添加一个符号链接,指向/usr/lib/systemd/system里面的nginx.service文件。

这是因为开机时,systemd只执行/etc/systemd/system目录里面的配置文件。这也意味着,如果把修改后的配置文件放在该目录,就可以达到覆盖原始配置的效果。

设置开机启动以后,软件并不会立即启动,必须等到下一次开机。如果想现在就运行该软件,那么要执行systemctl start命令。

1
$ sudo systemctl start nginx

执行上面的命令以后,有可能启动失败,因此要用systemctl status命令查看一下该服务的状态。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
$ sudo systemctl status nginx
● nginx.service - A high performance web server and a reverse proxy server
Loaded: loaded (/lib/systemd/system/nginx.service; enabled; vendor preset: enabled)
Active: active (running) since Fri 2023-08-18 15:33:59 UTC; 44s ago
Docs: man:nginx(8)
Main PID: 27882 (nginx)
Tasks: 9 (limit: 4915)
CGroup: /system.slice/nginx.service
├─27882 nginx: master process /usr/sbin/nginx -g daemon on; master_process on;
├─27885 nginx: worker process
├─27887 nginx: worker process
├─27889 nginx: worker process
├─27890 nginx: worker process
├─27892 nginx: worker process
├─27893 nginx: worker process
├─27894 nginx: worker process
└─27895 nginx: worker process

Aug 18 15:33:59 ubuntu systemd[1]: Starting A high performance web server and a reverse proxy server...
Aug 18 15:33:59 ubuntu systemd[1]: Started A high performance web server and a reverse proxy server.

上面的输出结果含义如下。

  • Loaded行:配置文件的位置,是否设为开机启动
  • Active行:表示正在运行
  • Main PID行:主进程ID
  • Status行:由应用本身(这里是 nginx )提供的软件当前状态
  • CGroup块:应用的所有子进程
  • 日志块:应用的日志

停止服务

终止正在运行的服务,需要执行systemctl stop命令。

1
$ sudo systemctl stop nginx.service

有时候,该命令可能没有响应,服务停不下来。这时候就不得不”杀进程”了,向正在运行的进程发出kill信号。

1
$ sudo systemctl kill nginx.service

此外,重启服务要执行systemctl restart命令。

1
$ sudo systemctl restart nginx.service

service文件

一个服务怎么启动,完全由它的配置文件决定。下面就来看,配置文件有些什么内容。

第三方软件编写的配置文件主要放在/usr/lib/systemd/system目录,我们自己写的配置文件最好放在/etc/systemd/system目录。

systemctl cat命令可以用来查看配置文件。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
$ sudo systemctl cat sshd
# /lib/systemd/system/ssh.service
[Unit]
Description=OpenBSD Secure Shell server
After=network.target auditd.service
ConditionPathExists=!/etc/ssh/sshd_not_to_be_run

[Service]
EnvironmentFile=-/etc/default/ssh
ExecStartPre=/usr/sbin/sshd -t
ExecStart=/usr/sbin/sshd -D $SSHD_OPTS
ExecReload=/usr/sbin/sshd -t
ExecReload=/bin/kill -HUP $MAINPID
KillMode=process
Restart=on-failure
RestartPreventExitStatus=255
Type=notify
RuntimeDirectory=sshd
RuntimeDirectoryMode=0755

[Install]
WantedBy=multi-user.target
Alias=sshd.service

$ sudo systemctl cat nginx
# /lib/systemd/system/nginx.service
# Stop dance for nginx
# =======================
#
# ExecStop sends SIGSTOP (graceful stop) to the nginx process.
# If, after 5s (--retry QUIT/5) nginx is still running, systemd takes control
# and sends SIGTERM (fast shutdown) to the main process.
# After another 5s (TimeoutStopSec=5), and if nginx is alive, systemd sends
# SIGKILL to all the remaining processes in the process group (KillMode=mixed).
#
# nginx signals reference doc:
# http://nginx.org/en/docs/control.html
#
[Unit]
Description=A high performance web server and a reverse proxy server
Documentation=man:nginx(8)
After=network.target

[Service]
Type=forking
PIDFile=/run/nginx.pid
ExecStartPre=/usr/sbin/nginx -t -q -g 'daemon on; master_process on;'
ExecStart=/usr/sbin/nginx -g 'daemon on; master_process on;'
ExecReload=/usr/sbin/nginx -g 'daemon on; master_process on;' -s reload
ExecStop=-/sbin/start-stop-daemon --quiet --stop --retry QUIT/5 --pidfile /run/nginx.pid
TimeoutStopSec=5
KillMode=mixed

[Install]
WantedBy=multi-user.target

上面我们查看了sshd和nginx的配置文件,可以看到,配置文件主要分为3个区块,每个区块包含若干条键值对。

接下来我们看看这些区块的含义,这里以sshd.service为例。

[Unit] 区块:启动顺序与依赖关系。

[Unit]部分:指定服务描述、启动顺序、依赖关系,包括 Description、Documentation、After、Before、Wants、Requires

Description字段

给出当前服务的简单描述

Documentation字段

指定服务的文档,可以是一个或多个文档的URL,可选,一般不用配置该项。

After字段

接下来的设置是启动顺序和依赖关系,都比较重要。

After字段表示如果network.target或auditd.service需要启动,那么sshd.service应该在它们之后启动。可以指定多个服务,以空格隔开。

Before字段

相应地,还有一个Before字段,定义sshd.service应该在哪些服务之前启动。可以设置多个,以空格隔开,可选,根据实际需要配置。

注意,After和Before字段只涉及启动顺序,不涉及依赖关系。

举例来说,某 Web 应用需要 postgresql 数据库储存数据。在配置文件中,它只定义要在 postgresql 之后启动,而没有定义依赖 postgresql 。上线后,由于某种原因,postgresql 需要重新启动,在停止服务期间,该 Web 应用就会无法建立数据库连接。

Wants字段和Requires字段

设置依赖关系,需要使用Wants字段和Requires字段。想要添加多个服务,可以多次使用此选项,也可以设置一个空格分隔的服务列表。

  1. Wants字段

    比如 Wants=sshd-keygen.service 就表示当前服务与sshd-keygen.service之间存在”弱依赖”关系,即如果”sshd-keygen.service”启动失败或停止运行,不影响sshd.service继续执行。

  2. Requires字段则表示”强依赖”关系,比如 Requires=sshd-keygen.service ,即如果sshd-keygen.service启动失败或异常退出,那么当前服务也必须退出。

注意,Wants字段与Requires字段只涉及依赖关系,与启动顺序无关,默认情况下是同时启动的。

[Service] 区块:启动行为

Service区块定义如何启动当前服务。

EnvironmentFile字段

许多软件都有自己的环境参数文件,该文件可以用EnvironmentFile字段读取。 该文件内部的key=value键值对,可以用$key的形式,在当前配置文件中获取。

ExecStart字段

配置文件里面最重要的字段是ExecStart,它定义启动进程时执行的命令。

在ssh.service中,启动sshd执行的命令是/usr/sbin/sshd -D $SSHD_OPTS,其中的变量$SSHD_OPTS就来自EnvironmentFile字段指定的环境参数文件。

与之作用相似的,还有如下这些字段。

  1. ExecReload字段:重启服务时执行的命令。还有一个特殊的环境变量 $MAINPID 可用于表示主进程的PID,例如可以这样使用:/bin/kill -HUP $MAINPID。强烈建议将 ExecReload= 设为一个能够确保重新加载配置文件的操作同步完成的命令行。
  2. ExecStop字段:停止服务时执行的命令
  3. ExecStartPre字段:启动服务之前执行的命令
  4. ExecStartPost字段:启动服务之后执行的命令
  5. ExecStopPost字段:停止服务之后执行的命令

请看下面的例子。

1
2
3
4
5
6
[Service]
ExecStart=/bin/echo execstart1
ExecStart=
ExecStart=/bin/echo execstart2
ExecStartPost=/bin/echo post1
ExecStartPost=/bin/echo post2

上面这个配置文件,第二行ExecStart设为空值,等于取消了第一行的设置,运行结果如下。

1
2
3
execstart2
post1
post2

所有的启动设置之前,都可以加上一个连词号(-),表示”抑制错误”,即发生错误的时候,不影响其他命令的执行。比如,EnvironmentFile=-/etc/default/ssh(注意等号后面的那个连词号),就表示即使/etc/default/ssh文件不存在,也不会抛出错误。

Type字段

Type字段定义启动类型。它可以设置的值如下。

  • simple(默认值):ExecStart字段启动的进程为主进程
  • exec:exec与simple类似,不同之处在于,只有在该服务的主服务进程执行完成之后,systemd才会认为该服务启动完成。 其他后继单元必须一直阻塞到这个时间点之后才能继续启动。
  • forking:ExecStart字段将以fork()方式启动,此时父进程将会退出,子进程将成为主进程
  • oneshot:类似于simple,但只执行一次,只有在该服务的主服务进程退出之后,systemd才会认为该服务启动完成,才会开始启动后继单元。此种类型的服务通常需要设置RemainAfterExit=选项。当Type= 与 ExecStart=都没有设置时,Type=oneshot 就是默认值。
  • dbus:类似于simple,但会等待 D-Bus 信号后启动
  • notify:类似于simple,启动结束后会发出通知信号,然后 Systemd 再启动其他服务
  • idle:类似于simple,但是要等到其他任务都执行完,才会启动该服务。一种使用场合是为让该服务的输出,不与其他服务的输出相混合

建议对长时间持续运行的服务尽可能使用Type=simple(这是最简单和速度最快的选择)。

注意,因为simple类型的服务无法报告启动失败,也无法在服务完成初始化后对其他单元进行排序,所以,当客户端需要通过仅由该服务本身创建的IPC通道(而非由systemd创建的套接字或D-bus之类)连接到该服务的时候,simple类型并不是最佳选择。
在这种情况下, notify或dbus(该服务必须提供D-Bus接口)才是最佳选择, 因为这两种类型都允许服务进程精确的安排何时算是服务启动成功、何时可以继续启动后继单元。
notify类型需要服务进程明确使用sd_notify()函数或类似的API,否则,可以使用forking作为替代(它支持传统的UNIX服务启动协议)。
最后,如果能够确保服务进程调用成功、服务进程自身不做或只做很少的初始化工作(且不大可能初始化失败),那么exec将是最佳选择。

注意,因为使用任何 simple 之外的类型都需要等待服务完成初始化,所以可能会减慢系统启动速度。 因此,应该尽可能避免使用 simple 之外的类型(除非必须)。
另外,也不建议对长时间持续运行的服务使用 idle 或 oneshot 类型。

下面是一个oneshot的例子,笔记本电脑启动时,要把触摸板关掉,配置文件可以这样写。

1
2
3
4
5
6
7
8
9
[Unit]
Description=Switch-off Touchpad

[Service]
Type=oneshot
ExecStart=/usr/bin/touchpad-off

[Install]
WantedBy=multi-user.target

上面的配置文件,启动类型设为oneshot,就表明这个服务只要运行一次就够了,不需要长期运行。

如果关闭以后,将来某个时候还想打开,配置文件修改如下。

1
2
3
4
5
6
7
8
9
10
11
[Unit]
Description=Switch-off Touchpad

[Service]
Type=oneshot
ExecStart=/usr/bin/touchpad-off start
ExecStop=/usr/bin/touchpad-off stop
RemainAfterExit=yes

[Install]
WantedBy=multi-user.target

上面配置文件中,RemainAfterExit字段设为yes,表示进程退出以后,服务仍然保持执行。这样的话,一旦使用systemctl stop命令停止服务,ExecStop指定的命令就会执行,从而重新开启触摸板。

KillMode字段、Restart字段和RestartSec字段

Service区块有一些字段,定义了重启行为。

  1. KillMode字段:定义 Systemd 如何停止 sshd 服务。

    在ssh.service定义中,将KillMode设为process,表示只停止主进程,不停止任何sshd 子进程,即子进程打开的 SSH session 仍然保持连接。这个设置不太常见,但对 sshd 很重要,否则你停止服务的时候,会连自己打开的 SSH session 一起杀掉。

    KillMode字段可以设置的值如下。

    • control-group(默认值):当前控制组里面的所有子进程,都会被杀掉
    • process:只杀主进程
    • mixed:主进程将收到 SIGTERM 信号,子进程收到 SIGKILL 信号
    • none:没有进程会被杀掉,只是执行服务的 stop 命令。
  2. Restart字段:定义了 sshd 退出后,systemd 的重启方式。

    在ssh.service定义中,Restart设为on-failure,表示任何意外的失败,都将重启sshd。如果 sshd 正常停止(比如执行systemctl stop命令),它就不会重启。

    Restart字段可以设置的值如下。

    • no(默认值):退出后不会重启
    • on-success:只有正常退出时(退出状态码为0),才会重启
    • on-failure:非正常退出时(退出状态码非0),包括被信号终止和超时,才会重启
    • on-abnormal:只有被信号终止和超时,才会重启
    • on-abort:只有在收到没有捕捉到的信号终止时,才会重启
    • on-watchdog:超时退出,才会重启
    • always:不管是什么退出原因,总是重启

    对于守护进程,推荐设为on-failure。对于那些允许发生错误退出的服务,可以设为on-abnormal。

  3. RestartSec字段

最后是RestartSec字段。

RestartSec字段:表示 Systemd 重启服务之前,需要等待的秒数。

[Install] 区块

Install区块,定义如何安装这个配置文件,即怎样做到开机启动。只有在systemctl的enable与disable命令在启用/停用单元时才会使用此部分。

WantedBy字段

表示该服务所在的 Target。

Target的含义是服务组,表示一组服务。WantedBy=multi-user.target指的是 sshd 所在的 Target 是multi-user.target。

这个设置非常重要,因为执行systemctl enable sshd.service命令时,sshd.service的一个符号链接,就会放在/etc/systemd/system目录下面的multi-user.target.wants子目录之中。

Systemd 有默认的启动 Target。

1
2
$ systemctl get-default
multi-user.target

上面的结果表示,默认的启动 Target 是multi-user.target。在这个组里的所有服务,都将开机启动。这就是为什么systemctl enable命令能设置开机启动的原因。

使用 Target 的时候,systemctl list-dependencies命令和systemctl isolate命令也很有用。

1
2
3
4
5
6
# 查看 multi-user.target 包含的所有服务
$ systemctl list-dependencies multi-user.target

# 切换到另一个 target
# shutdown.target 就是关机状态
$ sudo systemctl isolate shutdown.target

一般来说,常用的 Target 有两个:一个是multi-user.target,表示多用户命令行状态;另一个是graphical.target,表示图形用户状态,它依赖于multi-user.target。官方文档有一张非常清晰的 Target 依赖关系图。

修改配置文件后重启

修改配置文件以后,需要重新加载配置文件,然后重新启动相关服务。

1
2
3
4
5
# 重新加载配置文件
$ sudo systemctl daemon-reload

# 重启相关服务
$ sudo systemctl restart foobar

Target 的配置文件

Target 也有自己的配置文件。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
$ systemctl cat multi-user.target
# /lib/systemd/system/multi-user.target
# SPDX-License-Identifier: LGPL-2.1+
#
# This file is part of systemd.
#
# systemd is free software; you can redistribute it and/or modify it
# under the terms of the GNU Lesser General Public License as published by
# the Free Software Foundation; either version 2.1 of the License, or
# (at your option) any later version.

[Unit]
Description=Multi-User System
Documentation=man:systemd.special(7)
Requires=basic.target
Conflicts=rescue.service rescue.target
After=basic.target rescue.service rescue.target
AllowIsolate=yes

注意,Target 配置文件里面没有启动命令。

上面输出结果中,主要字段含义如下。

  • Requires字段:要求basic.target一起运行。
  • Conflicts字段:冲突字段。如果rescue.service或rescue.target正在运行,multi-user.target就不能运行,反之亦然。
  • After:表示multi-user.target在basic.target 、 rescue.service、 rescue.target之后启动,如果它们有启动的话。
  • AllowIsolate:允许使用systemctl isolate命令切换到multi-user.target。
文章目录
  1. 1. 什么是systemd service
    1. 1.1. 启动服务
    2. 1.2. 停止服务
  2. 2. service文件
    1. 2.1. [Unit] 区块:启动顺序与依赖关系。
      1. 2.1.1. Description字段
      2. 2.1.2. Documentation字段
      3. 2.1.3. After字段
      4. 2.1.4. Before字段
      5. 2.1.5. Wants字段和Requires字段
    2. 2.2. [Service] 区块:启动行为
      1. 2.2.1. EnvironmentFile字段
      2. 2.2.2. ExecStart字段
      3. 2.2.3. Type字段
      4. 2.2.4. KillMode字段、Restart字段和RestartSec字段
    3. 2.3. [Install] 区块
      1. 2.3.1. WantedBy字段
    4. 2.4. 修改配置文件后重启
  3. 3. Target 的配置文件