Compare commits
1 Commits
| Author | SHA1 | Date | |
|---|---|---|---|
|
|
6c4fa8f89f |
128
s4a.tex
128
s4a.tex
@@ -2,7 +2,7 @@
|
||||
\usepackage{cmap} % Copy-paste из PDF без проблем с кодировкой
|
||||
\usepackage[utf8]{inputenc}
|
||||
\usepackage[english,russian]{babel} % Русские переносы и проч.
|
||||
\usepackage{graphicx,color}
|
||||
\usepackage{graphicx,color,pmboxdraw}
|
||||
\usepackage[T1,T2A]{fontenc}
|
||||
\usepackage{indentfirst} % Отступ в первом абзаце главы
|
||||
\usepackage{fancyvrb} % Продвинутые листинги и in-line commands
|
||||
@@ -18,18 +18,8 @@ pdfauthor={Lennart Poettering, Sergey Ptashnick}}
|
||||
% Несколько сокращений
|
||||
\newcommand{\sectiona}[1]{\section*{#1}\addcontentsline{toc}{section}{#1}}
|
||||
\newcommand{\hreftt}[2]{\href{#1}{\texttt{#2}}}
|
||||
\newcommand{\tbs}{\textbackslash}
|
||||
\newcommand{\hrf}[2]{\href{#1}{#2}}
|
||||
\newenvironment{caveat}[1][]{\smallskip\par\textbf{Предупреждение#1: }}%
|
||||
{\smallskip\par}
|
||||
% Примерный аналог символа \testSFii (присутствует в листингах),
|
||||
% но без использования пакета pmboxdraw, средствами graphicx
|
||||
\newcommand{\mytextSFii}{\raisebox{0pt}[0pt][\depth]{%
|
||||
\reflectbox{\rotatebox[origin=t]{270}{$\neg$}}}}
|
||||
% Из-за бага в пакете fancyvrb, в окружениях Verbatim нельзя использовать URL,
|
||||
% содержащие дефисы. Поэтому их определение приходится выносить за пределы
|
||||
% окружения
|
||||
\newcommand{\defhref}[3]{\newcommand{#1}{\href{#2}{#3}}}
|
||||
% Настройка макета страницы
|
||||
\setlength{\hoffset}{-1.5cm}
|
||||
\addtolength{\textwidth}{2cm}
|
||||
@@ -2218,14 +2208,14 @@ RestartSec=0
|
||||
при обращении к экземпляру +serial-getty@ttyUSB0.service+, они заменяются на
|
||||
<<+ttyUSB0+>>. Результат такой замены можно проверить, например, запросив
|
||||
состояние для нашей службы:
|
||||
\begin{Verbatim}[commandchars=\\\{\}]
|
||||
\begin{Verbatim}
|
||||
$ systemctl status serial-getty@ttyUSB0.service
|
||||
serial-getty@ttyUSB0.service - Getty on ttyUSB0
|
||||
Loaded: loaded (/lib/systemd/system/serial-getty@.service; static)
|
||||
Active: active (running) since Mon, 26 Sep 2011 04:20:44 +0200; 2s ago
|
||||
Main PID: 5443 (agetty)
|
||||
CGroup: name=systemd:/system/getty@.service/ttyUSB0
|
||||
\mytextSFii{} 5443 /sbin/agetty -s ttyUSB0 115200,38400,9600
|
||||
└ 5443 /sbin/agetty -s ttyUSB0 115200,38400,9600
|
||||
\end{Verbatim}
|
||||
Собственно, это и есть ключевая идея организации экземпляров служб. Как видите,
|
||||
systemd предоставляет простой в использовании механизм шаблонов, позволяющих
|
||||
@@ -2235,8 +2225,8 @@ systemd предоставляет простой в использовании
|
||||
Вы можете создавать дополнительные экземпляры таких служб, просто добавляя
|
||||
символьные ссылки в каталоги +*.wants/+. Например, чтобы обеспечить запуск getty
|
||||
на ttyUSB0 при каждой загрузке, достаточно создать такую ссылку:
|
||||
\begin{Verbatim}[commandchars=\\\{\}]
|
||||
# ln -s /lib/systemd/system/serial-getty@.service \tbs{}
|
||||
\begin{Verbatim}
|
||||
# ln -s /lib/systemd/system/serial-getty@.service \
|
||||
/etc/systemd/system/getty.target.wants/serial-getty@ttyUSB0.service
|
||||
\end{Verbatim}
|
||||
При этом файл конфигурации, на который указывает ссылка (в нашем случае
|
||||
@@ -2292,7 +2282,7 @@ systemd и заложен предварительный поиск файла
|
||||
наличии в оболочке <<умного>> автодополнения. Однако, начиная с systemd v186,
|
||||
при работе с +systemctl+ можно указывать неэкранированные имена юнитов.}:
|
||||
\begin{landscape}
|
||||
\begin{Verbatim}[fontsize=\small,commandchars=|\{\}]
|
||||
\begin{Verbatim}[fontsize=\small]
|
||||
# systemctl start 'serial-getty@serial-by\x2dpath-pci\x2d0000:00:1d.0\x2dusb\x2d0:1.4:1.1\x2dport0.service'
|
||||
# systemctl status 'serial-getty@serial-by\x2dpath-pci\x2d0000:00:1d.0\x2dusb\x2d0:1.4:1.1\x2dport0.service'
|
||||
serial-getty@serial-by\x2dpath-pci\x2d0000:00:1d.0\x2dusb\x2d0:1.4:1.1\x2dport0.service - Serial Getty on serial/by-path/pci-0000:00:1d.0-usb-0:1.4:1.1-port0
|
||||
@@ -2300,7 +2290,7 @@ serial-getty@serial-by\x2dpath-pci\x2d0000:00:1d.0\x2dusb\x2d0:1.4:1.1\x2dport0.
|
||||
Active: active (running) since Mon, 26 Sep 2011 05:08:52 +0200; 1s ago
|
||||
Main PID: 5788 (agetty)
|
||||
CGroup: name=systemd:/system/serial-getty@.service/serial-by\x2dpath-pci\x2d0000:00:1d.0\x2dusb\x2d0:1.4:1.1\x2dport0
|
||||
|mytextSFii{} 5788 /sbin/agetty -s serial/by-path/pci-0000:00:1d.0-usb-0:1.4:1.1-port0 115200 38400 9600
|
||||
└ 5788 /sbin/agetty -s serial/by-path/pci-0000:00:1d.0-usb-0:1.4:1.1-port0 115200 38400 9600
|
||||
\end{Verbatim}
|
||||
\end{landscape}
|
||||
Как видите, в качестве идентификатора экземпляра используется экранированная
|
||||
@@ -2866,7 +2856,7 @@ LimitFSIZE=0
|
||||
...
|
||||
\end{Verbatim}
|
||||
Обратите внимание, что эти ограничения будут эффективно работать только в том
|
||||
случае, если служба будет работать от имени простого пользователя (не~root) и
|
||||
случае, если служба запускается от имени простого пользователя (не~root) и
|
||||
без привилегии +CAP_SYS_RESOURCE+ (блокирование этой привилегии можно
|
||||
обеспечить, например, описанной выше опцией +CapabilityBoundingSet=+). В
|
||||
противном случае, ничто не~мешает процессу поменять соответствующие ограничения.
|
||||
@@ -2952,7 +2942,7 @@ systemd.
|
||||
|
||||
Итак, мы интегрировали Journal в systemd, и научили +systemctl+ работать с ним.
|
||||
Результат выглядит примерно так:
|
||||
\begin{Verbatim}[fontsize=\small,commandchars=\\\{\}]
|
||||
\begin{Verbatim}[fontsize=\small]
|
||||
$ systemctl status avahi-daemon.service
|
||||
avahi-daemon.service - Avahi mDNS/DNS-SD Stack
|
||||
Loaded: loaded (/usr/lib/systemd/system/avahi-daemon.service; enabled)
|
||||
@@ -2960,8 +2950,8 @@ avahi-daemon.service - Avahi mDNS/DNS-SD Stack
|
||||
Main PID: 8216 (avahi-daemon)
|
||||
Status: "avahi-daemon 0.6.30 starting up."
|
||||
CGroup: name=systemd:/system/avahi-daemon.service
|
||||
\mytextSFii{} 8216 avahi-daemon: running [omega.local]
|
||||
\mytextSFii{} 8217 avahi-daemon: chroot helper
|
||||
├ 8216 avahi-daemon: running [omega.local]
|
||||
└ 8217 avahi-daemon: chroot helper
|
||||
|
||||
May 18 12:27:37 omega avahi-daemon[8216]: Joining mDNS multicast group on interface eth1.IPv4 with address 172.31.0.52.
|
||||
May 18 12:27:37 omega avahi-daemon[8216]: New relevant interface eth1.IPv4 for mDNS.
|
||||
@@ -3035,19 +3025,20 @@ Unix-администратору при переходе на systemd нужн
|
||||
можно настроить, может получить ссылки на соответствующую документацию, просто
|
||||
воспользовавшись давно известной командой +systemctl status+. Возьмем для
|
||||
примера +systemd-logind.service+:
|
||||
\defhref{\logind}{http://www.freedesktop.org/software/systemd/man/systemd-logind.service.html}%
|
||||
{man:systemd-logind.service(7)}
|
||||
\begin{Verbatim}[fontsize=\small,commandchars=\\\{\}]
|
||||
\begin{Verbatim}[fontsize=\small,commandchars=\\\{\},%
|
||||
% В окружении Verbatim ссылки, содержащие знак дефиса/минуса "-",
|
||||
% повреждаются. Обходим это при помощи черной магии в стиле sysvinit:
|
||||
codes={\catcode`+=\active},defineactive=\def+{-}]
|
||||
$ systemctl status systemd-logind.service
|
||||
systemd-logind.service - Login Service
|
||||
Loaded: loaded (/usr/lib/systemd/system/systemd-logind.service; static)
|
||||
Active: active (running) since Mon, 25 Jun 2012 22:39:24 +0200; 1 day and 18h ago
|
||||
Docs: \logind{}
|
||||
Docs: \href{http://www.freedesktop.org/software/systemd/man/systemd+logind.service.html}{man:systemd-logind.service(7)}
|
||||
\href{http://www.freedesktop.org/software/systemd/man/logind.conf.html}{man:logind.conf(5)}
|
||||
\url{http://www.freedesktop.org/wiki/Software/systemd/multiseat}
|
||||
Main PID: 562 (systemd-logind)
|
||||
CGroup: name=systemd:/system/systemd-logind.service
|
||||
\mytextSFii{} 562 /usr/lib/systemd/systemd-logind
|
||||
└ 562 /usr/lib/systemd/systemd-logind
|
||||
|
||||
Jun 25 22:39:24 epsilon systemd-logind[562]: Watching system buttons on /dev/input/event2 (Power Button)
|
||||
Jun 25 22:39:24 epsilon systemd-logind[562]: Watching system buttons on /dev/input/event6 (Video Bus)
|
||||
@@ -3109,7 +3100,7 @@ URI, ссылающиеся на документацию, формируютс
|
||||
|
||||
В завершение, стоит отметить, что использованная нами идея не~является такой уж
|
||||
новой: в SMF, системе инициализации Solaris, уже используется практика
|
||||
добавления ссылок на документацию в описании службы. Однако, в Linux такой
|
||||
указания ссылок на документацию в описании службы. Однако, в Linux такой
|
||||
подход является принципиально новым, и systemd сейчас является наиболее
|
||||
документированной и прозрачной системой загрузки для данной платформы.
|
||||
|
||||
@@ -3137,8 +3128,8 @@ URI, ссылающиеся на документацию, формируютс
|
||||
мобильные/встраиваемые устройства, настольные системы и промышленные серверы.
|
||||
Мобильные и встраиваемые системы, как правило, располагают очень скромными
|
||||
ресурсами и вынуждены очень экономно расходовать энергию. Настольные системы
|
||||
куда менее ограничены по мощности но, тем не~менее, все же проигрывают в этом
|
||||
плане промышленным серверам. Но, как ни~странно это прозвучит, существуют
|
||||
уже не~так сильно ограничены по мощности, хотя все же проигрывают в
|
||||
этом плане промышленным серверам. Но, как ни~странно это прозвучит, существуют
|
||||
возможности, востребованные в обоих крайних случаях (встраиваемые системы и
|
||||
серверы), но не~очень актуальные в промежуточной ситуации (десктопы). В
|
||||
частности, к ним относится поддержка
|
||||
@@ -3153,7 +3144,7 @@ URI, ссылающиеся на документацию, формируютс
|
||||
функциональность практически не~востребована\footnote{Тем не~менее, сейчас
|
||||
аппаратные сторожевые таймеры все чаще появляются и в настольных системах, так
|
||||
как стоят они относительно дешево и доступны практически во всех современных
|
||||
чипсетах.}. В то же время, она весьма актуальна для высокодоступных серверных
|
||||
чипсетах.}. С другой стороны, она весьма актуальна для высокодоступных серверных
|
||||
систем.
|
||||
|
||||
Начиная с версии 183, systemd полностью поддерживает аппаратные сторожевые
|
||||
@@ -3179,7 +3170,7 @@ URI, ссылающиеся на документацию, формируютс
|
||||
течение 20 секунд таймер не~получит очередного сигнала <<все в порядке>>,
|
||||
система автоматически перезагрузится. Отметим, что systemd отправляет такие
|
||||
сигналы с периодом, равным половине заданного интервала~--- в нашем случае,
|
||||
через каждые 10 секунд. Собственно, это все. Просто задав один простой параметр,
|
||||
через каждые 10 секунд. Собственно, это все. Просто задав один параметр,
|
||||
вы обеспечите аппаратный контроль работоспособности systemd и
|
||||
ядра\footnote{Небольшой совет: если вы занимаетесь отладкой базовых системных
|
||||
компонентов~--- не~забудьте отключить сторожевой таймер. Иначе ваша система
|
||||
@@ -3198,6 +3189,81 @@ URI, ссылающиеся на документацию, формируютс
|
||||
процессе остановки системы перед перезагрузкой она зависнет, аппаратный таймер
|
||||
принудительно перезагрузит ее по истечении данного интервала.
|
||||
|
||||
Это все, что я хотел сказать об аппаратных таймерах. Двух вышеописанных опций
|
||||
должно быть вполне достаточно для полноценного использования их возможностей.
|
||||
А сейчас мы рассмотрим логику программных сторожевых таймеров, обеспечивающих
|
||||
контроль работоспособности отдельных служб.
|
||||
|
||||
Прежде всего отметим, что для полноценной поддержки сторожевого контроля,
|
||||
программа должна содержать специальный код, периодически отправляющий таймеру
|
||||
сигналы <<все в порядке>>. Добавить поддержку такой функциональности довольно
|
||||
просто. Для начала, демон должен проверить переменную окружения +WATCHDOG_USEC=+.
|
||||
Если она определена, то ее значение задает контрольный интервал в микросекундах,
|
||||
сформатированный в виде текстовой (ASCII) строки. В этом случае демон должен
|
||||
регулярно выполнять вызов
|
||||
\hreftt{http://www.freedesktop.org/software/systemd/man/sd_notify.html}{sd\_notify}+("WATCHDOG=1")+
|
||||
с периодом, равным половине указанного интервала. Таким образом, поддержка
|
||||
программного сторожевого контроля со стороны демона сводится к проверке значения
|
||||
переменной окружения, и выполнении определенных действий в соответствии с этим
|
||||
значением.
|
||||
|
||||
Если интересующая вас служба обеспечивает поддержку такой
|
||||
функциональности, вы можете включить для нее сторожевой контроль, задав опцию
|
||||
+WatchdogSec=+ в ее юнит-файле. Эта опция задает период работы таймера
|
||||
(подробнее см.
|
||||
\href{http://www.freedesktop.org/software/systemd/man/systemd.service.html}{systemd.service(5)}).
|
||||
Если вы зададите ее, то systemd при запуске службы передаст ей соответствующее
|
||||
значение +WATCHDOG_USEC=+ и, если служба перестанет своевременно отправлять
|
||||
сигналы <<все в порядке>>, присвоит ей статус сбойной (failed).
|
||||
|
||||
Очевидно, что одного только присвоения статуса недостаточно для обеспечения
|
||||
надежной работы системы. Поэтому нам также пригодятся настройки, определяющие,
|
||||
нужно ли перезапускать зависшую службу, количество попыток перезапуска, и
|
||||
дальнейшие действия, если она все равно продолжает сбоить. Чтобы включить
|
||||
автоматический перезапуск службы при сбое, нужно задать опцию
|
||||
+Restart=on-failure+ в ее юнит-файле. Чтобы настроить, сколько раз systemd будет
|
||||
пытаться перезапустить службу, воспользуйтесь настройками +StartLimitBurst=+
|
||||
+StartLimitInterval=+ (первая из них определяет предельное количество попыток,
|
||||
вторая~--- интервал времени, в течение которого они подсчитываются). В том
|
||||
случае, если достигнут предел количества попыток за указанное время, выполняется
|
||||
действие, заданное параметром +StartLimitAction=+. По умолчанию он установлен в
|
||||
+none+ (никаких дополнительных действий не~будет, службу просто оставят в покое со
|
||||
статусом сбойной). В качестве альтернативы можно указать одно из трех
|
||||
специальных действий: +reboot+, +reboot-force+ и +reboot-immediate+.
|
||||
+reboot+ соответствует обычной перезагрузке системы, с выполнением всех
|
||||
сопутствующих процедур (корректное завершение всех служб, отмонтирование
|
||||
файловых систем и т.д.). +reboot-force+ действует более грубо~--- даже
|
||||
не~пытаясь корректно остановить службы, оно просто убивает все их процессы,
|
||||
отмонтирует файловые системы и выполняет принудительную перезагрузку (в
|
||||
результате, перезагрузка происходит быстрее, чем обычно, но файловые системы
|
||||
остаются неповрежденными). И наконец, +reboot-immediate+ даже не~пытается отдать
|
||||
дань вежливости (убить процессы и отмонтировать файловый системы)~--- оно
|
||||
немедленно выполняет жесткую перезагрузку системы (это поведение практически
|
||||
аналогично срабатыванию аппаратного сторожевого таймера). Все перечисленный
|
||||
настройки подробно описаны на странице руководства
|
||||
\href{http://www.freedesktop.org/software/systemd/man/systemd.service.html}{systemd.service(5)}).
|
||||
|
||||
Таким образом, мы мы получаем гибкий механизм для настройки сторожевого контроля
|
||||
служб, их перезапуска при зависании, и реагирования в ситуации, когда перезапуск
|
||||
не~помогает.
|
||||
|
||||
Рассмотрим применение этих настроек на простом примере:
|
||||
\begin{Verbatim}
|
||||
[Unit]
|
||||
Description=My Little Daemon
|
||||
Documentation=man:mylittled(8)
|
||||
|
||||
[Service]
|
||||
ExecStart=/usr/bin/mylittled
|
||||
WatchdogSec=30s
|
||||
Restart=on-failure
|
||||
StartLimitInterval=5min
|
||||
StartLimitBurst=4
|
||||
StartLimitAction=reboot-force
|
||||
\end{Verbatim}
|
||||
|
||||
|
||||
|
||||
\end{document}
|
||||
|
||||
vim:ft=tex:tw=80:spell:spelllang=ru
|
||||
|
||||
Reference in New Issue
Block a user