From 6c4fa8f89fc18108a6a1ea6dd7e43040d6fa5f30 Mon Sep 17 00:00:00 2001 From: nnz1024 <0comffdiz@inbox.ru> Date: Fri, 13 Jul 2012 20:45:00 +0400 Subject: [PATCH] Version v12.1 (2012-07-13 20:45) [AUTO] --- s4a.tex | 128 ++++++++++++++++++++++++++++++++++++++++++-------------- 1 file changed, 97 insertions(+), 31 deletions(-) diff --git a/s4a.tex b/s4a.tex index 8ecff4f..5a3aa38 100644 --- a/s4a.tex +++ b/s4a.tex @@ -2,7 +2,7 @@ \usepackage{cmap} % Copy-paste из PDF без проблем с кодировкой \usepackage[utf8]{inputenc} \usepackage[english,russian]{babel} % Русские переносы и проч. -\usepackage{graphicx,color} +\usepackage{graphicx,color,pmboxdraw} \usepackage[T1,T2A]{fontenc} \usepackage{indentfirst} % Отступ в первом абзаце главы \usepackage{fancyvrb} % Продвинутые листинги и in-line commands @@ -18,18 +18,8 @@ pdfauthor={Lennart Poettering, Sergey Ptashnick}} % Несколько сокращений \newcommand{\sectiona}[1]{\section*{#1}\addcontentsline{toc}{section}{#1}} \newcommand{\hreftt}[2]{\href{#1}{\texttt{#2}}} -\newcommand{\tbs}{\textbackslash} -\newcommand{\hrf}[2]{\href{#1}{#2}} \newenvironment{caveat}[1][]{\smallskip\par\textbf{Предупреждение#1: }}% {\smallskip\par} -% Примерный аналог символа \testSFii (присутствует в листингах), -% но без использования пакета pmboxdraw, средствами graphicx -\newcommand{\mytextSFii}{\raisebox{0pt}[0pt][\depth]{% - \reflectbox{\rotatebox[origin=t]{270}{$\neg$}}}} -% Из-за бага в пакете fancyvrb, в окружениях Verbatim нельзя использовать URL, -% содержащие дефисы. Поэтому их определение приходится выносить за пределы -% окружения -\newcommand{\defhref}[3]{\newcommand{#1}{\href{#2}{#3}}} % Настройка макета страницы \setlength{\hoffset}{-1.5cm} \addtolength{\textwidth}{2cm} @@ -2218,14 +2208,14 @@ RestartSec=0 при обращении к экземпляру +serial-getty@ttyUSB0.service+, они заменяются на <<+ttyUSB0+>>. Результат такой замены можно проверить, например, запросив состояние для нашей службы: -\begin{Verbatim}[commandchars=\\\{\}] +\begin{Verbatim} $ systemctl status serial-getty@ttyUSB0.service serial-getty@ttyUSB0.service - Getty on ttyUSB0 Loaded: loaded (/lib/systemd/system/serial-getty@.service; static) Active: active (running) since Mon, 26 Sep 2011 04:20:44 +0200; 2s ago Main PID: 5443 (agetty) CGroup: name=systemd:/system/getty@.service/ttyUSB0 - \mytextSFii{} 5443 /sbin/agetty -s ttyUSB0 115200,38400,9600 + └ 5443 /sbin/agetty -s ttyUSB0 115200,38400,9600 \end{Verbatim} Собственно, это и есть ключевая идея организации экземпляров служб. Как видите, systemd предоставляет простой в использовании механизм шаблонов, позволяющих @@ -2235,8 +2225,8 @@ systemd предоставляет простой в использовании Вы можете создавать дополнительные экземпляры таких служб, просто добавляя символьные ссылки в каталоги +*.wants/+. Например, чтобы обеспечить запуск getty на ttyUSB0 при каждой загрузке, достаточно создать такую ссылку: -\begin{Verbatim}[commandchars=\\\{\}] -# ln -s /lib/systemd/system/serial-getty@.service \tbs{} +\begin{Verbatim} +# ln -s /lib/systemd/system/serial-getty@.service \ /etc/systemd/system/getty.target.wants/serial-getty@ttyUSB0.service \end{Verbatim} При этом файл конфигурации, на который указывает ссылка (в нашем случае @@ -2292,7 +2282,7 @@ systemd и заложен предварительный поиск файла наличии в оболочке <<умного>> автодополнения. Однако, начиная с systemd v186, при работе с +systemctl+ можно указывать неэкранированные имена юнитов.}: \begin{landscape} -\begin{Verbatim}[fontsize=\small,commandchars=|\{\}] +\begin{Verbatim}[fontsize=\small] # systemctl start 'serial-getty@serial-by\x2dpath-pci\x2d0000:00:1d.0\x2dusb\x2d0:1.4:1.1\x2dport0.service' # systemctl status 'serial-getty@serial-by\x2dpath-pci\x2d0000:00:1d.0\x2dusb\x2d0:1.4:1.1\x2dport0.service' serial-getty@serial-by\x2dpath-pci\x2d0000:00:1d.0\x2dusb\x2d0:1.4:1.1\x2dport0.service - Serial Getty on serial/by-path/pci-0000:00:1d.0-usb-0:1.4:1.1-port0 @@ -2300,7 +2290,7 @@ serial-getty@serial-by\x2dpath-pci\x2d0000:00:1d.0\x2dusb\x2d0:1.4:1.1\x2dport0. Active: active (running) since Mon, 26 Sep 2011 05:08:52 +0200; 1s ago Main PID: 5788 (agetty) CGroup: name=systemd:/system/serial-getty@.service/serial-by\x2dpath-pci\x2d0000:00:1d.0\x2dusb\x2d0:1.4:1.1\x2dport0 - |mytextSFii{} 5788 /sbin/agetty -s serial/by-path/pci-0000:00:1d.0-usb-0:1.4:1.1-port0 115200 38400 9600 + └ 5788 /sbin/agetty -s serial/by-path/pci-0000:00:1d.0-usb-0:1.4:1.1-port0 115200 38400 9600 \end{Verbatim} \end{landscape} Как видите, в качестве идентификатора экземпляра используется экранированная @@ -2866,7 +2856,7 @@ LimitFSIZE=0 ... \end{Verbatim} Обратите внимание, что эти ограничения будут эффективно работать только в том -случае, если служба будет работать от имени простого пользователя (не~root) и +случае, если служба запускается от имени простого пользователя (не~root) и без привилегии +CAP_SYS_RESOURCE+ (блокирование этой привилегии можно обеспечить, например, описанной выше опцией +CapabilityBoundingSet=+). В противном случае, ничто не~мешает процессу поменять соответствующие ограничения. @@ -2952,7 +2942,7 @@ systemd. Итак, мы интегрировали Journal в systemd, и научили +systemctl+ работать с ним. Результат выглядит примерно так: -\begin{Verbatim}[fontsize=\small,commandchars=\\\{\}] +\begin{Verbatim}[fontsize=\small] $ systemctl status avahi-daemon.service avahi-daemon.service - Avahi mDNS/DNS-SD Stack Loaded: loaded (/usr/lib/systemd/system/avahi-daemon.service; enabled) @@ -2960,8 +2950,8 @@ avahi-daemon.service - Avahi mDNS/DNS-SD Stack Main PID: 8216 (avahi-daemon) Status: "avahi-daemon 0.6.30 starting up." CGroup: name=systemd:/system/avahi-daemon.service - \mytextSFii{} 8216 avahi-daemon: running [omega.local] - \mytextSFii{} 8217 avahi-daemon: chroot helper + ├ 8216 avahi-daemon: running [omega.local] + └ 8217 avahi-daemon: chroot helper May 18 12:27:37 omega avahi-daemon[8216]: Joining mDNS multicast group on interface eth1.IPv4 with address 172.31.0.52. May 18 12:27:37 omega avahi-daemon[8216]: New relevant interface eth1.IPv4 for mDNS. @@ -3035,19 +3025,20 @@ Unix-администратору при переходе на systemd нужн можно настроить, может получить ссылки на соответствующую документацию, просто воспользовавшись давно известной командой +systemctl status+. Возьмем для примера +systemd-logind.service+: -\defhref{\logind}{http://www.freedesktop.org/software/systemd/man/systemd-logind.service.html}% -{man:systemd-logind.service(7)} -\begin{Verbatim}[fontsize=\small,commandchars=\\\{\}] +\begin{Verbatim}[fontsize=\small,commandchars=\\\{\},% + % В окружении Verbatim ссылки, содержащие знак дефиса/минуса "-", + % повреждаются. Обходим это при помощи черной магии в стиле sysvinit: + codes={\catcode`+=\active},defineactive=\def+{-}] $ systemctl status systemd-logind.service systemd-logind.service - Login Service Loaded: loaded (/usr/lib/systemd/system/systemd-logind.service; static) Active: active (running) since Mon, 25 Jun 2012 22:39:24 +0200; 1 day and 18h ago - Docs: \logind{} + Docs: \href{http://www.freedesktop.org/software/systemd/man/systemd+logind.service.html}{man:systemd-logind.service(7)} \href{http://www.freedesktop.org/software/systemd/man/logind.conf.html}{man:logind.conf(5)} \url{http://www.freedesktop.org/wiki/Software/systemd/multiseat} Main PID: 562 (systemd-logind) CGroup: name=systemd:/system/systemd-logind.service - \mytextSFii{} 562 /usr/lib/systemd/systemd-logind + └ 562 /usr/lib/systemd/systemd-logind Jun 25 22:39:24 epsilon systemd-logind[562]: Watching system buttons on /dev/input/event2 (Power Button) Jun 25 22:39:24 epsilon systemd-logind[562]: Watching system buttons on /dev/input/event6 (Video Bus) @@ -3109,7 +3100,7 @@ URI, ссылающиеся на документацию, формируютс В завершение, стоит отметить, что использованная нами идея не~является такой уж новой: в SMF, системе инициализации Solaris, уже используется практика -добавления ссылок на документацию в описании службы. Однако, в Linux такой +указания ссылок на документацию в описании службы. Однако, в Linux такой подход является принципиально новым, и systemd сейчас является наиболее документированной и прозрачной системой загрузки для данной платформы. @@ -3137,8 +3128,8 @@ URI, ссылающиеся на документацию, формируютс мобильные/встраиваемые устройства, настольные системы и промышленные серверы. Мобильные и встраиваемые системы, как правило, располагают очень скромными ресурсами и вынуждены очень экономно расходовать энергию. Настольные системы -куда менее ограничены по мощности но, тем не~менее, все же проигрывают в этом -плане промышленным серверам. Но, как ни~странно это прозвучит, существуют +уже не~так сильно ограничены по мощности, хотя все же проигрывают в +этом плане промышленным серверам. Но, как ни~странно это прозвучит, существуют возможности, востребованные в обоих крайних случаях (встраиваемые системы и серверы), но не~очень актуальные в промежуточной ситуации (десктопы). В частности, к ним относится поддержка @@ -3153,7 +3144,7 @@ URI, ссылающиеся на документацию, формируютс функциональность практически не~востребована\footnote{Тем не~менее, сейчас аппаратные сторожевые таймеры все чаще появляются и в настольных системах, так как стоят они относительно дешево и доступны практически во всех современных -чипсетах.}. В то же время, она весьма актуальна для высокодоступных серверных +чипсетах.}. С другой стороны, она весьма актуальна для высокодоступных серверных систем. Начиная с версии 183, systemd полностью поддерживает аппаратные сторожевые @@ -3179,7 +3170,7 @@ URI, ссылающиеся на документацию, формируютс течение 20 секунд таймер не~получит очередного сигнала <<все в порядке>>, система автоматически перезагрузится. Отметим, что systemd отправляет такие сигналы с периодом, равным половине заданного интервала~--- в нашем случае, -через каждые 10 секунд. Собственно, это все. Просто задав один простой параметр, +через каждые 10 секунд. Собственно, это все. Просто задав один параметр, вы обеспечите аппаратный контроль работоспособности systemd и ядра\footnote{Небольшой совет: если вы занимаетесь отладкой базовых системных компонентов~--- не~забудьте отключить сторожевой таймер. Иначе ваша система @@ -3198,6 +3189,81 @@ URI, ссылающиеся на документацию, формируютс процессе остановки системы перед перезагрузкой она зависнет, аппаратный таймер принудительно перезагрузит ее по истечении данного интервала. +Это все, что я хотел сказать об аппаратных таймерах. Двух вышеописанных опций +должно быть вполне достаточно для полноценного использования их возможностей. +А сейчас мы рассмотрим логику программных сторожевых таймеров, обеспечивающих +контроль работоспособности отдельных служб. + +Прежде всего отметим, что для полноценной поддержки сторожевого контроля, +программа должна содержать специальный код, периодически отправляющий таймеру +сигналы <<все в порядке>>. Добавить поддержку такой функциональности довольно +просто. Для начала, демон должен проверить переменную окружения +WATCHDOG_USEC=+. +Если она определена, то ее значение задает контрольный интервал в микросекундах, +сформатированный в виде текстовой (ASCII) строки. В этом случае демон должен +регулярно выполнять вызов +\hreftt{http://www.freedesktop.org/software/systemd/man/sd_notify.html}{sd\_notify}+("WATCHDOG=1")+ +с периодом, равным половине указанного интервала. Таким образом, поддержка +программного сторожевого контроля со стороны демона сводится к проверке значения +переменной окружения, и выполнении определенных действий в соответствии с этим +значением. + +Если интересующая вас служба обеспечивает поддержку такой +функциональности, вы можете включить для нее сторожевой контроль, задав опцию ++WatchdogSec=+ в ее юнит-файле. Эта опция задает период работы таймера +(подробнее см. +\href{http://www.freedesktop.org/software/systemd/man/systemd.service.html}{systemd.service(5)}). +Если вы зададите ее, то systemd при запуске службы передаст ей соответствующее +значение +WATCHDOG_USEC=+ и, если служба перестанет своевременно отправлять +сигналы <<все в порядке>>, присвоит ей статус сбойной (failed). + +Очевидно, что одного только присвоения статуса недостаточно для обеспечения +надежной работы системы. Поэтому нам также пригодятся настройки, определяющие, +нужно ли перезапускать зависшую службу, количество попыток перезапуска, и +дальнейшие действия, если она все равно продолжает сбоить. Чтобы включить +автоматический перезапуск службы при сбое, нужно задать опцию ++Restart=on-failure+ в ее юнит-файле. Чтобы настроить, сколько раз systemd будет +пытаться перезапустить службу, воспользуйтесь настройками +StartLimitBurst=+ ++StartLimitInterval=+ (первая из них определяет предельное количество попыток, +вторая~--- интервал времени, в течение которого они подсчитываются). В том +случае, если достигнут предел количества попыток за указанное время, выполняется +действие, заданное параметром +StartLimitAction=+. По умолчанию он установлен в ++none+ (никаких дополнительных действий не~будет, службу просто оставят в покое со +статусом сбойной). В качестве альтернативы можно указать одно из трех +специальных действий: +reboot+, +reboot-force+ и +reboot-immediate+. ++reboot+ соответствует обычной перезагрузке системы, с выполнением всех +сопутствующих процедур (корректное завершение всех служб, отмонтирование +файловых систем и т.д.). +reboot-force+ действует более грубо~--- даже +не~пытаясь корректно остановить службы, оно просто убивает все их процессы, +отмонтирует файловые системы и выполняет принудительную перезагрузку (в +результате, перезагрузка происходит быстрее, чем обычно, но файловые системы +остаются неповрежденными). И наконец, +reboot-immediate+ даже не~пытается отдать +дань вежливости (убить процессы и отмонтировать файловый системы)~--- оно +немедленно выполняет жесткую перезагрузку системы (это поведение практически +аналогично срабатыванию аппаратного сторожевого таймера). Все перечисленный +настройки подробно описаны на странице руководства +\href{http://www.freedesktop.org/software/systemd/man/systemd.service.html}{systemd.service(5)}). + +Таким образом, мы мы получаем гибкий механизм для настройки сторожевого контроля +служб, их перезапуска при зависании, и реагирования в ситуации, когда перезапуск +не~помогает. + +Рассмотрим применение этих настроек на простом примере: +\begin{Verbatim} +[Unit] +Description=My Little Daemon +Documentation=man:mylittled(8) + +[Service] +ExecStart=/usr/bin/mylittled +WatchdogSec=30s +Restart=on-failure +StartLimitInterval=5min +StartLimitBurst=4 +StartLimitAction=reboot-force +\end{Verbatim} + + + \end{document} vim:ft=tex:tw=80:spell:spelllang=ru