Compare commits
3 Commits
| Author | SHA1 | Date | |
|---|---|---|---|
|
|
5fb4692385 | ||
|
|
a0a5e1f4ac | ||
|
|
e66acaaf28 |
798
s4a.tex
798
s4a.tex
@@ -3328,6 +3328,804 @@ StartLimitAction=reboot-force
|
||||
\href{http://www.pengutronix.de/}{Pengutronix}, которым приндалежит основная
|
||||
заслуга реализации сторожевого контроля в systemd.
|
||||
|
||||
\section{Запуск getty на последовательных (и не~только) консолях}
|
||||
|
||||
\emph{Если вам лень читать всю статью целиком: для запуска getty на
|
||||
последовательной консоли\footnote{Прим. перев.: Здесь и в дальнейшем автор
|
||||
использует термин <<serial console>>. Точный перевод этого выражения на русский
|
||||
язык звучит как <<консоль, подключаемая к последовательному порту>>. Однако,
|
||||
для краткости изложения, при переводе используется не~вполне корректный, но
|
||||
хорошо знакомый администраторам жаргонизм <<последовательная консоль>>. Также
|
||||
отметим, что в данном документе термины <<консоль>> и <<терминал>> используются
|
||||
как синонимы.} достаточно добавить параметр ядра \verb+console=ttyS0+, и systemd
|
||||
автоматически запустит getty на этом терминале.}
|
||||
|
||||
Физический последовательный порт
|
||||
\href{https://ru.wikipedia.org/wiki/RS-232}{RS-232}, хотя уже и стал редкостью
|
||||
на современных настольных компьютерах, тем не~менее, продолжает играть
|
||||
важную роль на современных серверах и встраиваемых системах. Он предоставляет
|
||||
простой и надежный доступ к управлению системой, даже когда сеть упала, а
|
||||
основной интерфейс управления завис. Кроме того, эмуляция последовательной
|
||||
консоли часто используется при управлении виртуальными машинами.
|
||||
|
||||
Разумеется, в Linux уже давно реализована поддержка работы с последовательными
|
||||
консолями, однако при разработке
|
||||
\href{http://www.freedesktop.org/wiki/Software/systemd}{systemd} мы постарались
|
||||
сделать работу с ними еще проще. В этой статье я хочу рассказать о том, как в
|
||||
systemd реализован запуск \href{https://ru.wikipedia.org/wiki/Getty}{getty} на
|
||||
терминалах различных типов.
|
||||
|
||||
Для начала, хотелось бы отметить следующий момент: в большинстве случаев, чтобы
|
||||
получить приглашение к логину на последовательном терминале, вам не~нужно
|
||||
совершать никаких дополнительных действий: systemd сам проверит настройки ядра,
|
||||
определит их них используемую ядром консоль, и автоматически запустит на ней
|
||||
getty. Таким образом, вам достаточно лишь правильно указать ядру соответствующую
|
||||
консоль (например, добавив к параметрам ядра в загрузчик +console=ttyS0+).
|
||||
|
||||
Тем не~менее, для общего образования мы все же рассмотрим некоторые тонкости
|
||||
запуска getty в systemd. Эта задача решается двумя шаблонами
|
||||
юнитов\footnote{Прим. перев.: Принципы работы с шаблонами и экземплярами служб
|
||||
изложены в главе~\ref{sec:instances}. Для лучшего понимания нижеприведенного
|
||||
материала, рекомендуется перечитать эту главу, если вы ее подзабыли.}:
|
||||
\begin{itemize}
|
||||
\item +getty@.service+ отвечает за
|
||||
\href{https://ru.wikipedia.org/wiki/%D0%92%D0%B8%D1%80%D1%82%D1%83%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D0%BA%D0%BE%D0%BD%D1%81%D0%BE%D0%BB%D1%8C}%
|
||||
{виртуальные консоли} (+/dev/tty1+ и т.д.)~--- их можно увидеть
|
||||
безо всякого дополнительного оборудования, просто переключившись
|
||||
на них из графического сеанса.
|
||||
|
||||
\item +serial-getty@.service+ обеспечивает поддержку всех прочих
|
||||
разновидностей терминалов, в том числе, подключаемых к
|
||||
последовательным портам (+/dev/ttyS0+ и т.д.). Этот шаблон имеет
|
||||
ряд отличий от +getty@.service+, в частности, переменная \verb+$TERM+
|
||||
в нем устанавливается в значение +vt102+ (должно хорошо работать
|
||||
на большинстве физических терминалов), а не~+linux+ (которое
|
||||
работаеть правильно только на виртуальных консолях), а также
|
||||
пропущены настройки, касающиеся очистки буфера прокрутки (и
|
||||
поэтому имеющие смысл только на VT).
|
||||
\end{itemize}
|
||||
|
||||
\subsection{Виртуальные консоли}
|
||||
|
||||
Рассмотрим механизм запуска +getty@.service+, обеспечивающий появление
|
||||
приглашений логина на виртуальных консолях (последовательны терминалы пока
|
||||
оставим в покое). По устоявшейся традиции, init-системы Linux обычно
|
||||
настраивались на запуск фиксированного числа экземпляров getty, как правило,
|
||||
шести (на первых шести виртуальных консолях, с +tty1+ по +tty6+).
|
||||
|
||||
В systemd мы сделали этот процесс более динамичным: чтобы добиться большей
|
||||
скорости и эффективности, мы запускаем дополнительные экземпляры getty только
|
||||
при необходимости. Например, +getty@tty2.service+ стартует только после того,
|
||||
как вы переключитесь на вторую виртуальную консоль. Отказавшись от
|
||||
обязательного запуска нескольких экземпляров getty, мы сэкономили немного
|
||||
системных ресурсов, а также сделали загрузку системы чуть-чуть быстрее. При
|
||||
этом, с точки зрения пользователя, все очень просто: как только он переключается
|
||||
на виртуальную консоль, на ней запускается getty, которая выводит приглашение к
|
||||
логину. Пользователь может и не~подозревать о том, что до момента переключения
|
||||
ничего этого не~было. Тем не~менее, если он войдет в систему и выполнит команду
|
||||
+ps+, он увидит, что getty запущены только на тех консолях, на которых он уже
|
||||
побывал.
|
||||
|
||||
По умолчанию, автоматический запуск getty производится на виртуальных консолях с
|
||||
первой по шестую (чтобы свести к минимуму отличия от привычной
|
||||
конфигурации)\footnote{Тем не~менее, это поведение можно легко изменить,
|
||||
задавая параметр +NAutoVTs=+ в файле
|
||||
\href{http://www.freedesktop.org/software/systemd/man/logind.conf.html}{logind.conf}.}
|
||||
Отметим, что автоматический запуск getty на конкретной консоли производится
|
||||
только при условии, что эта консоль не~занята другой программой. В частности,
|
||||
при интенсивном использовании механизма
|
||||
\href{https://en.wikipedia.org/wiki/Fast_user_switching}{быстрого переключения
|
||||
пользователей} графические сеансы могут занять первые несколько консолей (чтобы
|
||||
такое поведение не~заблокировало возможность запуска getty, мы предусмотрели
|
||||
специальную защиту, см. чуть ниже).
|
||||
|
||||
Две консоли играют особую роль: +tty1+ и +tty6+. +tty1+, при загрузке в
|
||||
графическом режиме, используется для запуска дисплейного менеджера, а при
|
||||
загрузке в многопользовательском текстовом режиме, systemd принудительно
|
||||
запускает на ней экземпляр getty, не~дожидаясь переключений\footnote{В данном
|
||||
случае нет принципиальной разницы между принудительным запуском и запуском по
|
||||
запросу: первая консоль используется по умолчанию, так что запрос на ее
|
||||
активацию обязательно поступит.}.
|
||||
|
||||
Что касается +tty6+, то она используется исключительно для автоматического
|
||||
запуска getty, и недоступна другим подсистемам, в частности, графическому
|
||||
серверу\footnote{При необходимости, вы можете легко поменять резервируемую
|
||||
консоль, используя параметр +ReserveVT=+ в файле
|
||||
\href{http://www.freedesktop.org/software/systemd/man/logind.conf.html}{logind.conf}.}
|
||||
Мы сделали так специально, чтобы гарантировать возможность входа в систему в
|
||||
текстовом режиме, даже если графический сервер займет более пяти консолей.
|
||||
|
||||
\subsection{Последовательные консоли}
|
||||
|
||||
Работа с последовательными консолями (и всеми остальными видами не-виртуальных
|
||||
консолей) реализована несколько иначе, чем с VT. По умолчанию, systemd запускает
|
||||
один экземпляр +serial-getty@.service+ на основной консоли ядра\footnote{Если
|
||||
для ядра настроен вывод в несколько консолей, \emph{основной} считается та, которая
|
||||
идет \emph{первой} в +/sys/class/tty/console/active+, т.е. указана
|
||||
\emph{последней} в строке параметров ядра.} (если она не~является виртуальной).
|
||||
Консолью ядра~--- это та консоль, на которую выводятся сообщения ядра. Обычно
|
||||
она настраивается в загрузчике, путем добавления к параметрам ядра аргумента
|
||||
наподобие +console=ttyS0+\footnote{Подробнее об этой опции см. в файле
|
||||
\href{https://www.kernel.org/doc/Documentation/kernel-parameters.txt}{kernel-parameters.txt}.}
|
||||
Таким образом, если пользователь перенаправил вывод ядра на последовательную
|
||||
консоль, то по завершении загрузки он увидит на этой консоли приглашение для
|
||||
логина\footnote{Отметим, что getty, а точнее, +agetty+ на такой консоли
|
||||
вызывается с параметром +-s+, и поэтому не~изменяет настроек символьной
|
||||
скорость (baud rate)~--- сохраняется то значение, которое было указано в строке
|
||||
параметров ядра.}. Кроме того, systemd выполняет поиск консолей, предоставляемых
|
||||
системами виртуализации, и запускает +serial-getty@.service+ на первой из этих
|
||||
консолей (+/dev/hvc0+, +/dev/xvc0+ или +/dev/hvsi0+). Такое поведение
|
||||
реализовано специальной
|
||||
\href{http://www.freedesktop.org/wiki/Software/systemd/Generators}{программой-генератором}~---
|
||||
\href{http://www.freedesktop.org/software/systemd/man/systemd-getty-generator.html}{systemd-getty-generator}.
|
||||
Генераторы запускаются в самом начале загрузки и автоматически настраивают
|
||||
различные службы в зависимости от различных факторов.
|
||||
|
||||
В большинстве случаев, вышеописанного механизма автоматической настройки должно
|
||||
быть достаточно, чтобы получить приглашение логина там, где нужно~--- без
|
||||
каких-либо дополнительных настроек systemd. Тем не~менее, иногда возникает
|
||||
необходимость в ручной настройке~--- например, когда необходимо запустить getty
|
||||
сразу на нескольких последовательных консолях, или когда вывод сообщений ядра
|
||||
направляется на один терминал, а управление производится с другого. Для решения
|
||||
таких задач достаточно определить по экземпляру +serial-getty@.service+ для
|
||||
каждого последовательного порта, на котором вы хотите запустить
|
||||
getty\footnote{Отметим, что +systemctl enable+ \emph{для экземпляров служб}
|
||||
работает только начиная с systemd версии 188 и старше (например, в Fedora 18). В
|
||||
более ранних версиях придется напрямую манипулировать символьными ссылками:
|
||||
\texttt{ln -s /usr/lib/systemd/system/serial-getty@.service
|
||||
/etc/systemd/system/getty.target.wants/serial-getty@ttyS2.service ; systemctl
|
||||
daemon-reload}.}:
|
||||
\begin{Verbatim}
|
||||
# systemctl enable serial-getty@ttyS2.service
|
||||
# systemctl start serial-getty@ttyS2.service
|
||||
\end{Verbatim}
|
||||
После выполнения этих команд, getty будет принудительно запускаться для
|
||||
указанных последовательных портов при всех последующих загрузках.
|
||||
|
||||
В некоторых ситуациях может возникнуть необходимость в тонкой настройке
|
||||
параметров getty (например, настроенная для ядра символьная скорость непригодна
|
||||
для интерактивного сеанса). Тогда просто скопируйте штатный шаблон юнита в
|
||||
каталог +/etc/systemd/system+ и отредактируйте полученную копию:
|
||||
\begin{Verbatim}
|
||||
# cp /usr/lib/systemd/system/serial-getty@.service /etc/systemd/system/serial-getty@ttyS2.service
|
||||
# vi /etc/systemd/system/serial-getty@ttyS2.service
|
||||
... редактируем параметры запуска agetty ...
|
||||
# ln -s /etc/systemd/system/serial-getty@ttyS2.service /etc/systemd/system/getty.target.wants/
|
||||
# systemctl daemon-reload
|
||||
# systemctl start serial-getty@ttyS2.service
|
||||
\end{Verbatim}
|
||||
В приведенном примере создает файл настроек, определяющий запуск getty на порту
|
||||
+ttyS2+ (это определяется именем, под которым мы скопировали файл~---
|
||||
+serial-getty@ttyS2.service+). Все изменения настроек, сделанные в этом файле,
|
||||
будут распространяться только на этот порт.
|
||||
|
||||
Собственно, это все, что я хотел рассказать о последовательных портах,
|
||||
виртуальных консолях и запуске getty на них. Надеюсь, рассказ получился
|
||||
интересным.
|
||||
|
||||
\section{Работа с Journal}
|
||||
|
||||
В свое время, я уже рассказывал о некоторых возможностях journal
|
||||
(см.~главу~\ref{sec:journal}), доступных из утилиты +systemctl+. Сейчас я
|
||||
попробую рассказать о journal более подробно, с упором на практическое
|
||||
применение его возможностей.
|
||||
|
||||
Если вы еще не~в курсе, что такое journal: это компонент
|
||||
\href{http://www.freedesktop.org/wiki/Software/systemd}{systemd}, регистрирующий
|
||||
сообщения из системного журнала (syslog), сообщения ядра (kernel log) и initrd,
|
||||
а также сообщения, которые процессы служб выводят на STDOUT и STDERR. Полученная
|
||||
информация индексируется и предоставляется пользователю по запросу. Journal
|
||||
может работать одновременно с традиционными демоном syslog (например, rsyslog
|
||||
или syslog-ng), либо полностью его заменять. Более подробно см. в
|
||||
\href{http://0pointer.de/blog/projects/the-journal.html}{первом анонсе}.
|
||||
|
||||
Journal был включен в Fedora начиная с F17. В Fedora~18 journal вырос в мощный и
|
||||
удобный механизм работы с системным журналом. Однако, и в~F17, и в~F18 journal
|
||||
по умолчанию сохраняет информацию только в небольшой кольцевой буфер в каталоге
|
||||
+/run/log/journal+. Как и все содержимое каталога +/run+, эта информация
|
||||
теряется при перезагрузке. Такой подход сильно ограничивает использование
|
||||
полезных возможностей journal, однако вполне достаточен для вывода актуальных
|
||||
сообщений от служб в +systemctl status+. Начиная с Fedora~19, мы собираемся
|
||||
включить сохранение логов на диск, в каталог +/var/log/journal+. При этом,
|
||||
логи смогут занимать гораздо больше места\footnote{Прим. перев.: В journal
|
||||
отдельно задаются ограничения на размер для логов во временном хранилище
|
||||
(+/run+) и в постоянном (+/var+). При превышении лимита старые журналы
|
||||
удаляются. Так как +/run+ размещается на tmpfs, т.е. в
|
||||
оперативной памяти, для временного хранения по умолчанию установлены более
|
||||
жесткие ограничения. При необходимости, соответствующие настройки можно задать
|
||||
в файле
|
||||
\href{http://www.freedesktop.org/software/systemd/man/journald.conf.html}{journald.conf}.},
|
||||
а значит, смогут вместить больше полезной информации. Таким образом, journal
|
||||
станет еще более удобным.
|
||||
|
||||
\subsection{Сохранение логов на диск}
|
||||
|
||||
В F17 и~F18 вы можете включить сохранение логов на диск вручную:
|
||||
\begin{Verbatim}
|
||||
# mkdir -p /var/log/journal
|
||||
\end{Verbatim}
|
||||
После этого рекомендуется перезагрузить систему, чтобы заполнить журнал овыми
|
||||
записями.
|
||||
|
||||
Так как теперь у вас есть journal, syslog вам больше не~нужен (кроме ситуаций,
|
||||
когда вам совершенно необходимо иметь +/var/log/messages+ в текстовом виде), и
|
||||
вы спокойно можете удалить его:
|
||||
\begin{Verbatim}
|
||||
# yum remove rsyslog
|
||||
\end{Verbatim}
|
||||
|
||||
\subsection{Основы}
|
||||
|
||||
Итак, приступим. Нижеприведенный текст демонстрирует возможности systemd~195,
|
||||
входящего в Fedora~18\footnote{Обновление со 195-й версией systemd в настоящее
|
||||
время находится
|
||||
\href{https://admin.fedoraproject.org/updates/FEDORA-2012-16709/systemd-195-1.fc18}{на
|
||||
тестировании} и вскоре будет включено в состав Fedora~18.}, так что, если
|
||||
некоторые из описанных трюков не~сработают в F17~--- пожалуйста, дождитесь F18.
|
||||
|
||||
Начнем с основ. Доступ к логам journal осуществляется через утилиту
|
||||
\href{http://www.freedesktop.org/software/systemd/man/journalctl.html}{journalctl(1)}.
|
||||
Чтобы просто взглянуть на лог, достаточно ввести
|
||||
\begin{Verbatim}
|
||||
# journalctl
|
||||
\end{Verbatim}
|
||||
Если вы выполнили эту команду с полномочиями root, вы увидите все
|
||||
журнальные сообщения, включая исходящие как от системных компонентов, так и от
|
||||
залогиненных пользователей. Вывод этой команды форматируется в стиле
|
||||
+/var/log/messages+, однако в нем добавлены кое-какие улучшения:
|
||||
\begin{itemize}
|
||||
\item Строки с приоритетом error и выше подсвечены красным.
|
||||
\item Строки с приоритетом notice и warning выделены жирным шрифтом.
|
||||
\item Все отметки времени сформированы с учетом вашего часового пояса.
|
||||
\item Для навигации по тексту используется просмотрщик (pager), по
|
||||
умолчанию +less+.
|
||||
\item Выводятся \emph{все} доступные данные, включая информацию из
|
||||
файлов, прошедших ротацию (rotated logs).
|
||||
\item Загрузка системы отмечается специальной строкой, отделяющей
|
||||
записи, сгенерированные между (пере)загрузками.
|
||||
\end{itemize}
|
||||
|
||||
Отметим, что в данной статье не~приводятся примеры такого вывода~--- прежде
|
||||
всего, для краткости изложения, но также и для того, чтобы дать вам повод
|
||||
поскорее попробовать Fedora~18 с systemd~195. Надеюсь, вы поймете суть и так.
|
||||
|
||||
\subsection{Контроль доступа}
|
||||
|
||||
Итак, мы получили удобный и эффективный метод просмотра логов. Но для полного
|
||||
доступа к системным сообщениям требуются привилегии root, что не~всегда
|
||||
удобно~--- в наше время администраторы предпочитают работать от имени
|
||||
непривилегированного пользователя, переключаясь на root только при крайней
|
||||
необходимости. По умолчанию, непривилегированные пользователи могут
|
||||
просматривать в journal только свои собственные логи (сообщения, сгенерированные
|
||||
их процессами). Чтобы предоставить пользователю доступ ко всем системным логам,
|
||||
нужно включить его в группу +adm+:
|
||||
\begin{Verbatim}
|
||||
# usermod -a -G adm lennart
|
||||
\end{Verbatim}
|
||||
Разлогинившись, а затем вновь залогинившись под именем +lennart+\footnote{Прим.
|
||||
перев.: Для того, чтобы обновить групповые полномочия в уже запущенных сеансах,
|
||||
можно воспользоваться командой
|
||||
\href{http://linux.die.net/man/1/newgrp}{newgrp(1)}: +newgrp adm+.}, я могу
|
||||
просматривать сообщения от всех пользователей и системных
|
||||
компонентов\footnote{Прим. перев.: Группа +adm+ была выбрана на основании опыта
|
||||
дистрибутива Debian, в котором она устанавливается в качестве группы-владельца
|
||||
большинства лог-файлов. При этом авторы четко разделяют полномочия групп +adm+ и
|
||||
+wheel+: если последняя используется для предоставления прав \emph{изменять}
|
||||
что-либо в системе, то первая дает возможность лишь \emph{просматривать}
|
||||
системную информацию.}:
|
||||
\begin{Verbatim}
|
||||
$ journalctl
|
||||
\end{Verbatim}
|
||||
|
||||
\subsection{Отслеживание логов в реальном времени}
|
||||
|
||||
Когда вы запускаете программу +journalctl+ без параметров, она выводит все
|
||||
сообщения, сгенерированные на текущий момент. Однако, иногда бывает полезно
|
||||
отслеживать их появление в режиме реального времени. В классической реализации
|
||||
syslog это осуществлялось командой +tail -f /var/log/messages+. В journal ее
|
||||
аналог выглядит так:
|
||||
\begin{Verbatim}
|
||||
$ journalctl -f
|
||||
\end{Verbatim}
|
||||
И работает он точно так же: выводит последние десять сообщений, после чего
|
||||
переходит в режим ожидания, и выводит новые сообщения по мере их появления.
|
||||
|
||||
\subsection{Простейшие методы выборки записей}
|
||||
|
||||
При вызове +journalctl+ без параметров, она выводит все сообщения, начиная с
|
||||
самого первого из сохраненных. Разумеется, это огромный объем информации. На
|
||||
практике иногда бывает достаточно ограничиться сообщениями, сгенерированными с
|
||||
момента последней загрузки системы:
|
||||
\begin{Verbatim}
|
||||
$ journalctl -b
|
||||
\end{Verbatim}
|
||||
Но часто даже после такой фильтрации записей остается довольно много. Что ж, мы
|
||||
можем ограничиться только наиболее важными. Итак, все сообщения с приоритетом
|
||||
error и выше, начиная с момента последней загрузки:
|
||||
\begin{Verbatim}
|
||||
$ journalctl -b -p err
|
||||
\end{Verbatim}
|
||||
|
||||
Если вы уже успели перезагрузить систему после того, как произошли интересующие
|
||||
вас события, целесообразнее будет воспользоваться выборкой по времени:
|
||||
\begin{Verbatim}
|
||||
$ journalctl --since=yesterday
|
||||
\end{Verbatim}
|
||||
В результате мы увидим все сообщения, зарегистрированные начиная со вчерашнего
|
||||
дня вплоть до настоящего момента. Прекрасно! Разумеется, этот критерий отбора можно
|
||||
комбинировать с другими, например, с +-p err+. Но, допустим, нам нужно узнать о
|
||||
чем-то, что случилось либо 15-го октября, либо 16-го:
|
||||
\begin{Verbatim}
|
||||
$ journalctl --since=2012-10-15 --until="2011-10-16 23:59:59"
|
||||
\end{Verbatim}
|
||||
Отлично, мы нашли то, что искали. Но вот вам сообщают, что сегодня ранним утром
|
||||
наблюдались проблемы с CGI-скриптами Apache. Ладно, послушаем, что нам скажет
|
||||
индеец:
|
||||
\begin{Verbatim}
|
||||
$ journalctl -u httpd --since=00:00 --until=9:30
|
||||
\end{Verbatim}
|
||||
Да, мы нашли это. Хм, похоже, что причиной стала проблема с диском +/dev/sdc+.
|
||||
Посмотрим, что с ним случилось:
|
||||
\begin{Verbatim}
|
||||
$ journalctl /dev/sdc
|
||||
\end{Verbatim}
|
||||
Кошмар, ошибка ввода-вывода!\footnote{Ну ладно, признаюсь, здесь я немножко
|
||||
считерил. Индексирование сообщений ядра по блочным устройствам пока что
|
||||
не~принято в апстрим, но Ганс
|
||||
\href{http://www.spinics.net/lists/linux-scsi/msg62499.html}{проделал огромную
|
||||
работу}, чтобы реализовать эту функциональность, и я надеюсь, что к релизу F18
|
||||
все будет.} Нужно срочно заменить диск, пока не~начались более серьезные
|
||||
проблемы. Ладно, пошли дальше. Что у нас там случилось с процессом vpnc?
|
||||
\begin{Verbatim}
|
||||
$ journalctl /usr/sbin/vpnc
|
||||
\end{Verbatim}
|
||||
Хм, ничего подозрительного. Но, кажется, проблема где-то во взаимодействии между
|
||||
+vpnc+ и +dhclient+. Посмотрим объединенный и отсортированный по времени список
|
||||
сообщений от этих процессов:
|
||||
\begin{Verbatim}
|
||||
$ journalctl /usr/sbin/vpnc /usr/sbin/dhclient
|
||||
\end{Verbatim}
|
||||
Отлично, мы нашли причину проблемы!
|
||||
|
||||
\subsection{Продвинутые методы выборки}
|
||||
|
||||
Да, это все, конечно, здорово, но попробуем подняться еще на ступеньку выше.
|
||||
Чтобы понять описанные ниже приемы, нужно знать, что systemd добавляет к
|
||||
каждой лог-записи ряд скрытых метаданных. Эти метаданные по структуре напоминают
|
||||
набор переменных окружения, хотя на самом деле дают даже больше возможностей:
|
||||
во-первых, метаданные могут включать большие бинарные блоки данных (впрочем, это
|
||||
скорее исключение~--- обычно они содержат текст в кодировке UTF-8), и во-вторых,
|
||||
в пределах одной записи поле метаданных может содержать сразу несколько
|
||||
значений (и это тоже встречается нечасто~--- обычно поля содержат по одному
|
||||
значению). Эти метаданные автоматически собираются и добавляются для каждой
|
||||
лог-записи, безо всякого участия пользователя. И вы легко можете их использовать
|
||||
для более тонкой выборки записей. Посмотрим, как они выглядят:
|
||||
\begin{Verbatim}
|
||||
$ journalctl -o verbose -n1
|
||||
Tue, 2012-10-23 23:51:38 CEST [s=ac9e9c423355411d87bf0ba1a9b424e8;i=4301;b=5335e9cf5d954633bb99aefc0ec38c25;m=882ee28d2;t=4ccc0f98326e6;x=f21e8b1b0994d7ee]
|
||||
PRIORITY=6
|
||||
SYSLOG_FACILITY=3
|
||||
_MACHINE_ID=a91663387a90b89f185d4e860000001a
|
||||
_HOSTNAME=epsilon
|
||||
_TRANSPORT=syslog
|
||||
SYSLOG_IDENTIFIER=avahi-daemon
|
||||
_COMM=avahi-daemon
|
||||
_EXE=/usr/sbin/avahi-daemon
|
||||
_SYSTEMD_CGROUP=/system/avahi-daemon.service
|
||||
_SYSTEMD_UNIT=avahi-daemon.service
|
||||
_SELINUX_CONTEXT=system_u:system_r:avahi_t:s0
|
||||
_UID=70
|
||||
_GID=70
|
||||
_CMDLINE=avahi-daemon: registering [epsilon.local]
|
||||
MESSAGE=Joining mDNS multicast group on interface wlan0.IPv4 with address 172.31.0.53.
|
||||
_BOOT_ID=5335e9cf5d954633bb99aefc0ec38c25
|
||||
_PID=27937
|
||||
SYSLOG_PID=27937
|
||||
_SOURCE_REALTIME_TIMESTAMP=1351029098747042
|
||||
\end{Verbatim}
|
||||
(Чтобы не~утомлять вас огромным количеством текста, ограничимся одной записью.
|
||||
Ключ +-n+ позволяет задать число выводимых записей, в нашем случае 1. Если
|
||||
указать его без параметра, будут показаны 10 последних записей.)
|
||||
|
||||
Задав параметр +-o verbose+, мы переключили формат вывода~--- теперь, вместо
|
||||
скупых строчек, копирующих +/var/log/messages+, для каждой записи выводится
|
||||
полный перечень всех метаданных. В том числе, информация о пользователе и
|
||||
группе, контекст SELinux, идентификатор компьютера и т.д. Полный список
|
||||
общеизвестных полей метаданных приведен на соответствующей
|
||||
\href{http://www.freedesktop.org/software/systemd/man/systemd.journal-fields.html}%
|
||||
{странице руководства}.
|
||||
|
||||
И база данных Journal индексируется по \emph{всем} этим полям! И мы можем
|
||||
использовать любое из них в качестве критерия выборки:
|
||||
\begin{Verbatim}
|
||||
$ journalctl _UID=70
|
||||
\end{Verbatim}
|
||||
Как нетрудно догадаться, в результате будут выведены все сообщения от
|
||||
процессов пользователя с UID 70. При необходимости, критерии можно
|
||||
комбинировать:
|
||||
\begin{Verbatim}
|
||||
$ journalctl _UID=70 _UID=71
|
||||
\end{Verbatim}
|
||||
Указание двух значений для одного и того же поля эквивалентно логическому ИЛИ.
|
||||
Таким образом, будут выведены записи как от процессов с UID 70, так и от
|
||||
процессов с UID 71.
|
||||
\begin{Verbatim}
|
||||
$ journalctl _HOSTNAME=epsilon _COMM=avahi-daemon
|
||||
\end{Verbatim}
|
||||
А указание двух \emph{различных} полей дает эффект логического И. В результате,
|
||||
будут выведены записи только от процесса +avahi-daemon+, работающего на хосте с
|
||||
именем +epsilon+.
|
||||
|
||||
Но мы этим не~ограничимся! Мы же суровые компьютерщики, мы хотим использовать
|
||||
сложные логические выражения!
|
||||
\begin{Verbatim}
|
||||
$ journalctl _HOSTNAME=theta _UID=70 + _HOSTNAME=epsilon _COMM=avahi-daemon
|
||||
\end{Verbatim}
|
||||
При помощи плюса мы можем явно задать логическое ИЛИ, применяя его к разным
|
||||
полям и даже И-выражениям. Поэтому наш пример выведет как записи с хоста
|
||||
+theta+ от процессов с UID 70, так и с хоста +epsilon+ от процесса
|
||||
+avahi-daemon+\footnote{Прим. перев.: Стоит отметить, что приоритет логических
|
||||
операций стандартный: сначала выполняются операции И, и только потом~---
|
||||
операции ИЛИ. Используемая в +journalctl+ система записи выражений аналогична
|
||||
принятой в классической алгебре: умножение (имеющее более высокий приоритет)
|
||||
не~указывается знаком операции, а обозначается просто последовательной
|
||||
записью величин.}.
|
||||
|
||||
\subsection{И немного магии}
|
||||
|
||||
Уже неплохо, правда? Но есть один недостаток~--- мы же не~сможем запомнить все
|
||||
возможные значения все полей журнала! Для этого была бы нужна очень хорошая
|
||||
память. Но +journalctl+ вновь приходит к нам на помощь:
|
||||
\begin{Verbatim}
|
||||
$ journalctl -F _SYSTEMD_UNIT
|
||||
\end{Verbatim}
|
||||
Эта команда выведет все значения поля +_SYSTEMD_UNIT+, зарегистрированные в базе
|
||||
данных журнала на текущий момент. То есть, имена всех юнитов +systemd+, которые
|
||||
писали что-либо в журнал. Аналогичный запрос работает для всех полей, так что
|
||||
найти точное значение для выборки по нему~--- уже не~проблема. Но тут самое
|
||||
время сообщить вам, что эта функциональность встроена в механизм автодополнения
|
||||
оболочки\footnote{Прим. перев.: В исходной статье речь идет только о bash,
|
||||
однако, начиная с релиза systemd 196, аналогичная функциональность доступна и
|
||||
для zsh.}! Это же просто прекрасно~--- вы можете просмотреть перечень значений
|
||||
поля и выбрать из него нужно прямо при вводе выражения. Возьмем для примера
|
||||
метки SELinux. Помнится, имя поле начиналось с букв SE\ldots{}
|
||||
\begin{Verbatim}[commandchars=\\\{\}]
|
||||
$ journalctl _SE\textbf{<TAB>}
|
||||
\end{Verbatim}
|
||||
и оболочка сразу же дополнит:
|
||||
\begin{Verbatim}
|
||||
$ journalctl _SELINUX_CONTEXT=
|
||||
\end{Verbatim}
|
||||
Отлично, и какое там значение нам нужно?
|
||||
\begin{Verbatim}[fontsize=\small]
|
||||
$ journalctl _SELINUX_CONTEXT=<TAB><TAB>
|
||||
kernel system_u:system_r:rtkit_daemon_t:s0
|
||||
system_u:system_r:accountsd_t:s0 system_u:system_r:syslogd_t:s0
|
||||
system_u:system_r:avahi_t:s0 system_u:system_r:system_cronjob_t:s0-s0:c0.c1023
|
||||
system_u:system_r:bluetooth_t:s0 system_u:system_r:system_dbusd_t:s0-s0:c0.c1023
|
||||
system_u:system_r:chkpwd_t:s0-s0:c0.c1023 system_u:system_r:systemd_logind_t:s0
|
||||
system_u:system_r:chronyd_t:s0 system_u:system_r:systemd_tmpfiles_t:s0
|
||||
system_u:system_r:crond_t:s0-s0:c0.c1023 system_u:system_r:udev_t:s0-s0:c0.c1023
|
||||
system_u:system_r:devicekit_disk_t:s0 system_u:system_r:virtd_t:s0-s0:c0.c1023 c0.c1023
|
||||
system_u:system_r:dhcpc_t:s0 system_u:system_r:vpnc_t:s0 sd_t:s0-s0:c0.c1023
|
||||
system_u:system_r:dnsmasq_t:s0-s0:c0.c1023 system_u:system_r:xdm_t:s0-s0:c0.c1023
|
||||
system_u:system_r:init_t:s0 unconfined_u:system_r:rpm_t:s0-s0:c0.c1023
|
||||
system_u:system_r:local_login_t:s0-s0:c0.c1023 unconfined_u:system_r:unconfined_t:s0-s0:c0.c1023
|
||||
system_u:system_r:lvm_t:s0 unconfined_u:system_r:useradd_t:s0-s0:c0.c1023
|
||||
system_u:system_r:modemmanager_t:s0-s0:c0.c1023 unconfined_u:unconfined_r:unconfined_dbusd_t:s0-s0:c0.c1023
|
||||
system_u:system_r:NetworkManager_t:s0 unconfined_u:unconfined_r:unconfined_t:s0-s0:c0.c1023
|
||||
system_u:system_r:policykit_t:s0
|
||||
\end{Verbatim}
|
||||
Ага, нас интересуют записи с меткой PolicyKit! Пользуясь дополнением, вводим:
|
||||
\begin{Verbatim}
|
||||
$ journalctl _SELINUX_CONTEXT=system_u:system_r:policykit_t:s0
|
||||
\end{Verbatim}
|
||||
Очень просто, не~правда ли! Пожалуй, самое простое из действий, связанных с
|
||||
SELinux ;-) Разумеется, такое дополнение работает для всех полей Journal.
|
||||
|
||||
На сегодня все. Впрочем, на странице руководства
|
||||
\href{http://www.freedesktop.org/software/systemd/man/journalctl.html}%
|
||||
{journalctl(1)} можно узнать и о многих других возможностях, не~описанных здесь.
|
||||
Например, о том, что +journalctl+ может выводить данные в формате JSON, или в
|
||||
формате +/var/log/messages+, но с относительными метками времени, как в dmesg.
|
||||
|
||||
\section{Управление ресурсами с помощью cgroups}
|
||||
|
||||
Важную роль в современных компьютерных системах играют механизмы управления
|
||||
использованием ресурсов: когда вы запускаете на одной системе несколько
|
||||
программ, возникает необходимость распределять между ними ресурсы системы,
|
||||
в соответствии с некоторыми правилами. В частности, это особенно актуально на
|
||||
маломощных встраиваемых и мобильных системах, обладающих очень скудными
|
||||
ресурсами. Но та же задача актуальна и для очень мощных вычислительных
|
||||
кластеров, которые располагают огромными ресурсами, но при это несут и огромную
|
||||
вычислительную нагрузку.
|
||||
|
||||
Исторически, в Linux поддерживался только одна схема управления ресурсами: все
|
||||
процессы получают примерно равные доли процессорного времени или потока
|
||||
ввода-вывода. При необходимости соотношение этих долей можно изменить при
|
||||
помощи значения \emph{nice}, задаваемого для каждого процесса. Такой подход
|
||||
очень прост, и на протяжении долгих лет покрывал все нужды пользователей Linux.
|
||||
Но у него есть существенный недостаток: он оперирует лишь отдельными процессами,
|
||||
но не~их группами. В результате, например, веб-сервер Apache с множеством
|
||||
CGI-процессов при прочих равных получает гораздо больше ресурсов, чем служба
|
||||
syslog, у которой не~так много процессов.
|
||||
|
||||
В процессе проектирования архитектуры systemd, мы практически сразу поняли, что
|
||||
управление ресурсов должно быть одной из его базовых функций, заложенных в
|
||||
основы его структуры. В современной системе~--- неважно, серверной или
|
||||
встраиваемой~--- контроль использования процессора, памяти и ввода-вывода для
|
||||
различных служб нельзя добавлять задним числом. Такая функциональность должна
|
||||
быть доступна изначально, через базовые настройки запуска служб. При этом,
|
||||
ресурсы должны распределяться на уровне служб, а не~процессов, как это делалось
|
||||
при помощи значений nice или \href{http://linux.die.net/man/2/setrlimit}{POSIX
|
||||
Resource Limits}.
|
||||
|
||||
В этой статье я попробую рассказать о методах управления механизмами
|
||||
распределения ресурсов между службами systemd. Эта функциональность присутствует
|
||||
в systemd уже долгое время, и давно пора рассказать о ней пользователям и
|
||||
администраторам.
|
||||
|
||||
В свое время я
|
||||
\href{http://0pointer.de/blog/projects/cgroups-vs-cgroups.html}{пояснял}%
|
||||
\footnote{Прим. перев.: В указанном документе автор рассказывает, что
|
||||
контрольные группы Linux состоят из двух сущностей: \textbf{(A)} механизма
|
||||
иерархической группировки и маркировки процессов, и \textbf{(B)} механизма,
|
||||
позволяющего распределять ресурсы между полученными группами. Для работы (B)
|
||||
необходимо (A), но не~наоборот~--- (A) может прекрасно работать без (B). Для
|
||||
нормально функционирования systemd (A) \emph{необходим}, а (B) опционален (он
|
||||
лишь обеспечивает работу некоторых настроек). Вы можете собрать ядро только с
|
||||
необходимой для (A) опцией +CONFIG_CGROUPS=y+, отключив все связанные с (B)
|
||||
опции (такие как {\tiny +CONFIG_CGROUP_FREEZER=y+, +CONFIG_CGROUP_DEVICE=y+,
|
||||
+CONFIG_CGROUP_CPUACCT=y+, +CONFIG_CGROUP_MEM_RES_CTLR=y+,
|
||||
+CONFIG_CGROUP_MEM_RES_CTLR_SWAP=y+, +CONFIG_CGROUP_MEM_RES_CTLR_KMEM=y+,
|
||||
+CONFIG_CGROUP_PERF=y+, +CONFIG_CGROUP_SCHED=y+, +CONFIG_BLK_CGROUP=y+,
|
||||
+CONFIG_NET_CLS_CGROUP=y+, +CONFIG_NET_PRIO_CGROUP=y+}), и systemd будет
|
||||
нормально работать на такой системе (за исключением того, что связанные с этими
|
||||
контроллерами настройки не~будут срабатывать). Однако, если собрать ядро без
|
||||
+CONFIG_CGROUPS=y+, функциональность systemd будет сильно ограничена. При этом,
|
||||
автор особо подчеркивает, что все негативные эффекты влияния контрольных групп
|
||||
на производительность обусловлены именно (B), в то время как (A) на
|
||||
производительность практически не~влияет.}, что контрольные группы Linux
|
||||
(cgroups) могут работать и как механизм группировки и отслеживания процессов, и
|
||||
как инструмент управления использованием ресурсов. Для функционирования systemd
|
||||
необходим только первый из этих режимов, а второй опционален. И именно этот
|
||||
опциональный второй режим дает вам возможность распределять ресурсы между
|
||||
службами. (А сейчас очень рекомендую вам, прежде чем продолжать чтение этой
|
||||
статьи, ознакомиться с \href{https://en.wikipedia.org/wiki/Cgroups}{базовой
|
||||
информацией о cgroups}. Хотя дальнейшие рассуждения и не~будут затрагивать
|
||||
низкоуровневые аспекты, все же будет лучше, если у вас сформируется некоторое
|
||||
представление о них.)
|
||||
|
||||
Основными контроллерами cgroups, отвечающими за управление ресурсами, являются
|
||||
\href{http://www.kernel.org/doc/Documentation/scheduler/sched-design-CFS.txt}{cpu},
|
||||
\href{http://www.kernel.org/doc/Documentation/cgroups/memory.txt}{memory} и
|
||||
\href{http://www.kernel.org/doc/Documentation/cgroups/blkio-controller.txt}{blkio}.
|
||||
Для их использования необходимо, чтобы они были включены на этапе сборки ядра;
|
||||
большинство дистрибутивов (в том числе и Fedora), включают их в штатных ядрах.
|
||||
systemd предоставляет ряд высокоуровневых настроек, позволяющих использовать эти
|
||||
контроллеры, не~вникая в технические детали их работы.
|
||||
|
||||
\subsection{Процессор}
|
||||
|
||||
Если в ядре включен контроллер +cpu+, systemd по умолчанию создает контрольную
|
||||
группу по этому ресурсу для каждой службы. Даже без каких-либо дополнительных
|
||||
настроек это дает положительных эффект: на системе под управлением systemd все
|
||||
службы получают равные доли процессорного времени, независимо от количества
|
||||
процессов, запущенных в рамках службы. Например, на вашем веб-сервере MySQL с
|
||||
несколькими рабочими процессами получит такую же долю процессорного времени,
|
||||
как и Apache, даже если тот запустил 1000 CGI-процессов. Разумеется, такое
|
||||
поведение при необходимости можно легко отключить~--- см. опцию
|
||||
\href{http://0pointer.de/public/systemd-man/systemd.conf.html}{DefaultControllers=}
|
||||
в файле +/etc/systemd/system.conf+.
|
||||
|
||||
Если \emph{равномерное} распределение процессорного времени между службами вас
|
||||
не~устраивает, и вы хотите выделить определенным службам больше или меньше
|
||||
времени~--- используйте опцию
|
||||
\href{http://0pointer.de/public/systemd-man/systemd.exec.html}{CPUShares} в
|
||||
конфигурационном файле службы. По умолчанию это значение равно 1024. Увеличивая
|
||||
это число, вы даете службе больше процессорного времени, уменьшая~---
|
||||
соответственно, меньше.
|
||||
|
||||
Рассмотрим небольшой практический пример. Допустим, вам нужно увеличить
|
||||
для службы Apache относительную долю потребления процессора до 1500. Для этого
|
||||
создаем файл <<ручных>> настроек +/etc/systemd/system/httpd.service+, который
|
||||
включает в себя все те же опции, что и файл настроек по умолчанию
|
||||
+/usr/lib/systemd/system/httpd.service+, отличаясь от него только значением
|
||||
+CPUShares=+:
|
||||
\begin{Verbatim}
|
||||
.include /usr/lib/systemd/system/httpd.service
|
||||
|
||||
[Service]
|
||||
CPUShares=1500
|
||||
\end{Verbatim}
|
||||
Первая строка обеспечивает включение в нашу конфигурацию файла с настройками по
|
||||
умолчанию, сделанными разработчиками Apache или его сопровождающими в вашем
|
||||
дистрибутиве (если это включение не~указать явно, данный файл будет проигнорирован).
|
||||
Далее, мы указываем тот параметр, который хотим изменить. Сохраняем файл,
|
||||
приказываем systemd перечитать конфигурацию, и перезапускаем Apache, чтобы
|
||||
настройки вступили в силу\footnote{Прим. перев.: К сожалению, в настоящее время
|
||||
systemd не~поддерживает изменение параметров контрольных групп без перезапуска
|
||||
службы. Но вы можете узнать контрольную группу службы командой наподобие
|
||||
+systemctl show -p ControlGroup avahi-daemon.service+, и выполнить настройки
|
||||
любым удобным для вас способом, например, через запись значений в псевдофайлы
|
||||
cgroupfs. Разумеется, при следующем запуске службы к ней будут применены
|
||||
параметры, указанные в конфигурационном файле.}:
|
||||
\begin{Verbatim}
|
||||
systemctl daemon-reload
|
||||
systemctl restart httpd.service
|
||||
\end{Verbatim}
|
||||
Готово!
|
||||
|
||||
Обратите внимание, что явное указание значения +CPUShares=+ в конфигурации
|
||||
службы заставит systemd создать для нее контрольную группу в иерархии контроллера
|
||||
+cpu+, даже если этот контроллер не~указан в +DefaultControllers=+ (см. выше).
|
||||
|
||||
\subsection{Отслеживание использования ресурсов}
|
||||
|
||||
Для того, чтобы правильно распределять ресурсы между службами, неплохо бы знать
|
||||
реальные потребности этих служб. Чтобы упростить для вас отслеживание
|
||||
потребления ресурсов службами, мы подготовили утилиту
|
||||
\href{http://www.freedesktop.org/software/systemd/man/systemd-cgtop.html}{systemd-cgtop},
|
||||
которая находит все имеющиеся в системе контрольные группы, определяет для
|
||||
каждой из них количество потребляемых ресурсов (процессорное время, память и
|
||||
ввод-вывод) и выводит эти данные в динамически обновляемой сводной таблице, по аналогии
|
||||
с программой \href{http://linux.die.net/man/1/top}{top}. Используя вводимое
|
||||
systemd распределение служб по контрольным группам, эта утилита выводит для
|
||||
служб те же сведения, которые top выводит для отдельных процессов.
|
||||
|
||||
К сожалению, по умолчанию +cgtop+ может раздельно отслеживать для каждой службы
|
||||
только потребление процессорного времени, а сведения по использованию памяти и
|
||||
ввода-вывода доступны только для всей системы в целом. Это ограничение возникает
|
||||
из-за того, что в конфигурации по умолчанию контрольные группы для служб
|
||||
создаются только в иерархии контроллера +cpu+, но не~+memory+ и~+blkio+. Без
|
||||
создания групп в иерархии этих контроллеров невозможно отследить использование
|
||||
ресурса по службам. Самый простой способ обойти это ограничение~--- приказать
|
||||
systemd создавать соответствующие группы, добавив +memory+ и +blkio+ в перечень
|
||||
+DefaultControllers=+ в файле +system.conf+.
|
||||
|
||||
\subsection{Память}
|
||||
|
||||
Используя опции +MemoryLimit=+ и +MemorySoftLimit=+, вы можете ограничивать
|
||||
суммарное потребление оперативной памяти всеми процессами службы. В них
|
||||
указывается предел потребления памяти в байтах\footnote{Прим. перев.: Разница
|
||||
между +MemorySoftLimit=+ и +MemoryLimit=+ состоит в том, что первый предел можно
|
||||
превышать, если в системе еще есть достаточное количество свободной памяти.
|
||||
Второй из этих пределов превышать нельзя, независимо от наличия свободной
|
||||
памяти. Подробнее см. раздел <<Soft limits>> в
|
||||
\href{http://www.kernel.org/doc/Documentation/cgroups/memory.txt}{файле
|
||||
документации}.}. При этом поддерживаются суффиксы K, M, G и T, обозначающие
|
||||
соответственно, килобайт, мегабайт, гигабайт и терабайт (по основанию 1024).
|
||||
\begin{Verbatim}
|
||||
.include /usr/lib/systemd/system/httpd.service
|
||||
|
||||
[Service]
|
||||
MemoryLimit=1G
|
||||
\end{Verbatim}
|
||||
|
||||
По аналогии с +CPUShares=+, явное указание этих опций заставит systemd создать
|
||||
для службы контрольную группу в иерархии контроллера +memory+, даже если он
|
||||
не~был указан в +DefaultControllers=+.
|
||||
|
||||
\subsection{Ввод-вывод}
|
||||
|
||||
Для контроля пропускной полосы ввода-вывода с блочных устройств, доступно
|
||||
несколько настроек. Первая из них~--- +BlockIOWeight=+, задающая \emph{долю} полосы
|
||||
ввода-вывода для указанной службы. Принцип похож на +CPUShares=+ (см. выше), однако
|
||||
здесь величина относительной доли ограничена значениями от 10 до 1000. По
|
||||
умолчанию, она равна 1000. Уменьшить долю для службы Apache можно так:
|
||||
\begin{Verbatim}
|
||||
.include /usr/lib/systemd/system/httpd.service
|
||||
|
||||
[Service]
|
||||
BlockIOWeight=500
|
||||
\end{Verbatim}
|
||||
|
||||
При необходимости, вы можете задать это значение отдельно для каждого
|
||||
устройства:
|
||||
\begin{Verbatim}
|
||||
.include /usr/lib/systemd/system/httpd.service
|
||||
|
||||
[Service]
|
||||
BlockIOWeight=/dev/disk/by-id/ata-SAMSUNG_MMCRE28G8MXP-0VBL1_DC06K01009SE009B5252 750
|
||||
\end{Verbatim}
|
||||
|
||||
При этом, точное название устройства знать не~обязательно~--- достаточно указать
|
||||
интересующий вас каталог:
|
||||
\begin{Verbatim}
|
||||
.include /usr/lib/systemd/system/httpd.service
|
||||
|
||||
[Service]
|
||||
BlockIOWeight=/home/lennart 750
|
||||
\end{Verbatim}
|
||||
Если заданный вами путь не~указывает на файл устройства, systemd автоматически
|
||||
определит, на каком устройстве расположен указанный файл/каталог, и выставит для
|
||||
этого устройства соответствующую настройку.
|
||||
|
||||
Вы можете добавить несколько таких строк, задавая долю пропускной полосы
|
||||
отдельно для различных устройств, и при этом также допускается указать <<общее>>
|
||||
значение (как в первом примере), которое будет использовано для всех остальных
|
||||
устройств.
|
||||
|
||||
В качестве альтернативы относительной доле пропускной полосы, вы также можете
|
||||
ограничивать абсолютную долю, используя настройки +BlockIOReadBandwidth=+ и
|
||||
+BlockIOWriteBandwidth=+. В них нужно указать устройство или любой находящийся
|
||||
на нем файл/каталог, а также предельную скорость чтения/записи в байтах в
|
||||
секунду:
|
||||
\begin{Verbatim}
|
||||
.include /usr/lib/systemd/system/httpd.service
|
||||
|
||||
[Service]
|
||||
BlockIOReadBandwith=/var/log 5M
|
||||
\end{Verbatim}
|
||||
В результате, для данной службы скорость чтения с устройства, содержащего
|
||||
каталог +/var/log+, будет ограничена величиной 5 мегабайт в секунду.
|
||||
|
||||
По аналогии с вышеописанными +CPUShares=+ и +MemoryLimit=+, явное указание любой
|
||||
из приведенных настроек пропускной полосы заставит systemd создать для службы
|
||||
контрольную группу в иерархии контроллера +blkio+.
|
||||
|
||||
\subsection{Прочие параметры}
|
||||
|
||||
Вышеописанные опции покрывают лишь малую толику настроек, поддерживаемых
|
||||
различными контроллерами Linux croups. Мы добавили высокоуровневый интерфейс
|
||||
только к тем настройкам, которые кажутся нам наиболее важным для большинства
|
||||
пользователей. Из соображений удобства мы добавили механизмы, обеспечивающие
|
||||
поддержку крупных единиц измерения (килобайты, мегабайты и т.д.) и
|
||||
автоматическое определение блочных устройств по указанному файлу/каталогу.
|
||||
|
||||
В некоторых случаях описанных высокоуровневых настроек может оказаться
|
||||
недостаточно~--- допустим, вам нужно задать низкоуровневую настройку cgroups,
|
||||
для которой мы (пока) не~добавили высокоуровневого аналога. На этот случай мы
|
||||
предусмотрели универсальных механизм задания таких опций в конфигурационных
|
||||
файлах юнитов. Рассмотрим, например, задание для службы параметра
|
||||
\emph{swappiness} (относительная интенсивность использования подкачки для
|
||||
процессов службы). В systemd нет высокоуровневой настройки для этого значения.
|
||||
Однако вы можете задать его, используя низкоуровневую настройку
|
||||
+ControlGroupAttribute=+:
|
||||
\begin{Verbatim}
|
||||
.include /usr/lib/systemd/system/httpd.service
|
||||
|
||||
[Service]
|
||||
ControlGroupAttribute=memory.swappiness 70
|
||||
\end{Verbatim}
|
||||
Как обычно, явное указание настройки, относящейся к какому-либо контроллеру (в
|
||||
нашем случае +memory+) приведет к автоматическому созданию группы в иерархии
|
||||
данного контроллера.
|
||||
|
||||
В дальнейшем, возможно, мы расширим возможности высокоуровневой настройки
|
||||
различных параметров контрольных групп. Если вы часто пользуетесь какими-то из
|
||||
них и полагаете, что для них можно добавить соответствующие опции~---
|
||||
не~стесняйтесь обращаться к нам. А лучше всего~--- присылайте сразу патч!
|
||||
|
||||
\begin{caveat}
|
||||
Обратите внимание, что использование некоторых контроллеров может сильно
|
||||
сказаться на производительности системы. Это та цена, которую приходится
|
||||
платить за контроль над ресурсами. Использование таких контроллеров
|
||||
может ощутимо замедлить некоторые операции. В частности, весьма
|
||||
нелестная в этом плане репутация закрепилась за контроллером +memory+
|
||||
(хотя, не~исключено, что эта проблема уже исправлена в свежих выпусках
|
||||
ядра).
|
||||
\end{caveat}
|
||||
|
||||
Для углубленного изучения темы, затронутой в этой статье, вы можете обратиться к
|
||||
документации по
|
||||
\href{http://0pointer.de/public/systemd-man/systemd.exec.html}{поддерживаемым
|
||||
настройкам юнитов}, а также по контроллерам
|
||||
\href{http://www.kernel.org/doc/Documentation/scheduler/sched-design-CFS.txt}{cpu},
|
||||
\href{http://www.kernel.org/doc/Documentation/cgroups/memory.txt}{memory} и
|
||||
\href{http://www.kernel.org/doc/Documentation/cgroups/blkio-controller.txt}{blkio}.
|
||||
|
||||
Стоит подчеркнуть, что мы сейчас обсуждали распределение ресурсов \emph{между
|
||||
службами}. В дополнение к этим современным механизмам, systemd также
|
||||
поддерживает и традиционные настройки, касающиеся распределения ресурсов
|
||||
\emph{между отдельными процессами}. Хотя такие настройки обычно наследуются
|
||||
порожденными процессами, они, тем не~менее, все равно ограничивают ресурсы
|
||||
на уровне отдельных процессов. В частности, к ним относятся +IOSchedulingClass=+,
|
||||
+IOSchedulingPriority=+, +CPUSchedulingPolicy=+, +CPUSchedulingPriority=+,
|
||||
+CPUAffinity=+, +LimitCPU=+ и т.п. Для их работы не~требуют контроллеры cgroups,
|
||||
и они не~так сильно ухудшают производительность. Возможно, мы рассмотрим их в
|
||||
последующих статьях.
|
||||
|
||||
\end{document}
|
||||
|
||||
vim:ft=tex:tw=80:spell:spelllang=ru
|
||||
|
||||
Reference in New Issue
Block a user