ESXi 7 и зависший vmsyslog

Столкнулся с ситуацией, при которой ESXi 7 Update 3g (build 20328353) перестал отправлять логи на удаленный Syslog сервер, а при дальнейшем разбирательстве выяснилось, что локально логи он так же перестал писать и в /scratch/log журналы не обновляются. Место на диске есть.

В ходе диагностики были зафиксированы ошибки в журнале /var/log/.vmsyslogd.err следующего характера:

vmsyslog.main            : CRITICAL] Dropping messages due to log stress (qsize = 25000)

Адекватных KB по версии 7 на данную тематику я не нашел, была только KB по версии 6.5/6.7 с упоминанием данной ошибки, где было написано, что «проблема устранена».

Команда esxcli system syslog config get корректно выдает статус настроек, а esxcli system syslog reload к каким-то положительным результатам не приводит, логи локально писаться не начинают и, тем более, не отправляются на удаленный сервер.

Перезапуск службы из интерфейса управления хоста кнопкой Restart так же не приводит к каким-либо результатам. В логе можно увидеть только:

vmsyslog.main            : ERROR   ] reloading (3200395)

Что аналогично результату работы esxcli system syslog reload.

Остановить службу и запустить заново из интерфейса ESXi не удается, поскольку:

This service with 'vmsyslogd' is marked as 'required' and cannot be stopped.

Остается применить грубую силу и остановить его принудительно напрямую с хоста:

ps -cC | grep vmsyslog
3418096  3418096  vmsyslogd             /bin/python /usr/lib/vmware/vmsyslog/bin/vmsyslogd.pyc 1

Определяем PID vmsyslog, в данном случае 3418096 и убиваем его:

kill -9 3418096

В логе vmsyslog будет видно, что процесс был убит, а затем автоматически перезапущен:

vmsyslog.main            : ERROR   ] Watchdog 3418095 fired (child 3418096 died with status 9)!
vmsyslog.main            : ERROR   ] Watchdog 3418095 exiting
vmsyslog                 : CRITICAL] vmsyslogd daemon starting (3418940)

После перезапуска логи вновь начинают писаться локально и отправляться на удаленный сервер.

Пара документов от Nutanix и VMware для прочтения, вышедших в декабре 2022

В Nutanix выпустили документ, который невозможно обойти вниманием –AOS 6.5 with AHV On-Premises Design или же просто Nutanix Validated Design. Сам по себе он является примером дизайна виртуальной инфраструктуры на базе Nutanix и будет полезен не только архитекторам, занимающимся дизайном решений, но и инженерам. Основой для документа является документ Nutanix Hybrid Cloud Reference Architecture и с ним рекомендуется ознакомиться в первую очередь.

Кстати говоря, ориентироваться на данный документ можно при подготовке к экзаменам NCX и NPX, поскольку он затрагивает большую часть тем, если не все темы, которые необходимо включить в свой экзаменационный проект.

В VMware выпустили обновленный и многим известный документ Performance Best Practices for VMware vSphere 8.0 и, как можно догадаться из названия, обновлен он под не так давно вышедшую 8-ю версию VMware vSphere.

В документе содержится большое количество рекомендаций и хороших практик по практически всем аспектам виртуальной инфраструктуры. Настоятельно рекомендую к прочтению и последующему применению в работе.

Я же скоромно напомню, что в моем блоге есть «авторский перевод» данного документа по версии 7.

Что нового на Nutanix University?

В дополнении к ранее вышедшим обновленным курсам под версию AOS 6.5 – Nutanix Hybrid Cloud Fundamentals (NHCF) и Enterprise Cloud Administration (ECA) ожидаемо добавился новый курс – Advanced Administration & Performance Management (AAPM). Данный курс посвящен углубленному изучению Nutanix и уже доступен на Nutanix University абсолютно бесплатно.

И, как обычно, это не все. Вместе с курсом, в статусе BETA доступен новый экзамен – Nutanix Certified Master – Multicloud Infrastructure (NCM-MCI) по версии 6.5.

Как и всегда, поучаствовать в BETA экзамене можно абсолютно бесплатно, для этого достаточно использовать промо-код NCMMCI65BETA при регистрации на экзамен. Участие в экзамене доступно первым 150 кандидатам. Срок – 15 января 2023 года.

Ceph и подключение клиентов. Ceph Object Gateway и S3

Помимо блочного и файлового типов доступа к данным, Ceph так же поддерживает объектный доступ с помощью привычных API S3, либо Swift.

В данном случае мы посмотрим, какие настройки необходимо выполнить со стороны Ceph, чтобы предоставить клиентам возможность управления данными с помощью S3 API.

Continue reading “Ceph и подключение клиентов. Ceph Object Gateway и S3”

Ceph и подключение клиентов. Блочные устройства RBD

RBD, он же RADOS Block Device – это метод выделения пространства с Ceph и презентации его клиентам в виде блочных устройств (дисков).
RBD можно часто встретить в связке с виртуализацией, в Kubernetes, где диски подключаются к контейнерам в качестве PV, а так же просто внутри клиентской ОС.
В данном случае мы посмотрим, как подключить к обычному Linux хосту блочные устройства с Ceph.

Continue reading “Ceph и подключение клиентов. Блочные устройства RBD”

Состоялся релиз VMware vSphere 8.0

Буквально вчера vSphere 8.0 перешла в статус Initial Availability, а образы уже доступны для загрузки на соответствующем портале.

Для тех, кто не в курсе, VMware анонсировали новую модель релизов и теперь перед General Availability (GA) нас ожидает этап Initial Availability (IA).
К Initial Availability релизам применяются те же тесты и требование к качеству, что и к General Availability релизам, они так же «Production Ready» и сертифицированы партнерами. Ожидать GA релиз после выхода IA релиза можно в течение пары месяцев, после того как второй получит определенную долю распространения среди заказчиков.

Изменений и нового функционала в vSphere 8.0 много. Подробнее можно почитать здесь:
VMware vSphere 8.0;
VMware vSphere with Tanzu 8.0;
VMware vSAN 8.0;
VMware Host Client 2.5.0.

Так же, хоть и не относится к vSphere 8.0, состоялся релиз vCenter Converter 6.3, который еще совсем недавно был в статусе Beta.
Старый конвертер уже достаточно давно нельзя скачать, и вот, вышел новый. Список поддерживаемых систем как вырос, так и уменьшился одновременно. Теперь поддерживаются свежие системы, например, Windows Server 2019 и Windows 11, и в то же время перестали поддерживаться системы ниже Windows Server 2012, RHEL/CentOS 6 и Ubuntu 14.
Не факт, что конвертер не будет работать со старыми системами, но в списке поддерживаемых их нет.

Сдаем экзамены Nutanix NCA 6.5 и NCP-MCI 6.5 со 100% скидкой

В блоге Nutanix пробежала новость о том, что до 30 ноября можно абсолютно бесплатно сдать экзамены Nutanix Certified Associate (NCA) и Nutanix Certified Professional – Multicloud Infrastructure (NCP-MCI).

Оба экзамена были обновлены до самой актуальной версии – 6.5.

Для получения 100% скидки достаточно воспользоваться промо-кодом на этапе регистрации экзамена – NTX65FR.

Так же напомню, что были обновлены до версии 6.5 обучающие курсы Nutanix Hybrid Cloud Fundamentals (NHCF) и Enterprise Cloud Administration (ECA). Оба курса доступны в режиме онлайн на Nutanix University абсолютно бесплатно.

Управление правами доступа к кластерам Kubernetes в Nutanix Karbon

Ранее я уже писал о том, как получить доступ к кластеру Kubernetes, развернутому с помощью Nutanix Karbon или Nutanix Kubernetes Engine по-новому, однако, считаю, что данный вопрос нужно осветить более подробно и углубиться в процедуру разграничения доступа пользователей.

Под катом мы посмотрим, как происходит авторизация пользователей в Karbon, как получить доступ к управлению кластером Kubernetes и что для этого нужно.

Continue reading “Управление правами доступа к кластерам Kubernetes в Nutanix Karbon”

Что нового на Nutanix University?

С выходом новой LTS версии AOS 6.5, в Nutanix были обновлены два обучающих курса:

Nutanix Hybrid Cloud Fundamentals (NHCF) – обучающий курс для начинающих, который знакомит с основами HCI и Nutanix;

Enterprise Cloud Administration (ECA) – основной, если так можно выразиться, курс, в котором подробно рассказывается про администрирование Nutanix.

Также в настоящий момент под версию 6.5 обновляются сертификации Nutanix Certified Associate (NCA) и Nutanix Certified Professional – Multicloud Infrastructure (NCP-MCI).

Обе сертификации в настоящий момент находятся в статусе BETA и сдать их можно абсолютно бесплатно до 18 сентября используя следующие ваучеры в разделе оплаты NCA65BETAFREE и NCPMCI65BETAFREE. Количество участников бета-программы ограниченно 250, поэтому откладывать регистрацию и сдачу не стоит.

Зарегистрироваться на экзамен NCA можно здесь, а на NCP-MCI здесь.

Обновление гипервизоров VMware ESXi 7 с помощью Singe Cluster Image

С появлением Lifecycle Manager в vSphere 7, к привычным обновлениям с помощью настройки baselines был добавлен новый функционал, позволяющий управлять обновлениями с помощью формирования единого образа ESXi для всех узлов кластера.

После настройки образа, все узлы в кластере проверяются на соответствие, а затем обновляются, становясь полностью идентичными.

О том, как настроить образ и обновить кластер – под катом.

Continue reading “Обновление гипервизоров VMware ESXi 7 с помощью Singe Cluster Image”

Translate »