Недавно столкнулся с проблемой обновления прошивок на серверах Dell R640, оборудованных iDRAC 9 (4.10.10.10) через сервер управления Dell OpenManage Enterprise.
Начать стоит с того, что ранее я уже успешно обновлял данные сервера через OME, но далее управляющий сервер был развернут на другой площадке и начались проблемы.
История одной проблемы и ее решение ниже.
При попытке обновления Firmware на серверах я начал получать многоговорящую ошибку Mount of remote share failed.
Как можно заметить, задача обновления запускается, после чего прерывается с указанной выше ошибкой. Ошибка не особо информативная, и, к сожалению, более детальных логов в OME мне найти не удалось.
Быстрый «гугл» с советами в виде перезагрузки OME, увеличения озу на OME до 16GB особо не помог, хотя, в некоторых случаях, возможно, это решало проблемы администраторов.
В целом процедура выполнения обновления прошивок на серверах Dell через OME достаточно простая:
- OME загружает необходимые для обновления Firmware с интернета, либо с локального репозитория и расшаривает их;
- iDRAC подключается к OME и забирает прошивку с шары себе;
- iDRAC обновляется.
Из данного процесса видно, что проблема возникает на шаге 2, при попытке iDRAC подключить себе удаленную шару с требуемой прошивкой.
Подключаюсь к iDRAC по SSH и через консольный интерфейс racadm наблюдаю за событиями, которые возникают в процессе попытки обновления:
racadm>>gettracelog
--
Source: kernel
Description: [866403.370000] CIFS VFS: cifs_mount failed w/return code = -112
--
Очевидно, ошибка с кодом 112, скорее всего, и есть причина, по которой iDRAC не может подключиться к OME. К сожалению, я не смог найти нигде внятного описания кодов ошибок CIFS, но большинство запросов по данному коду сводились к работе сети.
Проверил через racadm доступность OME по ICMP, пинг присутствует, как по ip, так и по FQDN. Жаль, но как проверить доступность портов (если это вообще возможно) через racadm я не нашел.
Далее обращаемся к официальной документации по OME и получаем список портов, которые необходимы для процедуры обновления iDRAC через OME. Страница 16.
Согласно документации, есть ряд портов NFS и CIFS который должен быть открыт между OpenManage Enterprise и iDRAC для успешного обновления прошивок (что логично).
Собираем список портов и идем к администраторам сети, безопасности согласовывать открытие, если закрыты. И получаем следующий результат:
Как можно заметить, после открытия портов обновление было успешно загружено и установлено.
В качестве заключения:
В моем случае все оказалось просто и банально – после переноса сервера в другую сеть, он автоматически попал под правила сетевой безопасности о которых я не знал. Однако, это была очередная возможность копнуть немного внутрь системы и разобраться в процессе работы, возможных неполадках и их устранении.