Глава 17 {MC-10}. Поиск неисправностей

поясняет как несмотря на значительную автономность Ceph в заботе о самой себе и восстановлении после сбоев, в некоторых случаях требуется вмешательство персонала. Мы взглянем на распространённые ошибки и сценарии отказов, а также на то как возвращать обратно Ceph в полностью жизнеспособное состояние, отыскивая в ней неисправности. {Прим. пер.: глава на первый взгляд полностью дублирует MC-10. }

Восстановление несогласованных объектов

Заполненные OSD

Ведение журналов OSD

Малая производительность

Причины

Возросшая рабочая нагрузка клиентов

Останов OSD

Восстановление и наполнение

Очистка

Подрезка снимков

Проблемы с оборудованием или драйверами

Наблюдение

iostat

htop

atop

Диагностика

Очень низкая производительность или отсутствие ввода/ вывода

Биения OSD

Кадры Jumbo

Начинающие отказывать диски

Медленные OSD

Расследование PG в состоянии down

Большие базы данных монитора

Выводы