Предиктивная эксплуатация: как предсказать аварию и остановить время
Предиктивная эксплуатация: как предсказать аварию и остановить время

Полная версия

Предиктивная эксплуатация: как предсказать аварию и остановить время

Настройки чтения
Размер шрифта
Высота строк
Поля
На страницу:
1 из 2

Пётр Диагностиков

Предиктивная эксплуатация: как предсказать аварию и остановить время

Предисловие


Представьте себе обычное утро понедельника на любом промышленном предприятии. План на месяц сверстан, сырье подано, смена заступила на пост. И вдруг тишину цеха разрывает вой сирены. Или, что еще хуже, зловещий скрежет металла, за которым следует глухой удар. Останов.

Начинается привычная суета: начальник цеха уже на месте, ремонтники тащат инструмент, отдел снабжения лихорадочно ищет, где срочно купить подшипник, который меняли всего две недели назад. Генеральный директор требует докладную с объяснением причин и сроками запуска.

Знакомая картина? Уверен, что да.

Я посвятил проектированию и эксплуатации технических систем более 15 лет. И долгое время меня, как и многих моих коллег, преследовало ощущение, что мы играем в "сапера". Мы никогда не знаем, где рванет в следующий раз. Мы латаем дыры, героически устраняем аварии, но они возвращаются снова и снова. Мы живем от останова до останова.

История первая. "График ради графика"

Был у меня знакомый главный инженер на крупном химическом предприятии. Каждую осень, при формировании бюджета на следующий год, мы сидели с ним и "рисовали" графики планово-предупредительных ремонтов. Это были красивые файлы в Excel: разноцветные столбцы, четкие даты, подписи. Мы согласовывали их с финансистами, защищали бюджет, получали деньги.

А потом наступал январь. И уже 15-го числа останавливался насос, который по графилу должен был жить до марта. Его меняли внепланово, срывая отгрузку продукции. В феврале "летел" теплообменник, который мы планировали чистить только летом. График ППР превращался в макулатуру уже через месяц после утверждения.

Мы жили не по плану. Мы жили по аварийным заявкам. Графики существовали только для того, чтобы освоить бюджет и "чтобы было", а реальная эксплуатация представляла собой бесконечный пожар. Я помню его фразу: "Мы как саперы: ошибаемся один раз. Только сапер ошибается раз в жизни, а мы – раз в месяц".

История вторая. "Золотой подшипник"

Другой случай произошел на горно-обогатительном комбинате. Вышел из строя привод мельницы – огромный электродвигатель, который стоит как хороший внедорожник. Диагноз: разрушение подшипника качения. Казалось бы, рядовая ситуация. Механики бросились менять.

Но когда начали разбирать, выяснили страшное. Вибродиагностика, которую проводили раз в квартал (чисто для галочки, "потому что Ростехнадзор требует"), показывала рост вибрации на этом узле еще два месяца назад. Два месяца! Спектр вибрации кричал о начинающемся дефекте сепаратора подшипника.

На диаграммах, которые пылились в архиве, было четко видно: частота дефекта росла, как температура у больного. Но никто не смотрел. А когда смотрели – не понимали. А когда понимали – было поздно.

Итог: вместо замены подшипника за 50 тысяч рублей и планового останова на 8 часов, мы получили разрушение ротора, восстановление которого стоило 4 миллиона, и простой комбината на трое суток. А теперь посчитаем упущенную выгоду.

Цена незапланированного останова: как посчитать убытки в реальном времени

Знаете, в чем коварство аварии? Бухгалтерия всегда видит только прямые затраты: стоимость запчасти, зарплату ремонтников, возможно, штраф за срыв поставки. Но реальная цена останова всегда выше, и чтобы ее увидеть, нужно смотреть на производство глазами финансиста, а не только механика.

Формула цены останова проста:

Цена останова = (Упущенный маржинальный доход) + (Прямые затраты на ремонт) + (Штрафы и потери репутации) + (Ускоренный износ сопряженного оборудования).

Остановимся на первом пункте. Упущенный маржинальный доход.

Представьте, что ваше предприятие производит продукцию с маржинальностью (выручка минус переменные затраты) в 1 миллион рублей в час. Ваш насос встал на 10 часов. Бухгалтерия спишет 500 тысяч на ремонт. Но директор увидит в отчете, что прибыль компании упала на 10 миллионов! Это и есть маржинальный доход, который не был получен, потому что цех стоял. Эти деньги уже никогда не вернутся. Простаивающий завод не просто тратит деньги – он их не зарабатывает. Это как если бы вы закрыли магазин на самом проходном месте на целый день.

Теперь вернемся к нашей истории с "золотым подшипником". Да, замена подшипника за 50 тысяч – это копейки. Но трое суток простоя комбината с маржинальным доходом, скажем, 5 миллионов в сутки – это 15 миллионов упущенной выгоды. Плюс 4 миллиона на ремонт ротора. Итог: 19 миллионов убытка против 50 тысяч, если бы вовремя заметили вибрацию. Чувствуете разницу? Это цена "бумажной" диагностики.

Почему графики ППР не работают?

Потому что они часто составляются "от достигнутого" или "от бюджета". Мы планируем ремонты так, чтобы освоить выделенные деньги, а не так, чтобы предотвратить аварии. Мы чиним оборудование по календарю, а не по состоянию. И в итоге либо "переремонтируем" то, что могло бы работать еще год, либо не успеваем к реальному отказу.

Так в чем же выход?

Я долго искал ответ на этот вопрос. Перестал верить в чудеса и начал верить в системы. Я понял: проблема не в людях и не в конкретных подшипниках. Проблема в отсутствии культуры управления надежностью.

Нас учили сопромату, деталям машин и устройству компрессоров. Но нас почти никогда не учили думать об оборудовании как о живом организме, у которого есть свой ресурс, свои "болезни" и свои скрытые резервы. Нас не учили слушать оборудование, анализировать его "стоны" и вовремя давать ему "лекарство", чтобы не доводить до "реанимации".

Эта книга родилась из горького опыта и огромного желания изменить подход к эксплуатации. Я не предлагаю волшебной таблетки. Я предлагаю системный взгляд.

Главная идея, которую я постараюсь донести до вас на этих страницах, проста и сложна одновременно: надежность оборудования – это не случайность и не везение, это управляемый процесс.

Мы поговорим о том, как перестать гадать на кофейной гуще и начать предсказывать аварии. Как перейти от философии "сломалось – починим" к философии "вижу тенденцию к разрушению – предотвращаю". Как считать надежность не абстрактными процентами из паспорта, а конкретными коэффициентами, которые позволяют планировать бюджет и ремонты.

Мы детально разберем, как проводить RCA (Root Cause Analysis) – тот самый анализ коренных причин, который помогает не наказать стрелочника, а найти и устранить системный дефект, чтобы остановка больше никогда не повторилась.

Эта книга – не учебник по теоретической механике. Это практическое руководство для тех, кто устал тушить пожары. Для главных инженеров, механиков, начальников производств и для тех, кто только начинает свой путь в технике и хочет строить карьеру не на героизме во время аварий, а на интеллектуальном и системном подходе к работе.

Мы не обещаем, что после прочтения ваше оборудование перестанет ломаться навсегда. Законы физики и усталость металла никто не отменял. Но мы гарантируем: вы перестанете удивляться поломкам. Вы будете знать о них заранее.

Давайте вместе научимся управлять надежностью. Давайте сделаем так, чтобы слово "авария" осталось только в учебниках по безопасности, а в жизни были только плановые ремонты и прогнозируемый ресурс.

Поехали.


«Инженер – это человек, который может объяснить, как работает тот или иное устройство, но не может объяснить, почему оно не работает»


Маргарет Тэтчер


Часть 1. 

Фундамент надежности. Теория, которая работает на практике


Глава 1.

Введение в управление надежностью. Почему всё ломается?


Когда я только начинал свой путь инженера, мой наставник, старый механик с прокуренными усами и золотыми руками, сказал мне фразу, которую я запомнил на всю жизнь:

«Запомни, сынок: у бога нет других рук, кроме наших. А у железа нет другой совести, кроме нашей. Если ты думаешь, что станок работает сам по себе, ты уже опоздал с ремонтом».

В этой грубоватой мудрости скрыт глубокий смысл. Оборудование – это не волшебный ящик. Это сложная система, существующая по законам физики, химии и усталости материалов. И задача инженера – не просто дождаться поломки и починить, а понять эти законы и сделать так, чтобы поломка либо не случилась никогда, либо случилась тогда, когда мы к этому готовы.

В этой главе мы разберем фундамент, на котором строится всё управление надежностью. Не волнуйтесь, мы не будем глубоко нырять в дебри тервера. Мы поговорим о вещах практических.


1.1. 

Основные понятия: Что такое надежность на самом деле?


Часто, когда спрашиваешь директора: «Какая у вас надежность оборудования?», он отвечает: «Хорошая, работает пока не сломается». Это не определение. Это гадание.

В инженерии принято четкое определение из ГОСТа (например, ГОСТ 27.002-2015): Надежность – это свойство объекта сохранять во времени способность выполнять требуемые функции.

Но для практика это определение скучно. Давайте разложим надежность на четыре простых составляющих. Это как ножки стула: если хоть одна отсутствует, сидеть на нем нельзя.

Безотказность. Это свойство оборудования работать непрерывно какое-то время без перерыва. Проще говоря, сколько насос проработает до того, как сломается в первый раз. Измеряется обычно вероятностью безотказной работы или наработкой на отказ.

Долговечность. Это свойство работать до предельного состояния с учетом простоев на ремонт. То есть, сколько лет в целом проживет оборудование, пока его не спишут в утиль. Важно: долговечность можно продлевать капитальными ремонтами.

Ремонтопригодность. Это свойство, которое говорит о том, насколько быстро и легко можно вернуть оборудование в строй после поломки. Если для замены прокладки нужно разбирать полцеха и вызывать заводской спеццех – ремонтопригодность низкая. Если замена узла занимает 20 минут – высокая.

Сохраняемость. Это свойство сохранять свои характеристики при хранении, транспортировке и в период, когда оборудование не работает (например, в консервации).


Почему это важно?


Если вы приходите на производство и видите хаос, спросите себя: «А на какой из этих четырех ножек мы экономим?». Обычно экономят на ремонтопригодности (покупают дешевое, но неудобное в ремонте) и забывают про долговечность (гонят оборудование на износ без капремонтов).


1.2. 

Жизненный цикл оборудования и стоимость владения


Представьте, что оборудование – это человек. Он рождается (проектирование и закупка), растет и зреет (эксплуатация), стареет (износ) и умирает (утилизация). Это и есть жизненный цикл.

Самая частая ошибка экономистов и снабженцев – они смотрят только на "свидетельство о рождении", то есть на цену покупки. Им кажется: купили подешевле – сэкономили.

Давайте посчитаем иначе. Есть понятие LCC (Life Cycle Cost) – стоимость жизненного цикла.

LCC = Цена покупки + Стоимость монтажа + Стоимость эксплуатации (энергия, смазка) + Стоимость ремонтов + Стоимость простоев + Стоимость утилизации.

Часто дешевый насос (например, китайский аналог) имеет такую низкую надежность, что через год ремонтов и простоев его LCC оказывается в 2-3 раза выше, чем у дорогого европейского бренда. Просто потому, что дорогой бренд не ломался и не останавливал производство.


Пример из практики:


Один завод купил дешевый компрессор, сэкономив 1 млн рублей при покупке. Но из-за его низкой надежности он останавливал производство воздуха в цеху 10 раз за год. Каждый час простоя стоил заводу 200 тысяч рублей упущенной прибыли. Общее время простоев из-за этого компрессора составило 50 часов. Умножаем 50 на 200 тысяч = 10 млн рублей убытка. Вот и вся экономия, умноженная на 10.

Вывод: Управление надежностью начинается еще на стадии закупки. Нужно считать не цену, а стоимость владения.


1.3. 

Почему оборудование ломается? (Природа отказов)


Итак, мы подошли к самому интересному. Почему, если мы всё купили правильно и смонтировали, оно всё равно ломается?

Есть старая истина: «Виноват всегда человек». Но если копнуть глубже, все отказы делятся на три большие группы.


1. Конструктивные отказы.

Это когда инженер-проектировщик ошибся. Не рассчитал нагрузку, поставил тонкую стенку там, где нужно толстую, выбрал неправильный материал. Такой отказ заложен в оборудование еще "на кульмане". Лечится только модернизацией (реинжинирингом).


2. Производственные (технологические) отказы.

Это когда завод-изготовитель "накосячил" при производстве. Не та закалка, микротрещина в литье, кривая сборка. Такой дефект может не проявиться сразу, но через месяц-другой даст о себе знать. Это скрытая мина замедленного действия.


3. Эксплуатационные отказы.

Это самая большая группа (до 80% всех случаев!) И здесь виноваты мы с вами, службы эксплуатации. Самые популярные причины:


Нарушение режимов работы. Заставили оборудование работать на запредельных нагрузках («шапкозакидательство»).

Некачественное обслуживание. Масло не поменяли вовремя, подшипник не смазали, крепление не подтянули.

Естественный износ. Всё течет, всё изнашивается. Это нормально, и к этому нужно готовиться.

Человеческий фактор. Ошибка оператора, невнимательность, низкая квалификация. Криво нажал кнопку – сломал механику.


Как отличить одно от другого?

Если один и тот же узел ломается на всех аналогичных насосах – ищи конструктивный дефект.

Если ломается только на одном насосе из десяти – ищи проблемы эксплуатации или скрытый брак завода.


Резюме главы 1 


Прежде чем бежать внедрять сложные системы вибродиагностики и нанимать дорогих консультантов по RCA, сделайте три простых шага:


Перестаньте экономить на покупке, начиная считать стоимость владения (LCC). Дешево – значит дорого.

Научитесь классифицировать отказы. Это поможет понять, куда копать: менять конструкцию, требовать гарантию от завода или просто наладить смазку.

Примите как факт: оборудование будет ломаться. Ваша задача – не сделать его вечным, а сделать его поломки предсказуемыми и быстроустранимыми.

В следующей главе мы перейдем от философии к математике и научимся считать те самые коэффициенты надежности (MTBF, MTTR, Коэффициент готовности), которыми пугают финансисты и которыми гордятся перед начальством.


Глава 2.

Математика надежности. Считаем деньги и ресурс


Помните историю из предисловия про «Золотой подшипник»? Если бы те данные вибрации, которые пылились в архиве, были вовремя превращены в простые цифры и графики, аварии бы не случилось. Цифры – это язык, на котором с вами говорит оборудование. Наша задача – научиться переводить с этого языка на язык директора по производству и финансиста.

В этой главе мы разберем три главных коэффициента, которые должен знать наизусть любой главный инженер или механик. Мы научимся их считать и, что важнее, понимать, о чем они говорят.


2.1. 

MTBF (Mean Time Between Failures) –

Средняя

наработка

на

отказ


Это, пожалуй, самый популярный показатель. Звучит страшно, но смысл простой: сколько в среднем оборудование работает между двумя поломками.


Как считать?


Берем конкретный насос (или группу однотипных насосов). Смотрим журнал эксплуатации за год.


Насос проработал всего 8600 часов (примерно год).

За это время он ломался 4 раза.

Складываем всё время работы между поломками и делим на количество поломок.


Формула: MTBF = (Общее время работы) / (Количество отказов)


В нашем примере: 8600 часов / 4 отказа = 2150 часов.


Это значит, что в среднем мы можем рассчитывать, что насос поработает 2150 часов (около 90 суток) и сломается.


Подводные камни (важно!):


Не путать с ресурсом! MTBF – это средняя температура по больнице. Он может быть 2150 часов, но сегодня насос может сломаться через 10 часов после ремонта, а потом проработать год. Это статистика.


Что считать отказом? Если мы меняем подшипник по графику (планово) – это не отказ. Если подшипник разрушился и насос встал – это отказ. Четкость учета здесь критична. Часто предприятия завышают MTBF, записывая аварии как «плановые ремонты».


Зачем это нужно финансистам?

MTBF позволяет планировать количество ремонтов в год. Если мы знаем, что MTBF = 2000 часов, а в году 8000 часов работы, значит, будет примерно 4 внеплановых останова. Под это нужно закладывать бюджет на запчасти и ремонтный персонал.


2.2. 

MTTR (Mean Time To Repair) – Среднее время восстановления


Второй по важности показатель. Если MTBF говорит нам, как часто мы будем останавливаться, то MTTR говорит, на сколько мы будем останавливаться.


Это среднее время, которое требуется, чтобы найти причину, разобрать, заменить деталь и собрать оборудование обратно. С момента «Стоп! Авария!» до момента «Поехали!».


Как считать?

Смотрим по тому же насосу:


Было 4 остановки.


Первый раз чинили 5 часов, второй – 2 часа, третий – 10 часов (ждали запчасть), четвертый – 3 часа.


Складываем: 5+2+10+3 = 20 часов.


Делим на количество остановок (4).


Формула: MTTR = (Общее время ремонтов) / (Количество отказов)


В нашем примере: 20 часов / 4 отказа = 5 часов.


Это значит, что если насос сломается, мы потеряем в среднем 5 часов рабочего времени.


На что влияет?

MTTR – это прямая функция от ремонтопригодности и логистики.


Если у нас есть все запчасти на складе (быстрая логистика), MTTR будет низким.


Если у нас есть обученная бригада и хороший инструмент, MTTR будет низким.


Если нам нужно везти подшипник из другого города или искать токаря, чтобы выточить втулку, MTTR будет высоким.


Цена вопроса:

Время простоя (то есть MTTR) мы умножаем на стоимость упущенной маржинальной прибыли в час. Это и есть прямые убытки от аварии.


2.3. 

Коэффициент готовности (Availability)

А вот это – любимый показатель директоров. Он соединяет в себе и частоту поломок, и скорость их устранения.


Коэффициент готовности показывает, какую долю времени оборудование находится в работоспособном состоянии и готово выполнять свои функции.


Формула: A = MTBF / (MTBF + MTTR)


Считаем для нашего насоса:

MTBF = 2150 часов, MTTR = 5 часов.

A = 2150 / (2150 + 5) = 2150 / 2155 = 0,9977 (или 99,77%).


Это отличный показатель. Оборудование готово работать 99,77% времени.


А что, если мы плохо ремонтируем?

Представим другой насос. Он ломается реже (MTBF = 5000 часов – супер!), но когда ломается, мы чиним его по 100 часов (MTTR = 100), потому что запчасти уникальные и бригада вызывается из-за границы.

A = 5000 / (5000+100) = 5000/5100 = 0,9804 (98,04%).


Второй насос по надежности (MTBF) лучше первого в 2.5 раза. Но по готовности к работе – хуже! Простаивает почти 2% времени против 0.23% у первого.


Вывод для управленца:

Не гонитесь за супернадежным оборудованием, которое потом невозможно быстро починить. Идеальное оборудование – то, которое ломается предсказуемо и чинится быстро.


2.4. 

Как собирать данные и не сойти с ума

Самая частая жалоба: «У нас нет статистики, нам нечего считать». Это неправда. Статистика есть всегда, просто она лежит в куче бумаг – в журналах выдачи нарядов, в актах на списание, в рапортах смены.


Правила сбора данных для инженера по надежности:

Делим оборудование на группы. Не нужно считать надежность всего завода сразу. Считаем по типам: «Насосы центробежные типа Х», «Компрессоры винтовые», «Конвейеры ленточные».


Фиксируем события. Заведи простую табличку в Excel или блокнот:


Оборудование (инвентарный номер)

Дата/время останова

Что сломалось (узел)

Причина (по нашей классификации из Главы 1)

Время простоя (до пуска)


1

2

3

4

5


ЭД 12547852

13.03.2026

подшипник

Естественный износ

24 часа


Не усложняйте на старте. Первые полгода вы будете просто собирать мусор. Это нормально. Через полгода у вас появятся первые цифры MTBF.


Практический пример: Сравнение поставщиков

Представьте, что вы выбираете между двумя поставщиками насосов.


Поставщик А: Насос стоит 1 млн руб. Обещает MTBF = 1 год, MTTR = 2 дня (из-за сложности доставки запчастей).


Поставщик Б: Насос стоит 1,5 млн руб. Обещает MTBF = 2 года, MTTR = 1 день (запчасти на складе).


Что выгоднее?


Считаем стоимость владения за 4 года. Маржинальный доход от работы насоса (если бы он стоял, завод терял бы прибыль) примем условно за 100 000 руб/день.


Поставщик А:


Покупка: 1 млн.


За 4 года насос сломается (по MTBF) примерно 4 раза (раз в год).


Каждый раз простой 2 дня = 4 * 2 = 8 дней простоя.


Потери прибыли от простоев: 8 дней * 100 000 = 800 000 руб.


Итого затрат: 1 млн + 800 тыс = 1,8 млн руб.


Поставщик Б:


Покупка: 1,5 млн.


За 4 года сломается примерно 2 раза (раз в 2 года).


Каждый раз простой 1 день = 2 * 1 = 2 дня простоя.


Потери прибыли: 2 дня * 100 000 = 200 000 руб.


Итого затрат: 1,5 млн + 200 тыс = 1,7 млн руб.


Поставщик Б дороже на 50% при покупке, но в итоге выгоднее на 100 000 рублей за 4 года, плюс завод меньше стоит и работает стабильнее.


Резюме главы 2 

Математика надежности – это не скучная статистика. Это язык переговоров с директором и финансистами.


MTBF – говорит о качестве оборудования и качестве эксплуатации.

MTTR – говорит о качестве ремонтной службы и склада.

Коэффициент готовности – итоговый показатель, который видит коммерческий директор (работает/не работает).

Считайте LCC (стоимость жизненного цикла) – и вы перестанете покупать дешевку.


Задание на подумать:

Пойдите в цех, выберите самый проблемный насос и найдите его журнал. Попробуйте посчитать его MTBF и MTTR за прошлый год. Если данных нет – начните их собирать сегодня. Через 6 месяцев у вас будет карта боевых действий.


Глава 3.

Стратегии технического обслуживания. Какую выбрать?


Представьте, что вы врач. К вам приходят три пациента. Молодой парень с насморком, пожилой мужчина с хроническим давлением и человек после автокатастрофы. Вы будете лечить их одинаково? Очевидно, нет.

Точно так же и с оборудованием. Нельзя ко всем механизмам подходить с одной меркой. То, что выгодно для простого вентилятора, убьет бюджет, если применить к дорогому компрессору. И наоборот, попытка «задиагностировать» каждый болт обернется пустой тратой денег.

В этой главе мы разберем три классические стратегии и одну современную, а главное, научимся выбирать, что применить к конкретному насосу или станку.


3.1. 

Реактивное обслуживание (RTF – Run To Failure). Работа до отказа.


Это самая древняя и самая простая стратегия. Она звучит так: «Пока не сломалось – не трогай. Сломалось – чини или выбрасывай».


Когда это работает?

Как ни странно, такой подход имеет право на жизнь. Применяйте его, если оборудование соответствует трем критериям:


Дешевое. Стоимость нового оборудования ниже, чем стоимость его профилактики и ремонта.

Некритичное. Его поломка не останавливает производство (есть резерв) и не угрожает безопасности людей.

Легкозаменяемое. Вы можете купить новое и воткнуть его за час.


Например, обычный асинхронный электродвигатель на вентиляции. Стоит 20 тысяч рублей. Если он сгорит, в цеху станет душно, но производство не встанет. На складе есть точно такой же. Покупать для него систему вибродиагностики за 200 тысяч? Бред. Проще дождаться, когда умрет, и выбросить.

Главный минус такого подхода – это внезапность. Вы никогда не знаете, когда это случится. Если двигатель дымит посреди ночи, механика выдернут с кровати. Но если это дешево и быстро меняется, с этим можно жить.

На страницу:
1 из 2