
Полная версия
Технологии искусственного интеллекта для массовых профилактических лучевых исследований
В 2000-е годы активно развивались CAD-системы для анализа рентгеновских снимков органов грудной клетки в поисках легочных узлов. В них использовались различные методы обработки изображений [79]. Часто применялся метод создания разностных изображений, при котором из общего фона выделялись легочные узлы. Затем проводилась классификация узлов по группам на основе установленных пороговых значений [80]. Работа этих систем показала в то время значительные перспективы.
Первая CAD-система, сертифицированная FDA (Агентством по контролю за продуктами и лекарствами США), называлась RapidScreen Digital. Хотя точность этого алгоритма не достигала 100%, он смог идентифицировать 36 случаев (41%) из 88, в которых врач-рентгенолог не заподозрил наличие ЗНО легких [80]. Поэтому систему рекомендовали использовать как второе мнение для минимизации пропусков ЗНО [81]. Однако после 2010 года значительных продвижений в применении CAD для диагностики ЗНО не наблюдалось. Основной подход к этим системам включал анализ изображений на основе вручную выбранных функций. Из-за этого описать все возможные признаки заболеваний оказалось невозможным, и точность CAD не достигала уровня опытного врача-рентгенолога. В основном они концентрировались на диагностике туберкулеза и ЗНО легких, игнорируя другие патологии [82]. Определить оптимальный набор функций для конкретной задачи сложно, и это часто считается скорее искусством, чем наукой [83]. Но с техническим прогрессом после 2010 года использование машинного обучения значительно упростило этот процесс. Машины стали более эффективно выделять необходимые признаки и формулировать решающие функции. Поэтому новое направление в развитии CAD-систем включает интеграцию ИИ.
Отличительной чертой CAD для маммографии является их высокая точность по сравнению с системами для рентгенографии органов грудной клетки, и они успешно используются по сегодняшний день. Принцип работы маммографических CAD-систем аналогичен рентгенографическим. Система анализирует до четырех изображений одновременно, часто обрабатывая их независимо друг от друга. С помощью CAD определяются аномалии в тканях молочной железы, такие как микрокальцинаты и уплотнения, которые могут указывать на наличие опухолей. Следующий алгоритм CAD классифицирует эти участки, используя количественные методы для оценки их характеристик, таких как плотность и регулярность распределения. Окончательная оценка вероятности злокачественного процесса осуществляется с помощью автоматизированного классификатора, обученного на данных. В результате врач-рентгенолог получает изображение с областями, помеченными как потенциально опасные [84].
Первый алгоритм CAD для маммографии, утвержденный FDA, был зарегистрирован еще в 1998 году – раньше, чем аналогичные системы для рентгенографии органов грудной клетки [85]. Применение CAD в диагностике ЗНО молочной железы показало такие обнадеживающие результаты, что к 2010 году около 74% всех маммографических исследований использовали эту технологию [86]. Отмечается, что CAD начали применяться вместо традиционного второго чтения маммограмм, демонстрируя улучшение результатов на 2—10%. Это позволило обнаруживать ЗНО в среднем на два месяца раньше, чем при классическом двойном просмотре изображений рентгенологами. Основным препятствием к широкому распространению стала не столько технология, сколько ее низкая экономическая эффективность [87—89]. Со временем появились исследования, подвергающие сомнению эффективность CAD-систем [90, 91]. Последующие анализы показали: врачи не меняли своих диагностических решений под влиянием CAD, что не привело к улучшению точности диагностики [92].
Эти данные свидетельствуют о том, что с течением времени врачи научились работать на уровне чувствительности CAD, благодаря чему их использование как второго мнения стало менее актуальным. В результате CAD-системы потеряли преимущество их применения на текущем уровне развития технологий. В исследовании A. Kohli, S. Jha «Почему CAD потерпел неудачу в маммографии?» отмечается, что ограниченные вычислительные ресурсы и отсутствие контролируемого обучения были ключевыми проблемами [93]. Авторы подчеркивают: для повышения спроса на CAD система должна «видеть то, что невидимо человеку». Таким образом, в маммографии начинается новая эра использования машинного обучения для анализа данных.
2.2. Развитие программного обеспечения, основанного на технологиях искусственного интеллекта
CAD-системы нового поколения, основанные на технологиях искусственного интеллекта (ПО на основе ТИИ), отличаются от предшественников главным образом использованием при их разработке сложных алгоритмов, тренируемых на больших данных без активного участия оператора. Успех разработки таких систем в значительной степени зависит от качества данных [94]. Размещение этих данных в открытом доступе [95—98] и возможность использования мощных вычислительных ресурсов способствовали быстрому росту исследований в области ИИ [99]. Применение ПО на основе ТИИ в клинической практике возможно только после официальной регистрации продукта как медицинского изделия. Принципиальное отличие ПО на основе ТИИ от ранее рассмотренных экспертных систем заключается в том, что оно способно обучаться и накапливать опыт [100].
Основные сферы применения ИИ охватывают: 1) технологии обработки естественного языка (NLP) для анализа текста и речи; 2) компьютерное зрение (CV) для распознавания, классификации и анализа образов на медицинских изображениях; 3) анализ больших данных (Data Science) для выявления закономерностей, структурирования данных, извлечения знаний и предсказания исходов [101]. В этом разделе основное внимание будет уделено программному обеспечению на основе искусственного интеллекта для компьютерного зрения, направленному на классификацию и локализацию патологий. ПО на основе ТИИ использует два основных метода: машинное обучение, где значимость параметров определяется алгоритмически [102, 103], и глубокое обучение, которое воспроизводит структуру человеческого мозга и включает значительно больше параметров [103]. Для клинического использования такого ПО требуется подтверждение его эффективности [103].
По теме диагностики туберкулеза существуют два крупных систематических обзора с метаанализом, которые позволяют оценить возможности и перспективы использования ПО на основе ТИИ: первый был опубликован в 2016 году [104], второй – в 2019-м [105]. В этих обзорах результаты исследований, посвященных разработке, значительно превышают результаты клинических исследований, показывая AUC от 0,88 (0,82—0,90) против 0,75 (0,66—0,87). Исследователи подчеркивают значительный потенциал ПО на основе ТИИ для диагностики туберкулеза, но отмечают, что клиническим оценкам уделяется недостаточно внимания [105]. Технологии ИИ развиваются стремительно, и научные данные, представленные в этих работах, уже устарели. Свежий обзор, выполненный K.Santosh с коллегами и опубликованный в октябре 2022 года, показывает, что за последние три года AUC в новых исследованиях превысил 0,90, а по данным некоторых исследователей, даже достиг 0,99 [106, 107].
Пандемия COVID-19 явилась катализатором для разработки ПО на основе ТИИ для рентгенологических исследований органов грудной клетки. В большом количестве начинали появляться модели, обученные для выявления признаков вирусной пневмонии на рентгенограммах. Недавний систематический обзор показал, что большинство новейших решений на основе ТИИ достигли AUC выше 0,95, а самые точные – более 0,99 [108—111].
При изучении литературы об алгоритмах, выявляющих подозрительные на ЗНО легочные узлы, выяснилось, что существует ограниченное количество исследований. В последние три года был найден всего один систематический обзор с метаанализом, который также упоминал использование ПО на основе ТИИ для диагностики ЗНО легких на рентгенограммах. Согласно данным этого обзора, показатель AUC для выявления легочных узлов достигал 0,884 (0,842—0,925) с чувствительностью 0,75 (0,634—0,866) и специфичностью 0,944 (0,912—0,976). Детекция ЗНО легких демонстрировала AUC 0,864 (95% ДИ 0,827—0,901) на рентгенограммах, чувствительность при этом составляла 0,801 (0,683—0,919), а специфичность не была указана [107]. Из этих данных следует, что ПО на основе ТИИ не способно достигать чувствительности, близкой к 100%, для всех патологий, кроме туберкулеза и COVID-19.
Одной из особенностей рентгенографии органов грудной клетки является необходимость выявления алгоритмами на основе ТИИ нескольких целевых патологий. Существуют ИИ-алгоритмы, которые выполняют бинарную классификацию: норма или патология, что идеально подходит для триажа – приоритизации исследований в рабочем списке врача-рентгенолога. В среднем диагностическая точность (AUC) такого ПО составляет 0,917 (0,869—0,966), чувствительность – 0,873 (0,762—0,985), а специфичность – 0,894 (0,860—0,929) [107].
При публикации результатов разработки ПО на основе ТИИ часто демонстрируются высокие показатели точности [105, 106, 112]. Однако в ходе разработки такого программного обеспечения исследователи зачастую не уделяют должного внимания сравнению полученной диагностической точности с показателями врачей-рентгенологов. Из 39 исследовательских работ, в которых оценивалась точность ПО на основе ТИИ при анализе рентгенографических исследований, только в 13 сравнивали результаты с выводами врачей, что позволило бы более объективно оценить достоверность данных. Сравнение диагностической точности, полученной с помощью ПО на основе ТИИ, с результатами врача-рентгенолога на одном и том же наборе данных демонстрирует особую ценность, но, к сожалению, таких исследований мало [113]. В 2019 году авторы одного из обзоров с осторожностью указывали на то, что точность ПО на основе ТИИ может быть сопоставима с точностью медицинских работников.
Важно также учитывать этические вопросы: изучение научной литературы показывает, что точность ПО на основе ТИИ уже сопоставима и в некоторых случаях превосходит точность врачей-рентгенологов. Однако, как было показано, точность алгоритмов достигает 99% только для отдельных патологий – это означает, что на практике ошибки неизбежны [114]. Создается парадокс: использование ПО на основе ТИИ в автономном режиме оказывается невозможным, однако результаты проведенных исследований говорят о том, что врачи ошибаются чаще. В этом контексте в профессиональном сообществе ведется активное обсуждение целесообразности применения ПО на основе ТИИ в лучевой диагностике [115—120].
В результате исследователи предложили использовать ПО на основе ТИИ в тандеме с врачом-рентгенологом, что повышает диагностическую точность по сравнению с работой врача в одиночку [112].
Многочисленные исследования подтверждают эффективность использования ПО на основе ТИИ в лучевой диагностике. Точность алгоритмов при определении отдельных рентгенологических признаков сопоставима с работой среднестатистического врача-рентгенолога. Автоматический анализ демонстрирует чувствительность и специфичность, а также значения AUC, приближающиеся к показателям врачей: 75,4, 90,6 и 0,89% против 73,0, 88,6 и 0,85% соответственно [121]. Аналогично автоматизированный анализ результатов маммографий показывает чувствительность и специфичность на уровне 91,4 и 91,6% с AUC 0,945 [122]. При сегментации патологических областей коэффициенты сходства IoU (Intersection over Union) для ИИ-алгоритмов и врачей составляют 0,86 и 0,96 соответственно [123].
Становится очевидной необходимость использования ПО на основе ТИИ в клинической практике, при этом программный продукт обязательно должен быть зарегистрирован как медицинское изделие. К концу 2022 года 29 таких программ получили европейскую сертификацию CE MDR/MDD, и 11 из них также сертифицированы в США [124]. Программный продукт ChestLink®, который используется для полностью автономного анализа рентгенограмм грудной клетки, заслуживает особого внимания. Он самостоятельно сортирует исследования, распознает рентгенограммы, не содержащие патологических признаков, и формирует полные описания [125], что существенно снижает нагрузку на врача, позволяя сосредоточиться на более сложных случаях [126].
Значительное количество научных работ посвящено разработке ПО на основе ТИИ для цифровой рентгенографии органов грудной клетки. С 2020 по 2022 год было опубликовано 2248 научных статей по этой теме [127]. В то же время исследования возможностей ПО на основе ТИИ для цифровой флюорографии ограничены; к примеру, был представлен только один алгоритм от компании Google в 2018 году [128], без подробностей о диагностической точности. Такие исследования в основном проводятся в России и СНГ, где флюорография активно используется [129—132].
ПО на основе ТИИ уже демонстрирует хорошие результаты в лучевой диагностике, но его широкое внедрение в медицинскую практику требует не только подтверждения его эффективности, но и детального анализа возможных рисков, а также стандартизации методов оценки его работы. Социологическое исследование 2020 года показало: большинство пациентов положительно относятся к применению ПО на основе ТИИ в медицине, ожидая, что оно повысит качество медицинской помощи [133].
Таким образом, несмотря на потенциальные риски, использование ПО на основе ТИИ является перспективным направлением в радиологии, способным улучшить качество диагностики и оптимизировать рабочие процессы в ОЛД.
Современная научная литература отмечает недостаток работ, направленных на оценку усредненной диагностической точности ПО на основе ТИИ для профилактических исследований в лучевой диагностике. В то же время количество исследований, посвященных анализу диагностической точности конкретных ИИ-решений, стремительно увеличивается [26, 134—136]. Необходимо учитывать, что для глобального внедрения ПО на основе ТИИ в лучевую диагностику важно знать не только показатели диагностической точности самого программного обеспечения, но и сопоставлять их с показателями врача-рентгенолога, что на текущий момент недостаточно освещено.
На протяжении последних пяти лет активно развивается ПО на основе ТИИ для анализа цифровых маммографических исследований. Данный процесс обусловлен необходимостью снижения нагрузки на врачей-рентгенологов при скрининге ЗНО молочных желез [112, 137—139]. Часть исследований подтверждают, что чувствительность ИИ-алгоритмов сопоставима с чувствительностью врачей [140], в некоторых из них отмечается превосходящая диагностическая точность ПО в сравнении с врачами [138]. Мнения о сравнительных характеристиках ПО и врачей-рентгенологов с различным опытом работы носят противоречивый характер. Установлено, что ПО на основе ТИИ может достигать уровня точности врачей [141], в то же время отмечается низкая согласованность в интерпретации результатов маммографии даже между врачами-рентгенологами с равнозначным опытом [142], и предыдущие системы CAD не смогли значительно улучшить этот показатель [143].
На основании имеющихся данных можно утверждать, что в условиях роста объема рентгенологических исследований использование ПО на основе ТИИ в качестве первого или второго мнения становится все более оправданным, поскольку способствует уменьшению нагрузки на врачей-рентгенологов и повышает точность диагностики [26, 27]. Однако необходимо тщательное сравнение и оценка реальных характеристик ИИ-сервисов для гарантии клинической ценности и безопасности [112, 138, 141, 144].
Доказана целесообразность применения ПО на основе ТИИ для скрининга злокачественных новообразований молочной железы [145] как одного из этапов диагностического процесса [137, 141], поскольку в комбинации с врачом-рентгенологом это позволяет повысить чувствительность и точность методики [146, 147].
Несмотря на многообещающие результаты, внедрение ПО на основе ТИИ в рентгенографию сопряжено с рядом ограничений, включая относительно низкую специфичность классификации определенных патологий, что делает замену врача-рентгенолога ПО на основе ТИИ невозможной на текущем этапе [136, 148, 149]. ВОЗ предостерегает от возможных рисков, связанных с применением ИИ в медицине, которые необходимо минимизировать [150].
Таким образом, несмотря на определенные проблемы, текущее состояние научных исследований и разработок показывает значительные перспективы использования ПО на основе ТИИ для улучшения качества интерпретации результатов маммографии, рентгенографии и флюорографии органов грудной клетки, что подчеркивает важность проведения дальнейших исследований и стандартизации методов оценки качества и безопасности соответствующих технологий.
В современной научной литературе указывается на необходимость установления минимального уровня значений площади под ROC-кривой, который был бы приемлем для клинического применения ПО на основе ТИИ. Пороговое значение AUC в 0,81 свидетельствует о том, что до 19% решений, принятых с помощью ПО на основе ТИИ, могут быть ошибочными [147]. Однако на текущий момент отсутствуют специфические пороговые значения для оценки диагностической точности ПО на основе ТИИ, используемого в профилактических исследованиях.
Широкий выбор программного обеспечения в медицине позволяет специалистам подбирать инструменты, наилучшим образом отвечающие специфике их задач и особенностям работы медицинских организаций [151]. Рекомендации M. P. Recht и его коллег подчеркивают множество проблем, связанных с внедрением и использованием ПО на основе ТИИ в радиологии, включая этические вопросы и отсутствие четких требований к интеграции таких систем [152].
На данный момент есть успешные примеры внедрения ПО на основе ТИИ в отдельные медицинские учреждения, чаще всего академические центры. Однако масштабное применение таких технологий сталкивается с серьезными вызовами, включая различия в уровне подготовки и опыте врачей-рентгенологов, которые могут воспринимать новшества как угрозу собственной профессиональной роли. Технические аспекты работы ПО на основе ТИИ также изменяются в зависимости от масштабов применения – от отдельной медицинской организации до всей городской системы здравоохранения, требуя значительных усилий по обеспечению нужной вычислительной мощности и пропускной способности сетей.
Важно также стандартизировать критерии, используемые медицинскими организациями и врачами-рентгенологами для оценки результатов исследований, что позволит унифицировать и оптимизировать процесс внедрения и применения ПО на основе ТИИ. Такой подход будет способствовать улучшению качества разрабатываемых программных продуктов, обеспечивая их соответствие клиническим требованиям и повышая эффективность лучевой диагностики.
Исследования и разработки в области использования ПО на основе ТИИ в радиологии должны продолжаться, учитывая как потенциальные преимущества, так и возможные риски. Это поможет достичь баланса между инновационностью и безопасностью при внедрении цифровых технологий в медицинскую практику.
В основе успешного внедрения ПО на основе ТИИ лежит научная и клиническая обоснованность метода, его актуальность и удобство применения в клинической практике. Что касается практической эффективности ПО на основе ТИИ в обработке рентгенологических исследований, то она может быть достигнута благодаря автоматизации процессов подготовки исследований, что в конечном итоге позволит снизить трудозатраты врачей и повысить их эффективность, способствуя достижению целей автоматизации с использованием интеллектуальных технологий.
В последние годы активно разрабатывается отечественное ПО на основе ТИИ для различных видов профилактических исследований. Например, в России по состоянию на декабрь 2022 года два программных продукта для анализа результатов флюорографии и рентгенографии от компаний ООО «Медицинские скрининг системы» и ООО «ФтизисБиоМед», а также два продукта для анализа маммограмм от ООО «Медицинские скрининг системы» и ООО «СберМедИИ» получили статус медицинских изделий (РЗН 2021/14449, РЗН 2022/17406), что подчеркивает потенциал их использования в медицинской практике.
Конец ознакомительного фрагмента.
Текст предоставлен ООО «Литрес».
Прочитайте эту книгу целиком, купив полную легальную версию на Литрес.
Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.
Примечания
1
ПЗС – прибор с зарядовой связью.