Полная версия
Искусственный интеллект в здравоохранении
Подготовленные наборы данных могут быть структурированы посредством выделения признаков в соответствии с поставленной задачей. В процессе структурирования снижают размерность набора данных, оставляя достаточный список атрибутов для точного и полного описания элементов набора данных, что будет способствовать последующему обобщению шагов и проведению качественной разметки (аннотации) данных.
Фильтрация набора данных позволяет исключить данные, не соответствующие заданным параметрам (например, смазанные изображения), повысив их качество.
Существенную роль в подготовке данных играет разметка. Выделяется три вида разметки: ретроспективная, проспективная разметка, верификация [Национальный стандарт РФ ГОСТ Р 59921.5…].
Ретроспективная разметка представляет собой сбор элементов согласно указанным метаданным, перечень которых выбирают в соответствии с поставленной целью. Такую разметку проводят путем выгрузки данных из информационной системы. Ретроспективная разметка не предполагает выполнение манипуляций или какой-либо обработки элементов. Для каждого элемента набора данных устанавливают соответствие с информацией (диагноз, результаты лабораторного исследования и др.). К примеру, ретроспективная разметка пациентов с подтвержденной новой коронавирусной инфекцией предполагает следующий перечень метаданных: идентификационный номер, дата рождения, дата выполнения рентгенологического исследования, результаты теста на полимеразную цепную реакцию.
Проспективная разметка представляет собой сбор элементов в соответствии с поставленной целью, а также проведение дополнительных манипуляций с элементами (постановка меток начала и окончания события, меток обнаружения признаков, обозначений патологий и т. п.). Для проведения такой разметки помимо технических специалистов привлекаются лица, обладающие специальными знаниями, например медицинскими. Разметка проводится путем ручного аннотирования содержания данных или их частей, которое может быть выполнено в графической или текстовой форме либо при их комбинации.
Верификация данных может обеспечиваться:
– внесением дополнительных сведений в набор данных, подготовленный при проспективной разметке (например, дополнение результатами повторных исследований);
– слепым анализом набора данных экспертами с достижением заданного уровня согласованности их решений.
Основные критерии отнесения к верифицированному набору данных:
– данные получены из реальной практики (не допускается получение синтезированных данных, например ЭКГ от генератора физиологических сигналов);
– данные получены в «сыром виде» – без применения фильтров и математических средств постобработки;
– структура набора данных соответствует поставленной цели его формирования (обучение, аналитическая, клиническая валидация);
– количество наблюдений (исследований) достаточно для достижения статистической значимости результата;
– разметка проведена с использованием тезауруса (кодированной библиотеки типовых формулировок, соответствующих рекомендации ассоциации специалистов в данной области по ГОСТ 7.24, ГОСТ 7.25[7]).
В ходе первичной разметки отмечаются все целевые структуры в подготовленном наборе данных. Специалисты, проводящие разметку, должны быть компетентны в области конкретных типов данных (изображения, текстовые или сигнальные (ЭКГ, ЭЭГ, спирометрия), количественные (ЧСС, артериальное давление, спирометрия), бинарные данные (да/нет)). Экспертная разметка осуществляется специалистами с большим опытом работы (не менее трех лет) в областях, соответствующих решаемым задачам.
На всех этапах жизненного цикла системы ИИ важно обеспечить хранение верифицированного набора данных и доступ к нему. В решении этой задачи ключевую роль играют метаданные (metadata) – информация о ресурсе.
Метаданные применяют для классификации, упорядочения и описания. Они составляются для улучшения возможностей поиска, обеспечения доступа к данным, их совместимости и повторного использования.
Метаданные бывают трех типов:
– описательные (служат для обнаружения, сбора или группирования данных по общим для них характеристикам);
– структурные (определяют состав или организацию набора данных);
– административные (используются для управления базой данных).
Выбор зависит от типа данных. Например, метаданные для хранения верифицированного набора медицинских изображений могут включать:
1. Тип изображения:
– вид исследования (например, компьютерная томография);
– разрешение;
– общее число изображений и по сериям.
2. Число исследований.
3. Источники исследований:
– оборудование;
– типы оборудования;
– медицинскую организацию.
4. Параметры сканирования изображений.
5. Параметры хранения изображений:
– формат данных;
– уровень и тип сжатия данных.
6. Аннотацию (разметку):
– тип;
– что и как описано;
– привлеченную экспертную группу.
7. Контекст.
8. Как определена и промаркирована истинная разметка.
9. Связанные данные:
– демографические;
– клинические;
– лабораторные;
– геномные;
– временны́е;
– принимаемые препараты (лекарства);
– другие.
10. Временной диапазон сбора изображений (дата и время исследования).
11. Использование данных (какое программное обеспечение использовать для просмотра данных).
12. Кому принадлежат данные.
13. Кто ответственен за данные.
14. Допустимое использование.
15. Назначение набора данных.
16. Информацию об одобрении комитета по этике.
17. Информацию о деидентификации набора данных.
18. Информацию о проведенном контроле качества набора данных.
19. Параметры доступа:
– доступность;
– цену и лицензионные соглашения.
20. Распределение случаев (если применимо):
– процент «норма/патология» (код МКБ);
– данные патологии: число исследований с каждой патологией.
Данные необходимо передавать в локальное хранилище (при одноцентровом исследовании) либо во внешнее хранилище данных (в случае многоцентрового исследования). Хранение данных может быть организовано на локальном сервере или при облачном хранении. При этом доступность и безопасность обеспечиваются на лучшем уровне при использовании локального сервера. В то же время при облачном хранении возможны совместное использование данных и резервное копирование.
Статистические и научные данные, включая обезличенные данные, полученные посредством удаления идентифицирующих сведений из персональной информации (например, медицинской), должны быть защищены.
Необходимо установить стандартные процедуры доступа к набору данных для третьих лиц, закрепленные в документе о политике по защите информации. При организации доступа следует подписывать соглашение с организацией, формирующей наборы данных.
Важно отметить, что в медицине количество собираемых данных, пригодных для анализа системами ИИ, стремительно растет благодаря развитию новых технологий их получения и хранения (носимые устройства, электронные медицинские записи; генетическая информация, полученная путем секвенирования генома, и т. д.).
Тестовые задания
1. Обязательным признаком ИИ является…
A. Развитая нейронная сеть.
B. Использование возможностей, которые мы традиционно связываем с человеческим разумом.
C. Компьютерное зрение.
D. Высокая скорость обработки информации.
2. ИИ как комплекс технологических решений НЕ включает в себя…
A. Информационно-коммуникационную инфраструктуру.
B. Полностью автономный характер работы.
C. Программное обеспечение.
D. Процессы и сервисы по обработке данных и поиску решений.
3. Экспертная система как вид технологии ИИ характеризуется… (Выберите все подходящие варианты ответа.)
A. Четкой ограниченностью предметной области.
B. Способностью полностью заменить человека по своему функционалу.
C. Способностью объяснять ход и результат решения понятным для пользователя способом.
D. Наиболее быстрым из всех видов технологий ИИ принятием решений.
4. Какими факторами обусловлено ускоренное внедрение технологий на основе ИИ? (Выберите все подходящие варианты ответа.)
A. Полностью выработанным международным интегрированным правовым регулированием в области ИИ.
B. Высокой степенью влияния технологий на основе ИИ на результативность деятельности человека.
C. Высокой доступностью инструментов для разработки технологий на основе ИИ.
D. Потребностью в обработке больших объемов данных.
5. Какие признаки характеризуют сильный ИИ? (Выберите все подходящие варианты ответа.)
A. Постоянное самообучение.
B. Способность работать только по заранее заданным алгоритмам без возможности самостоятельно усваивать информацию из внешних источников.
C. Обладание компьютерным «самосознанием».
D. Способность к обработке потенциально бесконечного количества данных.
6. Передовые технологии ИИ по механизму копируют работу следующей составляющей человеческого организма…
A. Кровеносной системы.
B. Иммунной системы.
C. Мышц.
D. Нейронных связей.
7. Сверточная нейронная сеть разработана специально для распознавания…
A. Пиксельных изображений.
B. Звуковой информации.
C. Математических алгоритмов.
D. Больших символьных текстовых данных.
8. Перспективные методы ИИ – это…
A. Технологии и технологические решения, в которых ИИ используется в качестве обязательного элемента, включая робототехнику и управление беспилотным транспортом.
B. Предназначенный для решения задач и обработки данных (в том числе вычислений) программно-аппаратный комплекс или несколько взаимосвязанных комплексов, образующих единую инфраструктуру.
C. Методы, направленные на создание принципиально новой научно-технической продукции, в том числе в целях разработки универсального (сильного) ИИ.
D. Конфигурация, состав и принципы взаимодействия (включая обмен данными) элементов вычислительной системы.
9. Какие типы функций может выполнять ИИ?
A. Распознавание и синтез речи.
B. Интеллектуальную поддержку принятия решений.
C. Обработку визуальной информации с помощью компьютерного зрения.
D. Все перечисленные.
10. Набор данных – это…
A. Система взаимосвязанных технических устройств, предназначенных для ввода (вывода), обработки и хранения данных.
B. Совокупность данных, прошедших предварительную подготовку (обработку) в соответствии с требованиями законодательства Российской Федерации об информации, информационных технологиях и о защите информации и необходимых для разработки программного обеспечения на основе ИИ.
C. Набор алгоритмов, предназначенных для разработки технологических решений на основе ИИ, описанных с использованием языков программирования и размещенных в сети Интернет.
D. Технологии и технологические решения, в которых ИИ используется в качестве обязательного элемента, включая робототехнику и управление беспилотным транспортом.
Задачи для самостоятельного решения
Задача 1. История ИИ началась с древних мифов, историй и слухов об искусственных существах, созданных искусными мастерами и наделенных интеллектом или сознанием. Например, в греческой мифологии описан Талос, великан из бронзы, который охранял остров Крит. Он бросал валуны в корабли захватчиков и ежедневно совершал три круга по периметру острова. Аргонавты победили Талоса, удалив единственную пробку возле его ступни, что привело к вытеканию из корпуса великана жизненно важного ихора.
Прообраз ИИ был сформирован в искусстве и литературе. Представление о машинах с человекоподобным интеллектом восходит, по крайней мере, к роману Сэмюэля Батлера (Samuel Butler) «Эревон» (1872). Многие научно-фантастические рассказы описывают различные последствия создания искусственного интеллекта, в том числе восстания роботов. Среди наиболее известных – фильм Стэнли Кубрика (Stanley Kubrick) «2001: Космическая одиссея» с его смертоносным бортовым компьютером HAL 9000. HAL контрастирует с R2-D2 в «Звездных войнах» Джорджа Лукаса (1977) и роботом ВАЛЛ-И в одноименном фильме Эндрю Стэнтона (2008).
В 2019 г. футурист и директор института «Будущее сегодня» при Нью-Йоркском университете Эми Уэбб (Amy Webb) опубликовала книгу «Большая девятка» (Te Big Nine), в которой рассмотрела возможное влияние ИИ и девяти технологических гигантов (Google, Microsof, Amazon, Alibaba и др.) на будущее человечества. Вместо того чтобы оценивать «характер» систем ИИ, Уэбб критически смотрит на людей, стоящих за ними.
В ее идеальном сценарии технологические компании работают друг с другом и обществом для решения глобальных проблем. Например, с помощью высокотехнологичной медицины избавляют мир от инфекционных заболеваний (гриппа и других). В то же время в «прагматичных» сценариях, рассматриваемых Эми Уэбб, бизнес уклоняется от ответственности перед обществом и будущим в пользу прибыли. Автор предсказывает появление цифровых кастовых систем, в которых доступ к личным данным граждан будет заблокирован операционными системами технологических гигантов. Также через 50 лет, когда численность населения мира превысит 10 миллиардов, появится сильный ИИ. Китай, учитывая, что китайские технологические компании, входящие в девятку, контролируются правительством, создаст систему для уничтожения своих противников и получит все, что осталось от мировых ресурсов.
Вопросы:
1. Попробуйте сформировать собственное представление о том, как мог бы измениться мир с развитием технологий на основе ИИ через несколько столетий.
2. Как вы думаете, возможна ли ситуация, когда ИИ полностью заменит человека? В каких сферах?
Задача 2. В начале ноября 2018 г. аналитическая компания Forrester опубликовала два исследования в сфере ИИ – «Прогноз на 2019 год: автоматизация» и «Прогноз на 2019 год: искусственный интеллект». По мнению экспертов, компании переоценили ИИ и разочаруются в нем через год.
Конец ознакомительного фрагмента.
Текст предоставлен ООО «Литрес».
Прочитайте эту книгу целиком, купив полную легальную версию на Литрес.
Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.
Примечания
1
Искусственный интеллект (ИИ) / artificial intelligence (AI) как ключевой фактор цифровизации глобальной экономики. https://www.novostiitkanala.ru/news/detail.php?ID=117544 (дата обращения: 26.10.2022).
2
Искусственный интеллект (ИИ) / artificial intelligence (AI) как ключевой фактор цифровизации глобальной экономики. https://www.novostiitkanala.ru/news/detail.php?ID=117544 (дата обращения: 26.10.2022).
3
Внесен Минюстом в реестр иностранных агентов.
4
AI just won a poker tournament against professional players // New Scientist. https://www.newscientist.com/article/2119815-ai-just-won-a-poker-tournament-against-professional-players/ (дата обращения: 08.09.2022).
5
State of AI 2021 Report / CBINSIGHTS. March 9. 2022. https://www.cbinsights.com/research/report/ai-trends-2021/ (дата обращения: 22.10.2022)
6
Meta признана экстремистской организацией в Российской Федерации.
7
https://docs.cntd.ru/document/1200057506.