Введение
Развитие математики, биологии, психологии, кибернетики и других наук давно привело к внедрению различных технологий в повседневную деятельность человека. Одним из последних достижений следует считать попытки применения технологий искусственного интеллекта (ИИ), в том числе в анестезиологическо-реанимационной практике [1, 2, 3]. Использование ИИ значительно выросло в основном благодаря технологическим усовершенствованиям в статистике и вычислительной мощности, а также обработке огромных объемов данных для разработки анализа и прогнозов.
При этом внедрение ИИ произошло относительно незаметно и по многим направлениям в клинической практике, и это не только и не столько работа с большими объемами данных, сколько внедрение интеллектуальных режимов искусственной вентиляции легких, фармакологических программ доставки препаратов, систем управления информацией об анестезии, роботов для проведения процедур, оптимизация ресурсов и улучшение качества анестезиологического обеспечения на всех этапах периоперационного периода и многое другое [4, 5].
Отдельным направлением можно выделить использование ИИ в целях диагностики, когда в интерпретации данных машинное обучение или нейросеть может значительно помочь в выявлении тех или иных патологических состояний. В такой ситуации для анестезиолога диагностика трудных дыхательных путей может иметь одно из ключевых значений, так как ситуация «не могу интубировать/не могу вентилировать» с неудавшейся ларингоскопией и интубацией трахеи, служит наиболее частой причиной гибели пациентов, тяжелых неврологических осложнений, хотя и встречается достаточно редко.
Однако среди врачебного сообщества, в большинстве своем не имеющего технического образования, имеется почти полное непонимание сути ИИ, его возможностей и значения в современной медицине. ИИ приписывают те свойства и возможности, которыми он никогда не будет обладать, а идеи сверх (супер) ИИ с порабощением всего человечества на сегодня хоть и страшны, но относятся к научной фантастике, а не к реалиям.
Цель исследования
Обосновать принципы работы ИИ и определить его роль в диагностике трудных дыхательных путей у взрослых.
Материалы и методы
В первую часть статьи были отобраны публикации, посвященные истории развития ИИ основным механизмам его работы и разновидностям нейронных сетей. Для первой части статьи было отобрано 39 публикаций.
Для второй части статьи был произведен обзор литературы по международной базе данных Pubmed, русскоязычной elibrary.ru. Поисковыми словами для англоязычных баз данных были artificial intelligence, deep learning, difficult airways, для русскоязычных — искусственный интеллект, глубокое машинное обучение, трудные дыхательные пути. Ограничений по году публикации не было. Критерии включения статей: систематические обзоры, метаанализы, рандомизированные клинические исследования, обсервационные исследования, обзорные статьи. Критерии исключения: клинический случай, диссертационная работа, автореферат, тезис, применение методов ИИ в педиатрической практике. Первичный поиск определил 91 статью, после проведенной выборки, удаления дубликатов для анализа осталось 13 статей. Данные поиска представлены в блок-схеме PRISMA (рис. 1).
Рис. 1. Блок-схема PRISMA Fig. 1. PRISMA flowchart
Результаты и обсуждение
Искусственный интеллект. История создания и основные положения.
Необходимость создания ИИ диктуется особенностями человеческого разума. По мнению одного из пионеров использования ИИ, для диагностики трудных дыхательных путей (ТДП) Christopher W. Connor (2019), человеческий разум — «превосходно умеет оценивать движение и взаимодействие объектов в физическом мире, выводить причину и следствие на основе ограниченного числа примеров и экстраполировать эти примеры для определения планов действий, охватывающих ранее не встречавшиеся обстоятельства. Эта способность рассуждать подкреплена необыкновенной памятью, которая подсознательно разделяет события на те переживания, которые имеют и не имеют отношение к делу, а также способна сохранять эти воспоминания даже перед лицом значительного физического ущерба. Ассоциативная природа памяти означает, что те аспекты прошлого опыта, которые наиболее соответствуют нынешним обстоятельствам, могут быть почти без усилий вызваны сознательным мышлением. Однако этим выдающимся умственным способностям противопоставляются утомляемость, когнитивная лень, проявляющаяся склонностью к сокращению умственной работы, и детальная кратковременная рабочая память, имеющая крошечный объем. Человеческий разум медлителен и склонен к ошибкам при выполнении даже простых арифметических и логических рассуждений» [6].
Именно для улучшения возможностей человеческого разума стали разрабатываться различные приспособления и машины от аналитических машин до персональных компьютеров XXI в., которые могут быстро извлекать и обрабатывать данные из 32 гигабайт встроенной памяти (четверть триллиона дискретных бит информации) с абсолютной точностью и неутомимостью при условии выполнения правильно составленной программы.
При этом первый прототип современного компьютера «Аналитическая машина Ч. Беббиджа» был создан в середине XIX в., а первая программа к нему была написана A. Lovelace, дочкой лорда G.G. Byron, в 1843 г. [7].
A. Lovelace писала: «Аналитическая машина не претендует на создание чего-либо. Она может делать все, что мы знаем, как приказать ему выполнить. Она может следовать за анализом; но она не имеет силы предвидеть какие-либо аналитические отношения или истины. Ее задача — помочь нам сделать доступным то, с чем мы уже знакомы». «…подобно тому, как Жаккардов ткацкий станок может ткать цветы и листья, аналитическая машина способна создавать алгебраические формулы, а в перспективе — писать музыку, писать картины — и укажет науке такие пути, какие нам и не снились» [8].
Созданию ИИ предшествовало значительное продвижение в изучении работы мозга, открытие нейрона и принципов его функционирования. У человека в головном мозге находится свыше 90 млрд нейронов, каждый из которых может образовывать около 109 связей с другими нейронами. Другими словами, количество связей между нейронами стремиться к бесконечности. Однако работа самого нейрона заключается в возникновении потенциала действия, с помощью которого возникает электрохимический импульс. Любая информация в нейроне (например, ноцицептивная, температурная и другая чувствительность) передается и воспринимается в виде частотного кода (частота возникновения потенциала действия).
Именно эксперименты со зрительными нейронами на крысах и кошках впоследствии привели к созданию математической модели. Этому способствовала дружба профессора нейрофизиолога Warren McCullock и математика-вундеркинда Walter Pitts. Их совместные изыскания превратили язык психологии в конструктивное средство описания машины и машинного интеллекта. С этой целью ими была разработана теория деятельности головного мозга с помощью математического моделирования, а в 1943 г в работе «Логическое исчисление идей, относящихся к нервной активности» был описан искусственный и математический нейрон [9].
Искусственный нейрон (формальный нейрон) — элемент искусственных нейронных сетей, моделирующий некоторые функции биологического нейрона. Главная функция искусственного нейрона — формировать выходной сигнал в зависимости от сигналов, поступающих на его входы (рис. 2 и 3).
Рис. 2. Искусственный нейрон (рисунок из статьи Антипин А.Л., Зеленина Л.И. Моделирование процессов на основе нейронных сетей [Электронный ресурс] // Современные научные исследования и инновации. 2015. № 7. Ч. 4. URL: https://web.snauka.ru/issues/2015/07/55119) Примечание: х1,2,3 — входные данные; w1,2,3 — веса; S — функция (искусственный нейрон); Y — выходные данные. Fig. 2. Artificial neuron (picture from article of Antipin A.L., Zelenina L.I. Modeling of processes based on neural networks [Electronic resource] // Modern scientific research and innovation. 2015. N 7. P. 4. URL: https://web.snauka.ru/issues/2015/07/55119) Note: х1,2,3 — input data; w1,2,3 — weights; S — function (artificial neuron); Y — output data.
Входы — входные данные. Синапсы (узел) — это соединение между узлами или нейронами в искусственной нейронной сети. Соединение контролируется синаптическим весом. Математически синапс представлен в виде вектора веса. В ячейке нейрона происходит суммирование взвешенных входов, а полученная сумма преобразуется с помощью активационной функции нейрона. Аксон — выходные данные. Выход формируется с помощью функции активации, которая преобразует взвешенную сумму входных сигналов в определенное число.
На входе у математического нейрона имеется некоторое количество входных битов, каждый из которых умножается на некоторый действительный весовой коэффициент (вес). На выходе осуществляется проверка значения активационной функции, и если это значение выше некоторого порога, то нейрон активируется, если же ниже, то нейрон считается неактивированным.
Математический нейрон представляет собой пороговый элемент с несколькими входами и выходами. Каждый математический нейрон имеет свое определенное значение порога чувствительности.
Таким образом, искусственный нейрон служит для того, чтобы пропустить или не пропустить информацию, отвечая только на вопросы «Да» или «Нет». Аналогии с биологическим нейроном заканчиваются после схожего названия, а сама работа биологического и математического нейронов осуществляется совершенно по разным принципам. Биологический нейрон кодирует информацию с помощью частотных характеристик, а искусственный нейрон с помощью математики линейных комбинаций и нелинейных активационных функций, что более близко к амплитудному кодированию, а не частотному. То есть в классических нейронных сетях отсутствует естественная динамика спайков, которая является ключевой для биологических нейронов [10].
В отличие от биологического нейрона, математический нейрон обучается с помощью машинного обучения. Машинное обучение математического нейрона — это поиск веса. Таким образом создается интеллектуальная система, которая обучается и развивается на основе получаемых ими данных. Не вдаваясь в излишние подробности, существует три концептуальных подхода к обучению нейронных сетей: обучение без учителя, обучение с учителем; обучение с подкреплением [11].
В середине 1958 г. Фрэнк Розенблат предложил модель электронного устройства, названного им перцептроном, которое должно было бы имитировать процессы человеческого мышления (рис. 3). Перцептрон должен был передавать сигналы от «глаза», составленного из фотоэлементов, в блоки электромеханических ячеек памяти, которые оценивали относительную величину электрических сигналов. Эти ячейки соединялись между собой случайным образом в соответствии с принципами коннекционизма. Два года спустя была продемонстрирована первая действующая машина «Марк-1», которая могла научиться распознавать некоторые из букв, написанных на карточках, которые подносили к его «глазам», напоминающим кинокамеры [12].
Рис. 3. Модель первой нейронной сети (перцептрон) (рис. A. Krainov, https://ru.wikipedia.org/wiki/Файл:Perceptron-ru.svg, Creative Commons Attribution) Fig. 3. Model of the first neuronal network (perceptron) (Credit: A. Krainov, https://ru.wikipedia.org/wiki/Файл:Perceptron-ru.svg, Creative Commons Attribution)
Создание первой искусственной нейронной сети и служит отправной точкой развития целого огромного направления в программировании, которое принято называть ИИ.
Искусственный интеллект — недетерминированные алгоритмы без образования нейронных связей (машинное обучение) или с образованием нейронных связей (глубокое обучение) с весом для каждого сигнала при обучении и возможностью перехода в детерминированные алгоритмы после обучения для конкретных входных данных, где недетерминированный алгоритм — функция, которая при одних и тех же значениях выдает разные результаты; детерминированный алгоритм — функция, которая при одних и тех же значениях выдает одинаковые результаты; нейрон — математическая функция, которая занимается отсевом вероятных возможностей; вес — параметр, который определяет важность каждого сигнала; входные данные — это набор данных, которые используются для обучения нейронов сети или предсказания определенного результата.
Исходя из представленного определения, различают два вида ИИ: машинное и глубокое обучение [13].
Машинное обучение — это ИИ, который может автоматически адаптироваться с минимальным вмешательством человека. К нему относят такие методы математических алгоритмов, как «Случайный лес», «Логистическая регрессия», «Линейная регрессия», «Градиентный бустинг на решающих деревьях», «Метод опорных векторов», «Дерево решений» и некоторые другие.
Глубокое обучение — это разновидность машинного обучения, которая использует искусственные нейронные сети для имитации процесса обучения человеческого мозга. При этом нейронные сети могут помочь в обнаружении неочевидных связей между наблюдаемыми объектами, собственно, что и служит основным преимуществом их использования для различных целей. Использование нейронных сетей для обнаружения «очевидностей» скорее всего потерпит фиаско и не приведет к желаемому результату.
Рис. 4. Функции нейронных сетей (рис. М.В. Стародуба) Fig. 4. Functions of neuronal network (Credit: M.V. Starodub)
При взаимодействии пары сетей друг над другом получается двойная сеть. При этом первый слой сети остается скрытым, а второй слой (финальный), содержащий один нейрон, является выходом из сети. Скрытый слой — это терминология в машинном обучении, которая говорит о том, что человек, который работает с этой нейронной сетью, не может управлять данными, весами и т. д. в этих слоях, это так называемый черный ящик, в который мы не можем заглянуть, но в нем что-то происходит, после чего выдается результат.
Наконец, еще одной разновидностью глубокого обучения служат рекуррентные нейронные сети (сети J.L. Elman [199]), M.I. Jordan [1986], J. Hopfield [1982]) [14, 15, 16]. Рекуррентные нейронные сети (повторно используемые) используют обратную связь так, что выходные данные системы зависят как от текущего состояния ввода, так и от предыдущих входных данных, что позволяет сети реагировать на тенденции, которые развиваются с течением времени. В показанной на рис. 5 структуре сети Элмана контекстный уровень питается от скрытого уровня и обратно. Интересно отметить, что построение рекуррентной сети используется в теории «Зрительного сознания (реккурентной обработки)» Victor Lamme (2000) [17].
Рис. 5. Пример рекуррентной нейронной сети (рис. М.В. Стародуба) Fig. 5. Example of the reccurent neuronal network (Credit: M.V. Starodub)
Отдельно необходимо остановиться на сверхточных нейронных сетях. Сверхточные нейронные сети так же были вдохновлены биологическими процессами и являются вариацией многослойного персептрона, спроектированного для использования минимального объема предобработки (любые манипуляции с данными перед их подачей в модель с целью сделать их более удобными для анализа и распознавания паттернов моделью, для повышения точности и эффективности работы нейронной сети). Такие сети находят широкое применение в обработке видео и изображений, советующих системах и обработке естественного языка (обучение нейронной сети взаимодействовать с человеческим языком, например, писать текст), что особенно важно в диагностике ТДП по фотографии пациента [18, 19].
Таким образом, необходимо понимать, что развитие искусственных нейронных сетей только вдохновляется биологией. То есть, рассматривая сетевые конфигурации и алгоритмы, исследователи применяют термины, заимствованные из принципов организации мозговой деятельности. Но на этом аналогия заканчивается. Нейронные сети — это всего лишь математические функции, различные разновидности алгоритмов, которые можно направить на поиск нелинейных зависимостей, которые человеческому мозгу в повседневной деятельности установить очень тяжело и скорее всего невозможно.
Что может ИИ в диагностике ТДП?
На сегодня описано несколько подходов в обучении ИИ диагностике ТДП: физикальные методы исследования (например, шкала LEMON [Look externally, Evaluate the 3-3-2 rule, Mallampati score, Obstructed airway, and Neck mobilit], El-Ganzouri и др.), прогнозирование ТДП по фотографиям пациента, использование данных тепловизора, комбинация этих методов с помощью оценки человеческого голоса. Наиболее распространенными являются методы ИИ, которые с помощью анализа фотографий лица пациента предугадывают трудную ларингоскопию и интубацию трахеи. Идея использования ИИ для анализа фотографий человеческого лицевого черепа с целью диагностики ТДП не нова [20]. Однако сразу стоит отметить, что, в отличие от человеческого мозга, анализ фотографий с помощью компьютерных программ происходит совершенно по-другому и сложнее. Машина «видит» последовательность пикселей и на этой последовательности учится. Только после этого ИИ может находить точки на лице для точного и правильного их расположения на объекте. Такой метод очень энергозатратен и длителен, а также требователен к объему памяти.
Диагностика ТДП с помощью ИИ разделяется на три этапа. На первом этапе определяются простые расстояния между выбранными ориентирами, собирается информация о глобальной форме головы и о цвете кожи. С этой целью обычно используют различные детекторы лиц, например, модель V. Bruce и А. Young (1986) [21]. На втором этапе рассчитывается статистическая значимость признаков ТДП, после чего наиболее значимые признаки передаются в классификатор. Процесс выравнивания изображений включает жесткое перемещение и нежесткую деформацию шаблона для минимизации расстояния между ним и изображением запроса. На третьем этапе классификатор распределяет пациентов по степеням сложности ларингоскопии или интубации трахеи (легкая, средняя, тяжелая) с использованием тироментального расстояния (тест Патила), шкалы Маllampati, шкалы Cormack и Lehane (1984) или балльной шкалы сложной интубации (Intubation difficulty scale [IDS]) Aldnet (1997).
Первой опубликованной работой применения ИИ для предсказания ТДП следует считать обзорную статью «Artificial intelligence and machine learning in anesthesiology» уже упоминавшихся C. Connor и S. Segal (2011). Фотографии 300 пациентов были проанализированы с помощью программного обеспечения для анализа структуры лица (FaceGen Modeller v3.3; Singular Inversions, Торонто, Канада) и сравнены с результатами интубации трахеи (легкой и сложной) при тестировании пациентов по шкале Маllampati и при помощи теста Патила. Созданная модель включала 3 параметра лица и тироментальное расстояние и правильно классифицировала 70 из 80 пациентов (p < 10-8). Напротив, лучшая комбинация класса Маllampati и тироментального расстояния правильно классифицировала трудную интубацию трахеи всего в 47 из 80 наблюдений (р = 0,073). Чувствительность, специфичность составляли 90 % и 85 % соответственно, а площадь под кривой для компьютерной модели — 0,899. Кроме того, программе удалось создать внешний вид лица, которое алгоритм считает наиболее трудным и легким для интубации трахеи.
Таким образом, компьютерный анализ структуры лица и тироментального расстояния позволил классифицировать легкую и трудную интубацию с точностью, значительно превосходящей популярные клинические прогностические тесты. Однако программному обеспечению требовалось около 15 мин для моделирования каждого лица по цифровым фотографиям, что было связано с неэффективным на тот момент алгоритмом, при котором затрачивались значительные вычислительные мощности на моделирование окраски и цвета кожи [22].
G. Cuendet et al. (2016) представили полностью автоматический метод прогнозирования трудной интубации трахеи с помощью машинного обучения алгоритмом «Случайного леса», который разработали на анализе фотографий, видео и физикальных методов осмотра 970 пациентов (описательное исследование). Для этих целей фотографировали в 4 шаблонах с последующим определением точек (ориентиры, например, для каждой брови, глаза носа и т. д.). Фронтальный шаблон в нейтральной позиции (99 точек), фронтальный с открытым ртом (99 точек), фронтальный с высунутым языком (99 точек) и нейтральный профиль (сбоку) (52 точки) [23].
Тайские анестезиологи Arunotai Siriussawakul et al. (2018) в мультицентровом исследовании попытались с помощью модели бинарной логистической регрессии создать оценку прогностической эффективности недавно разработанной практической многомерной модели трудной интубации для пациентов с ожирением. С этой целью, кроме индекса массы тела (ИМТ) > 30 кг/м2, пациентам проводили 10 общепризнанных предоперационных тестов на выявление ТДП. Трудность интубации трахеи определялась по шкале IDS. К сожалению, прогностическая эффективность выбранной модели показала ограниченную пользу предоперационного скрининга для прогнозирования трудной интубации трахеи среди пациентов с ожирением. Однако, как отметили сами авторы, в Таиланде крайне мало людей с ожирением, чтобы данная модель ИИ показала хорошие результаты.
Таким образом, начало использования моделей ИИ для диагностики ТДП с помощью анализа фотографий пациентов выявило новые проблемы, требующие своевременного решения. Трудность обработки фотографий имеет многогранные подходы, хотя и решается с помощью достаточно большого количества программ. Однако выбор алгоритмов для машинного обучения остается важным, так как не каждый подходит для связи изображения пациента с клинической картиной трудной интубации и ларингоскопии [24].
Cheng-Mao Zhou et al. (2021) опубликовали ретроспективное исследование 1015 хирургических пациентов, посвященное выбору алгоритма машинного обучения при прогнозировании ТДП у больных с ожирением, в котором использовали открытую базу данных. Данные в общедоступной базе данных исключали пациентов с очевидными пороками развития верхних дыхательных путей, трудностями или неудачной интубацией трахеи. Из 6 рассматриваемых алгоритмов — «Логистическая регрессия» (LR), «Дерево решений» (Decision Tree), «Случайный лес» (Random Forest), «Усиление градиентного бустинга» (Gbdt), «Экстремальное градиентное усиление» (Xgbc), LightGBM (Gbm) только три (DecisionTree, Gbdt и Xgbc) могли прогнозировать трудную интубацию трахеи у пациентов с ожирением, а алгоритм Xgbc в целом превосходил другие [25].
Подтверждением превосходства алгоритма Xgbc над другими служит исследование F. García-García et al. (2024). В проведенном обсервационном проспективном когортном исследовании 624 пациентов было зафиксировано 53 случая трудной интубации трахеи. По мнению авторов, все четыре алгоритма машинного обучения превзошли все клинические показатели со значительно более высокими значениями AUC, а алгоритм Xgbc был признан наиболее эффективной моделью, поскольку он дал наименьшее количество ложноотрицательных результатов. Кроме того, было выяснено, что, кроме шкалы Mallampati, область видимого языка, угол между верхней и нижней губами в области их комиссур и т. д. дают значимые результаты в прогнозировании ТДП [26]. Однако не все исследователи пытаются обучить ИИ диагностике ТДП с помощью фотографий лица.
Еще одним подтверждением эффективности алгоритма Xgbc стало описательное исследование Cheng-Mao Zhou et al. (2022), посвященное прогнозированию сложной интубации трахеи при операциях на щитовидной железе с помощью 10 алгоритмов машинного и глубокого обучения. Xgbc показал наилучшие результаты в целом с AUC > 0,8, точностью > 90% и достоверностью 100 % [27].
Так, Syunsuke Yamanaka et al. (2022) в многоцентровом проспективном исследовании 10 741 интубаций трахеи в отделениях неотложной помощи (13 отделений) исследовали 7 моделей машинного обучения (например, модель «Случайного леса»), используя регулярно собираемые данные (например, демографические данные, физикальные методы оценки дыхательных путей). Их эффективность сравнивали с модифицированными критериями шкалы LEMON для оценки ТДП и с моделью «Логистической регрессии» для успеха интубации трахеи с первой попытки. Прогнозирование ТДП и распознавание успеха с первой попытки интубации трахеи с помощью моделей машинного обучения имели более высокую способность к распознаванию, чем модифицированные критерии шкалы LEMON. Исключение составили методы ближайшего соседа по k-точке и многослойного персептрона [28]. 2021 г. можно считать годом, когда для ТДП стали использовать более современные методы ИИ как глубокое обучение.
Исследование Th.E. Tavolara et al. (2021) представляет собой значимый прорыв в области прогнозирования сложности интубации трахеи пациентов. Они использовали обширную базу данных изображений лиц знаменитостей (CASIA-Webface) для обучения 11 сверточных нейронных сетей (Comvolutional Neural Network — CNN) на 11 различных областях лица. Эти модели CNN служили для извлечения признаков с лиц пациентов. Затем, применяя множественную модель обучения, они классифицировали пациентов по сложности интубации. Это позволило учесть множество различий в лицах пациентов и повысило точность классификации. Результаты исследования показали, что разработанный метод выявления сложности интубации на основе «ансамбля» экстракторов признаков с использованием CNN превосходит традиционные прикроватные тесты и обычные методы глубокого обучения по чувствительности и специфичности. Это демонстрирует потенциал использования нейронных сетей для предсказания сложности процедур медицинского характера на основе изображений лиц пациентов [29].
Guangzhi Wang et al. (2023) разработали полностью автоматическую полуконтролируемую модель глубокого обучения. В одноцентровом обсервационном исследовании для каждого из 1000 пациентов, которым была назначена плановая операция под общей анестезией, были получены изображения с 9 различных точек на лице. Собранный набор изображений был разделен на обучающую и тестовую подгруппы в соотношении 8 : 2. Показатели эффективности модели диагностики ТДП были оценены с использованием точности, чувствительности, специфичности, показателя F1 и площади под кривой ROC (AUC). Численные значения этих показателей составили 90,00 %, 89,58 %, 90,13 %, 81,13 % и 0,9435 соответственно и не имели существенных отличий между моделями с полным или полуконтролируемым обучением. Таким образом, модель глубокого обучения с полуконтролем, обученная с использованием только 30 % размеченных образцов, может достичь эффекта, сравнимого с моделью с полным контролем, но при меньших затратах на маркировку образцов [30]. Как уже отмечалось, модели на основе фотографий лица могут быть дополнены исследованиями с помощью тепловизора. Так, Tatsuya Hayasaka et al. (2021) в обсервационном исследовании создали модель ИИ для классификации трудностей интубации с помощью глубокого обучения с использованием изображений лица, полученных в 16 различных положениях тела. Лучшая модель ИИ для классификации трудностей интубации была получена в положении лежа на боку с закрытым ртом с AUC 0,864 [0,731–0,969], точностью 80,5 %, чувствительностью 81,8 % и специфичностью 83,3 %. Для того чтобы визуализировать, как модель ИИ различает сложную интубацию, была получена тепловая карта активации класса с помощью Grad-CAM. Однако тепловая карта показала, что область вокруг шеи, как правило, оценивалась на изображении лица пациента, которого было легко интубировать [31].
Еще одним направлением стало изучение вместо прямой ларингоскопии более современного метода — видеоларингоскопии, а к диагностике ТДП по фотографиям лица пациента были добавлены тепловые карты тепловизора с использованием градиентно-взвешенного картирования активации классов (Grad-CAM++). Градиентно-взвешенное картирование активации классов (Grad-CAM, Grad-weighted Class Activation Mapping) — метод визуализации, используемый для интерпретации и объяснения решений, принимаемых сверточными нейронными сетями. Он помогает понять, какие части изображения наиболее важны для предсказания определенного класса. В работе в общей сложности было оценено 7194 пациента на предмет соответствия требованиям исследования. Из исследования исключили 1345 пациентов (882 пациента с неполными изображениями и 463 — без данных об интубации трахеи). Наконец, для окончательного анализа были проанализированы данные 5849 пациентов, в том числе 5335 пациентов с несложной видеоларингоскопией и 514 пациентов со сложной видеоларингоскопией. Частота сложных видеоларингоскопий составила 8,79 %, а изучаемых предикторов ТДП — 61 % (модифицированный тест Mallampati, выдвижение нижней челюсти, межрезцовый промежуток, щитовидно-подбородочное расстояние, положение вытянутого языка, открытый рот и др.).
Исходные характеристики пациентов со сложной и несложной видеоларингоскопией показали существенные различия в возрасте, поле, ИМТ, потреблении алкоголя, курении и оценке физиологического состояния по шкале ASA (American Society of Anesthesiologists) между исследуемыми моделями. Положение вытянутого языка, открытого рта и прикуса верхней губы имело AUROC > 0,7, комбинированная модель показала AURO = 0,778, а модель по 7 фотографиям лица — AUROC = 0,779. Не было существенной разницы в прогнозирующей эффективности между комбинированной моделью и моделью лица. Несмотря на то что авторы предлагают анализ лица по фотографиям пациента как превосходную модель ИИ, так как она не требует дополнительного клинического обследования, такие значения корреляции все же считаются средними [32].
Однако описан и подход только с анализом фото из видеоизображений при видеоларингоскопии у ургентных пациентов. Seung Jae Choiet al. (2023) в ретроспективном обсервационном исследовании вручную маркировали изображения из 54 видео при выполнении видеоларингоскопии в отделении неотложной помощи при выполнении экстренной эндотрахеальной интубации, которые включали размытые изображения, затуманенное зрение, кровь, слизь и рвотные массы у языка, надгортанника, голосовых связок и рожковидного хряща с использованием моделей семантической сегментации DeepLabv3+ и U-Net, а также модели сегментации экземпляров Mask R-CNN. При этом под сегментацией изображения следует понимать процесс разделения цифрового изображения на несколько сегментов (множество пикселей). Сегментация обычно используется для того, чтобы выделить объекты и границы (линии, кривые и т. д.) на изображениях. Были получены коэффициенты Серенсена 0,1167, 0,7677, 0,7207 и 0,57 в Configured Mask R-CNN для языка, надгортанника, голосовых складок и рожковидных хрящей. О диагностической ценности такого подхода пока судить рано, но авторы и дальше продолжают разработку модели ИИ с сегментацией изображений структур гортани и глотки [33].
Совершенно иной подход связан с оценкой человеческого голоса, в частности звуковых частот, для прогнозирования ТДП. Голосовой тракт, включающий всю структуру, ограниченную сзади голосовыми связками, а спереди губами и ноздрями, играет важную роль в доступе к трахее. Считается, что изменения в морфологии голосового тракта могут впоследствии изменить свойства резонанса, что приведет к изменениям некоторых акустических параметров голоса [34–37]. Более интенсивные частоты в спектре голосовых частот, а именно голосовые форманты, являются примерами этих параметров. Частота каждой голосовой форманты определяется площадью определенного сегмента голосового тракта [35, 38, 39]. Первая форманта (F1) возникает в задней полости рта и связана с открытием нижней челюсти и рта и высотой языка в полости рта. Вторая форманта (F2) расположена в передней части полости рта и связана с переднезадним смещением языка. Третья форманта (F3) связана с полостью позади сужения языка, а та, что перед ним, — с полостью глотки и передней полостью. Четвертая форманта (F4), вероятно, связана с длиной гортани [40, 41]. Таким образом, частоты формант человеческого голоса могут предоставить информацию об анатомии верхних дыхательных путей пациента, а также о степени сложности манипуляций с ними.
C.C. de Carvalho et al. (2019) в своей проспективной обсервационной работе перед оперативным вмешательством и общей анестезией оценивали возраст, пол, рост, вес, ИМТ, физическое состояние по шкале ASA, тест Маllampati, открывание рта, стерноментальное расстояние, характеристики формант и сложность ларингоскопии по шкале Cormack и Lehane. Для оценки формант просили произнести фонемы [a], [ɛ], [i], [ɔ], [u] в соответствии с Международным фонетическим алфавитом [42]. Эти фонемы рассматриваются как гласные «a», «e», «i», «o», «u» соответственно, а их первые пять формант описывали как F1, F2, F3, F4 и F5, так что третья форманта фонемы [i] описывалась как iF5. Для извлечения формант использовалась программа Praat. Полученные данные демонстрируют возможности голоса в прогнозировании ТДП. Авторы связывают свои выводы с изменениями в каркасе гортани из-за разрастания ее структур, которые приводят к углублению основной частоты и формант с сужением формантного промежутка или дисперсии. При этом прогностические значения для модели, содержащей шкалу Маllampati и форманты, были выше, чем значения для моделей с одной переменной.
Выводы
Внедрение в практику анестезиолога ИИ — давно состоявшийся факт, который охватывает уже несколько десятилетий от разработки экспертных алгоритмов (компьютерных программ, напоминающих суждения человека-эксперта) до выполнения сложных задач прогнозирования реакций пациента на лекарственные препараты, используемые в анестезиологической практике, распознавания факторов риска, связанных с осложнениями, и даже помощи в управлении анестезией во время операции [43–46].
Многочисленные применения ИИ в области анестезии значительно повысили безопасность пациентов и качество лечения. Мониторинг жизненно важных показателей пациентов является одним из наиболее важных применений ИИ в анестезии [47]. Частота сердечных сокращений, артериальное давление, насыщение кислородом и другие жизненно важные показатели пациента могут постоянно контролироваться системами ИИ, которые также могут уведомлять анестезиолога о любых изменениях, которые могут быть проблематичными [48]. Это в полной мере относится и к прогнозированию, и к предотвращению неблагоприятных исходов во время проведения анестезиологического обеспечения.
Однако для эффективной работы систем ИИ требуются высококачественные данные, особенно те, которые построены на концепциях машинного обучения и глубокого обучения. Алгоритмы ИИ обучаются на основе этих данных, что позволяет им со временем развивать и повышать свою производительность. Однако получение этой информации может оказаться непростой задачей. Эти данные собираются из различных источников, таких как наркозные аппараты, мониторы пациентов и электронные медицинские карты. Таким образом, гарантировать точность, полноту и непротиворечивость этих данных на сегодня довольно сложно. Необходимо учитывать, что безопасность пациентов может быть поставлена под угрозу из-за неправильных алгоритмов ИИ, вызванных неполными или ошибочными данными [49–51]. Кроме того, системы ИИ по-прежнему имеют ряд ограничений. Например, у ИИ могут возникнуть проблемы с пониманием сложных медицинских идей или адаптацией к новым обстоятельствам. Они также полагаются на качество данных, используемых для их обучения и программирования. Системы ИИ могут давать неточные прогнозы или рекомендации, если они были неправильно разработаны или обучены на предвзятых или нерепрезентативных данных [49]. Кроме того, ИИ не хватает сочувствия и человеческого суждения, которые необходимы в здравоохранении. Например, в зависимости от данных пациента система ИИ может предложить определенную стратегию анестезии, но она не может принять во внимание опасения или тревогу пациента по поводу лечения. Использование ИИ в здравоохранении вызывает ряд юридических и этических проблем. Например, кто будет нести ответственность, если система ИИ допустит ошибку? Анестезиолог, который ее использовал, программист, который ее создал, или больница, которая ввела ее в эксплуатацию? Даже если ИИ сможет автоматизировать некоторые задачи, человеческий фактор по-прежнему важен в здравоохранении; поэтому его целью должна быть поддержка медицинских работников, а не их замена [52]. Это в полной мере относится к диагностике и предсказанию трудной ларингоскопии и интубации трахеи, когда с помощью внесения данных физикального исследования перед анестезией или фотографий лица в разных проекциях, данных тепловизора головы и шеи, а также оценки звуковых частот человеческого голоса получается заблаговременно распознать ТДП, в том числе у больных, которые находятся в ургентной ситуации. В свою очередь ранняя диагностика ТДП должна позволить не только обезопасить пациентов и избежать ситуаций «не могу интубировать/не могу вентилировать» которые являются основной причиной летальных исходов и тяжелых неврологических осложнений, но и высвободить время анестезиолога для решения других задач.
Выбор модели обучения ИИ и последующей диагностики ТДП постоянно совершенствуется. Однако сложный анализ фотографий лица для этих целей хоть и выглядит очень впечатляющим и современным, но будет задействовать большую производительность современных компьютеров и потребует больших серверов для хранения данных, что в совокупности значительно удорожает их использование. Не менее сложным видится и оценка звуковых частот человеческого голоса.
Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов.
Disclosure. The authors declare no competing interests.
Вклад авторов. Все авторы в равной степени участвовали в разработке концепции статьи, получении и анализе фактических данных, написании и редактировании текста статьи, проверке и утверждении текста статьи.
Author contribution. All authors according to the ICMJE criteria participated in the development of the concept of the article, obtaining and analyzing factual data, writing and editing the text of the article, checking and approving the text of the article.
Этическое утверждение. Не требуется.
Ethics approval. Not required.
Информация о финансировании. Авторы заявляют об отсутствии внешнего финансирования при проведении исследования.
Funding source. This study was not supported by any external sources of funding.
Декларация о наличии данных. Данные, подтверждающие выводы этого исследования, можно получить у корреспондирующего автора по обоснованному запросу.
Data Availability Statement. The data that support the findings of this study are available from the corresponding author upon reasonable request.