Введение
Острая дыхательная недостаточность (ОДН) является одним из самых частых послеоперационных осложнений в детской кардиохирургии. Патофизиология ОДН после операции на сердце мультифакторна и включает неблагоприятные эффекты общей анестезии, в том числе ятрогенного ателектазирования при индуцированном апноэ в момент выполнения основного этапа операции, искусственного кровообращения (ИК), хирургической травмы, гипотермии [1, 2, 3], а также, вероятно, предсуществующего поражения легких.
Общая анестезия приводит к снижению тонуса диафрагмальных и межреберных мышц, а также функциональной остаточной емкости легких, что потенциально приводит к развитию в послеоперационный период ателектазирования и увеличению фракции шунта до 15 % и выше [4]. ИК вызывает системную воспалительную реакцию с активацией лейкоцитов и тромбоцитов, компонентов комплимента, системы коагуляции и фибринолиза, цитокинов, способствуя развитию капиллярной утечки, воспалению и микроателектазированию паренхимы, интерстициальному отеку, что приводит к постперфузионному повреждению легких [2, 3, 5]. В процессе проведения ревизии и перикардиотомии, а также в результате работы коагулятором существует риск травматизации диафрагмальных нервов, что может вызвать парез или паралич купола диафрагмы и способствовать развитию ателектазов в нижних долях легких [6, 7]. Кроме того, мы полагаем, что вклад в развитие послеоперационной ОДН в значительной степени вносит предсуществующее повреждение легких, а также тип врожденного порока сердца (ВПС), который потенциально обусловливает степень этого поражения в виде интерстициального отека и ателектазирования. В свою очередь послеоперационная ОДН увеличивает риск неблагоприятных исходов, включая почечные, неврологические и инфекционные осложнения, увеличение продолжительности искусственной вентиляции легких (ИВЛ), пребывания в отделении интенсивной терапии и стационаре, а также риск летального исхода [8].
Несмотря на существование классических методов диагностики причин ОДН, все они имеют свои ограничения, особенно в критическом состоянии пациента и при ограниченных возможностях транспортировки. В последние десятилетия наблюдается развитие нового метода диагностики дыхательной системы, основанного на ультразвуковой визуализации, который успешно применяется во взрослой практике и активно внедряется в педиатрии. Ультразвуковая визуализация позволяет своевременно выявлять патологии легких в отделениях интенсивной терапии. Метод демонстрирует высокую чувствительность к различным патологическим процессам в легких, включая альвеолярные консолидации [9], интерстициальный синдром [10, 11], плевральный выпот [12, 13] и пневмоторакс [9, 14, 15].
Имеются данные, что ультразвуковое исследование (УЗИ) легких позволяет прогнозировать послеоперационные осложнения в детской кардиохирургии, а также используется для проведения визуально контролируемой интенсивной терапии [16]. Так, в статье Ghotra G.S. et al. многофакторный анализ показал, что балльная оценка УЗИ легких является независимым предиктором легочных осложнений, продолжительности ИВЛ и пребывания в отделении интенсивной терапии [17] Girona-Alarcón M et al. получили схожие результаты [18]. В исследовании Cantinotti M. et al. было показано, что оценка УЗИ легких является независимым предиктором длительности нахождения в реанимации и успешности экстубации трахеи [19]. УЗИ диафрагмы, по данным литературы, также позволяет прогнозировать успешную экстубацию [20].
Прогнозирование развития ОДН в послеоперационный период поможет принимать обоснованные решения о дальнейшей стратегии лечения и предотвращении возможных осложнений.
Проведенное нами исследование выполняет роль пилотного проекта, позволяя проверить техническую реализуемость предложенного подхода в предсказании развития ОДН у данной категории пациентов с целью принятия обоснованных решений о дальнейшей стратегии лечения и минимизации возможных осложнений. Представленная статья позволяет получить первичные результаты, которые могут быть использованы для планирования более крупномасштабных исследований, а также выявить ограничения текущего подхода и предложить пути их преодоления. Таким образом, результаты пилотного исследования могут стать основой для дальнейшего развития прогностической модели и ее внедрения в клиническую практику.
Цель исследования
Разработать прогностическую модель развития ОДН в послеоперационный период у детей грудного возраста после радикальных кардиохирургических операций на основе УЗИ легких.
Материалы и методы
Рандомизированное контролируемое пилотное исследование проводилось на базе детского отделения анестезиологии-реанимации (ОАРд) Федерального центра сердечно-сосудистой хирургии г. Красноярска. В исследование было включено 60 детей с ВПС в возрасте 1–12 месяцев, получавших комплексное лечение и диагностику с октября 2023 по декабрь 2024 г., методом сплошного охвата при соответствии критериям включения. Такой подход обеспечивает репрезентативность выборки и минимизирует возможные смещения. Объем выборки в 60 пациентов является ограниченным, что характерно для клинических исследований в области детской кардиохирургии. Это ограничение связано с малым числом пациентов, нуждающихся в таких вмешательствах. Учитывая ограниченный объем выборки, была применена строгая методология: обучение модели на обучающей выборке, ее фиксация, последующая калибровка на независимой калибровочной выборке и кросс-валидация по методу Монте—Карло с 1000 итераций на независимой тестовой выборке.
Протоколы исследований и проекты информированных согласий были одобрены локальным этическим комитетом ФГБОУ ВО «Красноярский государственный медицинский университет им. проф. В.Ф. Войно-Ясенецкого» Минздрава России (протокол № 122/2023 от 29.11.2023 г.). Информированное согласие было подписано законными представителями всех пациентов, включенных в исследование при поступлении в кардиохирургическое отделение, до начала исследования.
Критерии включения:
- возраст 1–12 месяцев на момент проведения исследования;
- предполагаемая первичная радикальная коррекция ВПС в условиях искусственного кровообращения (ИК);
- наличие подписанного добровольного информированного согласия родителей или законных представителей ребенка.
Критерии невключения:
- новорожденные или дети старше 1 года;
- наличие тяжелых сопутствующих заболеваний в анамнезе, способных значимо повлиять на течение раннего послеоперационного периода;
- цианотические ВПС;
- паллиативная коррекция ВПС;
- коррекция ВПС без проведения ИК;
- отсутствие подписанного добровольного информированного согласия на проведение исследования.
Критерии исключения:
- отзыв добровольного информированного согласия на проведение исследования;
- летальный исход (1 случай).
Исследование включало 3 этапа. На первом этапе производился сбор данных для создания прогностической модели на дооперационном и послеоперационном оценочных периодах. На втором этапе выполнялось определение наличия или отсутствия ОДН в оценочном периоде перед переводом в профильное отделение (первичная конечная точка). На третьем этапе осуществлялись создание и тестирование прогностических моделей, статистическая обработка данных и формирование результатов исследования (рис. 1).
Рис. 1. Блок-схема дизайна исследования. Этап 1 — дооперационный и послеоперационный оценочные периоды. Этап 2 — оценочный период перед переводом в профильное отделение Fig. 1. Flowchart of the research design. Stage 1 — preoperative and postoperative assessment periods. Stage 2 — assessment period prior to transfer to the specialized department
Протокол УЗИ легких
УЗИ легких выполнялось линейными датчиками 5–12 МГц (Philips CX50, Сингапур) и 8–18 МГц (GE Logiq E, США) для оценки интерстициального синдрома, синдрома альвеолярной консолидации, воздушных бронхограмм, локального В+-синдрома, плеврального выпота и пневмоторакса. Базовый режим: абдоминальный, глубина сканирования — 3,0–4,5 см. Для диагностики характера движения диафрагмы использовался конвексный датчик 1–5 МГц (Philips CX50, Сингапур) и микроконвексный датчик 4,2–11 МГц (G.E. Logiq E, США). Базовый режим: абдоминальный, глубина сканирования подбиралась индивидуально в зависимости от конституциональных особенностей пациентов.
Протокол УЗИ легких выполнялся одним исследователем на каждом оценочном периоде исследования.
Было решено учитывать следующие ультразвуковые синдромы:
- интерстициальный синдром;
- синдром альвеолярной консолидации;
- синдром плеврального выпота (гидроторакс);
- пневмоторакс;
- характер движения диафрагмы;
- локальный B+-синдром.
В большинстве исследований, посвященных оценке предиктивных возможностей УЗИ легких, предлагалась оценка ультразвуковых синдромов по 36 балльной шкале (сумме баллов, полученных при сканировании 12 зон легких [17, 21]) либо альтернативным шкалам [18], при этом разные ультразвуковые синдромы учитывались в рамках одной единой балльной шкалы (например, в случае изолированного присутствия интерстициального синдрома в зоне исследования выставляется 1–2 балла, при обнаружении альвеолярной консолидации в зоне исследования выставляется 3 балла [17, 21]). На основе выдвинутой гипотезы о том, что все ультразвуковые синдромы имеют разный вклад в увеличение вероятности развития ОДН в послеоперационный период, было решено отдельно учитывать все ультразвуковые синдромы и ввести оригинальную балльную систему для подсчета выраженности каждого синдрома независимо друг от друга в рамках одного ультразвукового протокола.
Грудная клетка была разделена на 2 половины — левую и правую по грудине спереди и по позвоночному столбу сзади. Каждая половина грудной клетки разделялась на 3 отдела: передний, боковой и задний. Передний отдел начинался от парастернальной линии и заканчивался передней подмышечной линией. Боковой отдел начинался от передней подмышечной линии и заканчивался задней подмышечной линией. Задний отдел начинался от задней подмышечной линии и заканчивался позвоночным столбом. Каждый отдел в свою очередь разделялся на верхнюю и нижнюю зоны примерно пополам по причине отсутствия стандартизированных ориентиров для всех комплекций детей от 1 месяца до 1 года. Суммарно в каждой половине грудной клетки выделялось 6 зон, суммарно — 12 зон. Сканирование проводилось при продольном положении линейного датчика (параллельно межреберью) ковровым методом справа-налево и сверху-вниз.
Интерстициальный синдром
Оценка наличия интерстициального синдрома выполнялась по общепризнанным ультразвуковым критериями [9, 11, 22–25]. Выраженность интерстициального синдрома оценивалась полуколичественным методом по выраженности В-линий. В каждом сегменте выбирался межреберный промежуток с наибольшим количеством В-линий, входящих в один ультразвуковой срез.
Выраженность интерстициального синдрома оценивалась в баллах по отношению количества В-линий к межреберному промежутку. 0 баллов — В-линии отсутствуют, 1 балл — до 10 % В-линий в одном ультразвуковом срезе (единичные В-линии), 2 балла — от 10 % до 50 % В-линий в одном ультразвуковом срезе, 3 балла — от 50 % до 90 % В-линий в одном ультразвуковом срезе, 4 балла — более 90 % В-линий в одном ультразвуковом срезе («белое легкое») (рис. 2). В случаях пограничного значения выраженности В-линий в ультразвуковом срезе (например, 50 %) выставлялся высший балл (3 балла).
Оценивалась выраженность интерстициального синдрома в каждом легком отдельно путем суммации баллов всех зон: интерстициальный синдром легкой степени (до 6 баллов включительно в одном легком), средней степени (от 7 до 12 баллов включительно), тяжелой степени (от 13 до 18 баллов включительно), крайне тяжелой степени (от 19 до 24 баллов). Результат вносился в базу данных.
Рис. 2. Оценка выраженности интерстициального синдрома в баллах. Белой стрелкой указана B-линия — вертикальный гиперэхогенный луч, исходящий из плевральной линии (синяя стрелка): A — 1 балл (до 10 % В-линий в ультразвуковом срезе — единичные В-линии); B — 2 балла (от 10 % до 50 % В-линий в ультразвуковом срезе); C — 3 балла (от 50 % до 90 % В-линий в ультразвуковом срезе); D — 4 балла (более 90 % В-линий в одном ультразвуковом срезе — «белое легкое») (Автор рисунка — Пфейфер А.А.) Fig. 2. Assessment of the severity of interstitial syndrome in points. The white arrow indicates the B-line — a vertical hyperechoic beam originating from the pleural line (blue arrow): A — 1 point (up to 10 % B-lines in the ultrasound slice — single B-lines); B — 2 points (from 10 % to 50 % B-lines in the ultrasound slice); C — 3 points (from 50 % to 90 % B-lines in the ultrasound slice); D — 4 points (more than 90 % B-lines in one ultrasound slice — “white lung”) (Credit — Pfeifer A.A.)
Синдром альвеолярной консолидации
Диагностика наличия интерстициального синдрома выполнялась по общепризнанным ультразвуковым критериям [9, 25]. Оценка выраженности альвеолярной консолидации проходила путем оценки ее размера относительно всей исследуемой зоны. 0 баллов — альвеолярная консолидация отсутствует, 1 балл — небольшая субплевральная консолидация, визуализируемая в одном межреберном промежутке, 2 балла — альвеолярная консолидация, визуализируемая более чем в 1 межреберном промежутке, но занимающая менее 50 % исследуемой зоны, 3 балла — альвеолярная консолидация, занимающая более 50 % исследуемой зоны, 4 балла — альвеолярная консолидация, занимающая всю зону сканирования. При наличии альвеолярной консолидации, оцениваемой в 4 балла, подсчет В-линий невозможен. В таких случаях в оценке интерстициального синдрома выставлялось 0 баллов. В случаях пограничного значения выраженности альвеолярной консолидации выставлялся высший балл.
При наличии альвеолярной консолидации также оценивалось наличие воздушных бронхограмм [9]. Отдельно выделялись динамические и статические воздушные бронхограммы, а также их отсутствие, где 0 баллов — бронхограммы отсутствуют, так как нет альвеолярной консолидации, 1 балл — динамическая воздушная бронхограмма, 2 балла — статическая воздушная бронхограмма, 3 балла — воздушной бронхограммы в зоне альвеолярной консолидации нет.
Синдром плеврального выпота
При обнаружении признаков наличия плеврального выпота [9, 25] проводился подсчет его примерного объема. Для этого пациент укладывался в строго горизонтальное положение на 5 мин с целью равномерного распределения выпота по плевральной полости. После этого производилось измерение толщины выпота по задней подмышечной линии трехкратно. Максимальная толщина в миллиметрах подставлялась в модифицированную формулу Balik [26] с поправочными коэффициентами по массе тела.
0 баллов — плевральный выпот отсутствует, 1 балл — малый плевральный выпот менее 5 мл/кг массы тела, 2 балла — умеренный плевральный выпот от 5 до 10 мл/кг, 3 балла — массивный плевральный выпот более 10 мл/кг. В случаях пограничного значения выраженности плеврального выпота выставлялся высший балл.
Пневмоторакс
Пневмоторакс оценивался в положении пациента лежа на спине строго горизонтально. Определялось положение «точки легкого» — границы пневмоторакса [9].
0 баллов — пневмоторакса нет, 1 балл — малый пневмоторакс при наличии «точки легкого», не достигающей передней подмышечной линии, 2 балла — умеренный пневмоторакс при наличии «точки легкого» между передней и средней подмышечными линиями, 3 балла — массивный пневмоторакс, когда «точка легкого» находится кзади от средней подмышечной линии или не определяется вовсе.
В случаях пограничного значения выраженности пневмоторакса выставлялся высший балл.
Характер движения диафрагмы
Проводилась оценка характера движения обоих куполов диафрагмы в B- и М-режимах согласно описанной в литературе методике [27]. При самостоятельном дыхании ребенка характер движения купола диафрагмы подразделялся на следующие баллы: 0 баллов — норма, движения куполов диафрагмы синхронны, движение на вдохе направлено каудально, в М-режиме волна направлена вершиной вверх, 1 балл — парез (паралич), движение купола отсутствует или минимально присутствует, в М-режиме изолиния или низкоамплитудная волна, направленная вверх, 2 балла — парадоксальное движение, движение купола диафрагмы направлено краниально, в М-режиме отмечается инвертированная волна.
При проведении аппаратной ИВЛ в соответствующем оценочном периоде характер движения диафрагмы указывался как норма.
Локальный B+-синдром
Локальный В+-синдром фиксировался отдельно для каждой зоны легкого в случае локального появления компактно расположенных множественных «сливных» В-линий, значимо превышающих по количеству число В-линий в остальном исследуемом межреберном промежутке зоны. Результат вносился в электронную базу данных в формате есть/нет (1/0).
Дооперационный и послеоперационный оценочные периоды
Группы интенсивной терапии
В связи с тем, что авторами также проводится параллельное исследование оценки эффективности интенсивной терапии с применением УЗИ легких, в котором участвуют все 60 пациентов, включенных в данное исследование, а также в связи с потенциальной клинической значимостью возможности учета предиктивной моделью стратегии интенсивной терапии (под контролем или без УЗИ легких) на дооперационном этапе при поступлении в кардиохирургическое отделение № 4 пациенты разделялись на 2 группы при помощи рандомизации:
- 1 группа — группа интенсивной терапии под контролем УЗИ легких. Интенсивная терапия в послеоперационный период осуществлялась с учетом данных УЗИ легких, и проводился УЗИ-контроль в динамике. УЗИ в послеоперационный период проводилось минимум трижды: в течение 2 ч после поступления пациента из операционной в палату интенсивной терапии ОАРд, через 2–4 ч после начала терапии и после экстубации трахеи. Количество и частота УЗИ легких в данной группе ограничены не были.
- 2 группа — группа интенсивной терапии без контроля УЗИ легких. Интенсивная терапия проводилась исходя из данных объективного осмотра, лабораторных и инструментальных данных, исходного типа ВПС, характера выполненного оперативного вмешательства, опыта дежурного врача-реаниматолога. Результаты проведенного УЗИ легких дежурному врачу-реаниматологу не сообщались, рекомендации не выдавались. Интенсивная терапия осуществлялась без использования данного метода, что учитывалось при формировании базы данных и создании прогностической модели с целью повышения ее точности, чувствительности и специфичности.
Демографические данные
В базе данных учитывались пол, масса, рост, возраст.
УЗИ легких
Выполнялось исследователем по оригинальному протоколу, описанному выше. В базе данных учитывались результаты УЗИ легких в дооперационный период за 18–24 ч до выполнения оперативного вмешательства и в послеоперационный оценочный период в течение 2 ч после поступления пациента из операционной в палату интенсивной терапии ОАРд.
Интраоперационные данные
В данном разделе фиксировалось влияние ВПС на легочный кровоток (ВПС с гиперволемией малого круга кровообращения или ВПС без гиперволемии малого круга кровообращения), продолжительность ИК в минутах, продолжительность окклюзии аорты в минутах.
В исследование были включены дети со следующими ВПС:
- ВПС с гиперволемией малого круга кровообращения: септальные дефекты (дефект межжелудочковой перегородки, дефект межпредсердной перегородки, их комбинации);
- ВПС без гиперволемии малого круга кровообращения: клапанный стеноз легочной артерии, клапанный стеноз аорты, коарктация аорты, аномальное отхождение левой коронарной артерии от легочной артерии, недостаточность митрального клапана.
Особенности интенсивной терапии под контролем УЗИ легких
Интерстициальный синдром
Терапия интерстициально синдрома осуществлялась относительно его выраженности по данным УЗИ легких путем назначения диуретической терапии, снижения объема инфузии и контроля нормального уровня общего белка в крови. При наличии интерстициального синдрома легкой степени тяжести коррекция терапии не проводилась, проводился динамический контроль гидробаланса с повторной оценкой УЗИ легких через 2–4 ч после начала терапии и после экстубации трахеи.
Известно, что диуретическая терапия уменьшает объем внесосудистой жидкости в легких, что проявляется снижением выраженности интерстициального синдрома по данным УЗИ [28]. При выраженности интерстициального синдрома выше легкой степени тяжести диуретическая терапия проводилась путем дробного внутривенного назначения 0,2–0,4 мг/кг фуросемида с возможным переходом на микроструйное введение с повышением дозировки максимально до 1 мг/кг/ч под контролем клинического состояния, уровня диуреза, гидробаланса и УЗИ легких.
По литературным данным, снижение уровня альбумина вызывает накопление внесосудистой жидкости в легких за счет снижения онкотического давления крови, и поддержание его нормального уровня улучшает вентиляционно-перфузионные отношения [29]. В связи с этим проводилась оценка, контроль и поддержание нормального уровня общего белка путем внутривенного введения альбумина при наличии интерстициального синдрома тяжелой и крайне тяжелой степени тяжести, выявленного при выполнении УЗИ легких.
Синдром альвеолярной консолидации
Интенсивная терапия осуществлялась путем проведения рекрутмент-маневров, установки уровня PEEP (Positive End Expiratory Pressure), позиционирования пациента, постурального дренажа c санацией трахеобронхиального дерева.
Рекрутмент-маневр проводился под контролем УЗИ путем ступенчатого повышения уровня PEEP по методике [30], однако с некоторыми модификациями, в частности, мы снижали уровень PEEP при проведении рекрутмент-маневра не до 0, как было предложено авторами, а до персонально установленного для каждого пациента уровня, подбор которого описан далее. Также данный рекрутмент-маневр выполнялся нами ручным методом, без использования интеллектуальных аппаратных режимов. В случаях уменьшения размеров консолидаций по данным УЗИ (рекрутабельности участков легкого) рекрутмент-маневр повторялся при каждом отсоединении дыхательного контура.
Так как есть данные, что PEEP может негативно влиять на лимфатический дренаж паренхимы легкого [31], что может приводить к увеличению в ней внесосудистой жидкости, уровень PEEP устанавливался персонифицированно в зависимости от суммы баллов, полученных при оценке синдрома альвеолярной консолидации: при отсутствии альвеолярных консолидаций — PEEP 5, при сумме от 1 до 8 баллов — PEEP 6, при сумме более 8 баллов — PEEP 7.
Выполнялось позиционирование пациента и постуральный дренаж с учетом выявленных зон с наиболее выраженным синдромом альвеолярной консолидации, так как есть данные позитивного влияния данных лечебных мероприятий на ателектазированную паренхиму легких [32].
Плевральный выпот
Терапия осуществлялась в зависимости от объема выпота. При объеме выпота менее 5 мл/кг массы тела выполнялась консервативная терапия фуросемидом, проводилось снижение объема инфузионной терапии с последующим контролем в динамике. При объеме выпота от 5 до 10 мл/кг терапия зависела от выраженности клинических проявлений дыхательной недостаточности. Решение о дренировании плевральной полости или проведении консервативной терапии принималось совместно с детскими кардиохирургами. При объеме более 10 мл/кг выполнялось дренирование.
Пневмоторакс
При выявлении малого пневмоторакса проводилась оценка его объема в динамике либо дренирование после обсуждения с заведующим отделения ОАРд и детским кардиохирургом. При выявлении умеренного и массивного пневмоторакса выполнялось дренирование плевральной полости.
Аномальное движение диафрагмы
При выявлении аномального движения диафрагмы оповещался детский кардиохирург для решения вопроса о выполнении ее пликации.
Оценочный период перед переводом пациента в профильное отделение
В данный оценочный период производилась оценка наличия или отсутствия проявления ОДН.
Критерии ОДН
Оценка наличия ОДН у пациентов осуществлялась непосредственно перед переводом из ОАРд в кардиохирургическое отделение № 4. Решение о переводе принималось совместно после обсуждения на обходе с заведующим ОАРд и заведующим кардиохирургическим отделением № 4, учитывая клиническое состояние пациента, лабораторные и инструментальные данные.
Для оценки проявлений ОДН все дети переводились на самостоятельное дыхание атмосферным кислородом на 10 мин, после чего осуществлялся забор артериальной крови для оценки PaO2, SaO2 и PaO2/FiO2.
В исследовании критериями наличия ОДН были: значение PaO2/FiO2 < 300 и/или SaO2 < 92 %, и/или нарастание частоты дыхательных движений > 30 % от исходной величины. Все критерии фиксировались в базе данных. Отмечалось резюмирующее значение: ОДН есть или ОДН нет.
Статистическая обработка данных
Накопление и первичный анализ данных проводили в написанной нами на языке программирования C# программе (интерфейсе), облегчающей взаимодействие с базой данных SQLite и формирующей файлы (книги) Excel, на основе которых далее осуществлялось формирование предиктивных моделей. При нормальном распределении данные были представлены средним значением и стандартным отклонением М ± SD; описание количественных данных, не подчиняющихся закону нормального распределения, представляли в виде Me (Q1; Q3), где Me — медианное значение, Q1 — первый квартиль (25-й процентиль), Q3 — третий квартиль (75-й процентиль). Частотные данные представлены в формате n (%), где n — абсолютное количество наблюдений в группе, а % — процент числа наблюдений в группе. Значимым считалось значение p < 0,05.
Нормальность распределения полученных данных оценивалась с использованием критерия Шапиро—Уилка. Поскольку распределение большинства исследуемых параметров существенно отличалось от нормального, для сравнительного анализа количественных независимых переменных был применен непараметрический U-критерий Манна—Уитни. Для параметров, распределение которых соответствовало нормальному, сравнительный анализ количественных независимых переменных проводился с использованием t-критерия Стьюдента.
Всего в исследование было включено 60 пациентов. Все пациенты были случайным образом разделены на 3 выборки: для обучения — 42 пациента (70 %), калибровки модели — 6 пациентов (10 %) и тестирования модели — 12 пациентов (20 %).
Для создания прогностической модели на основе машинного обучения (ММО) использовался метод Random Forest — ансамблевый метод, основанный на множестве деревьев решений. Каждое дерево обучается на случайной подвыборке данных и признаков, что снижает риск переобучения по сравнению с отдельными деревьями решений. Ансамблирование деревьев решений позволяет улучшить качество прогнозов за счет усреднения результатов нескольких моделей, эффективно работать с нелинейными взаимосвязями между признаками, небольшими выборками и разнородными данными.
Случайное разделение пациентов на обучающую, калибровочную и тестовую выборки с отсутствием статистически значимых различий по базовым характеристикам пациентов, включая основной класс (пациенты с ОДН), обеспечивает высокую представительность каждой выборки, минимизирует предвзятость, уменьшает риск переобучения модели и повышает достоверность результатов исследования. Этот подход особенно важен в условиях ограниченных данных.
Проводилось обучение модели и ее калибровка на отдельных выборках с дальнейшей фиксацией и сохранением модели. Калибровочная выборка использовалась для настройки гиперпараметров ММО. Оценка калибровки ММО выполнялась с помощью расчета Brier Score. Далее выполнялось тестирование модели на тестовой выборке без кросс-валидации с выполнением ROC-анализа по трем точкам с расчетом AUC. Для более глубокой оценки эффективности созданной предиктивной модели ММО проводилась кросс-валидация методом Монте—Карло с 1000 итераций. Метрики оценки прогностической модели рассчитывались для каждого разбиения, а итоговая оценка определялась как среднее значение метрик по всем итерациям. Показателями эффективности (performance) моделей были следующие общепризнанные метрики: accuracy (точность), recall (полнота), specificity (специфичность), precision (точность предсказания), F1-мера. Метрики рассчитывались с использованием Confusion Matrix (матрицы ошибок), где выделялись истинно положительные, истинно отрицательные, ложноположительные и ложноотрицательные значения.
Также была создана предиктивная модель на основе логистической регрессии (МЛР) с обучением модели и ее тестированием на отдельных выборках. Был выполнен однофакторный и многофакторный регрессионные анализы, создано уравнение логистической регрессии. Далее выполнялось тестирование модели на тестовой выборке с выполнением ROC-анализа с расчетом AUC. Для глубокой оценки эффективности МЛР проводилась кросс-валидация Монте—Карло с 1000 итераций. В качестве оценки эффективности модели использовались аналогичные метрики. Метрики рассчитывались с использованием матрицы ошибок.
Обработка данных, построение предиктивных моделей (ММО и МЛР), статистический анализ данных, исследование эффективности построенных предиктивных моделей и визуализация данных осуществлялись с применением программных алгоритмов, написанных на языке программирования Python (Python Software Foundation, Version 3.12.0, Wilmington, DE: Python Software Foundation) с использованием следующих библиотек: numpy, pandas, sklearn, sqlite3, scipy, matplotlib, seaborn, docx, joblib, statsmodels.
Выбор методологии Random Forest с разбиением данных на три выборки (обучение, калибровка, тестирование) с фиксацией модели и с последующей калибровкой и проведением кросс-валидации обусловлен следующими факторами: ограниченный объем данных (60 пациентов), необходимость получения надежных и интерпретируемых результатов, важность оценки вероятностных прогнозов и их калибровки, требования к стабильности и точности модели для медицинского применения. Эта методология обеспечивает баланс между качеством модели и возможностями исследования с ограниченной выборкой данных. Использование замороженной модели (модели, обученной на обучающей выборке и фиксированной без дальнейшей перенастройки параметров) для калибровки и кросс-валидации имеет несколько важных преимуществ, которые улучшают качество прогнозов и надежность результатов:
- устойчивость к переобучению и обеспечение стабильных прогнозов для каждого случая — когда модель фиксируется после обучения, ее параметры больше не меняются в процессе калибровки или тестирования, это помогает избежать риска переобучения на новых данных, калибровка выполняется только для корректировки вероятностных прогнозов модели, а не для изменения ее структуры или параметров, таким образом, сохраняется способность модели обобщать данные, полученные на обучающей выборке;
- возможность повторного использования модели — фиксированная модель может быть легко повторно использована для других задач или данных, так как ее параметры остаются фиксированными. Это делает ее более универсальной и удобной для практического применения. Кросс-валидация по методу Монте—Карло с использованием 1000 итераций обеспечивает стабильность и надежность полученных результатов, компенсируя ограничения объема данных. Выполнение калибровки позволяет улучшить адекватность вероятностных прогнозов;
- объективная оценка обобщающей способности — поскольку модель уже обучена и фиксирована, результаты кросс-валидации отражают реальную производительность модели на новых данных, а не ее способность адаптироваться к каждому разбиению. Это минимизирует риск оптимистического искажения метрик, которое может возникнуть при повторном обучении модели на каждом разбиении;
- при использовании фиксированной модели результаты кросс-валидации становятся более стабильными, так как модель не зависит от случайных факторов, связанных с повторным обучением. Это позволяет получить более надежные средние значения метрик и их распределение;
- результаты кросс-валидации на замороженной модели легче интерпретировать, так как они показывают, как модель работает на данных, которых она не видела во время обучения. Это дает четкое представление о ее производительности в реальных условиях.
Результаты
Базовые характеристики пациентов представлены в табл. 1. Базовые характеристики у пациентов в обучающей и калибровочной выборках представлены в табл. 2. Базовые характеристики пациентов в тестовой выборке представлены в табл. 3. Статистически значимых различий между выборками не было.
Обучающая и тестовая выборки при обучении и тестировании обеих моделей (ММО и МЛР) были идентичными по объему, включенным пациентам и учитываемым факторам.
В результате обучения модели ММО производилась настройка гиперпараметров. С последующей калибровкой на калибровочной выборке были настроены следующие гиперпараметры: n_estimators (число деревьев в лесу; увеличение числа деревьев может улучшить качество модели, но повышает время обучения), max_depth (максимальная глубина дерева; ограничивает глубину дерева для предотвращения переобучения), min_samples_split (минимальное число образцов для разделения узла), min_samples_leaf (минимальное число образцов в листе), max_features (максимальное количество признаков для выбора при делении узла; влияет на случайность модели), bootstrap (использование выборки с возвращением). Нами были установлены следующие значения гиперпараметров: n_estimators, равное 100, max_depth, равное 30, min_samples_split, равное 5, min_samples_leaf, равное 2, bootstrap установили True. Brier Score составил 0,095. Построена калибровочная кривая (рис. 3). Модель была зафиксирована (сохранена). Далее было выполнено тестирование модели на тестовой выборке с выполнением ROC-анализа и построением ROC-кривой (рис. 4). AUC ММО составила 0,929. Вторым этапом была проведена кросс-валидация сохраненной модели ММО на тестовой выборке по методу Монте—Карло с 1000 итераций для оценки обобщающей способности заранее обученной и зафиксированной модели. Исходные 12 тестовых случаев случайным образом разбивались на подмножества в ходе 1000 итераций, в каждую обучающую выборку попадали 9 случаев, а оставшиеся 3 использовались для тестирования, причем модель использовалась исключительно для прогнозирования без повторного обучения; 9 случаев, отобранных для обучающей выборки, использовались исключительно для симуляции и проверки модели на согласованность ее прогнозов с обучающими данными, а не для обновления параметров модели. Метрики эффективности прогностической модели рассчитывались для каждого разбиения, а итоговая оценка определялась как среднее значение метрик по всем итерациям. Показатели эффективности были следующими: accuracy (точность) — 0,922 (92,2 %), recall (полнота, чувствительность) — 1,0 (100 %), specificity (специфичности) — 0,867 (86,7 %), precision (точность предсказания) — 0,840, F1-меры — 0,913. Результаты представлены в таблице 4. Построена Confusion Matrix (рис. 5).
Также была создана вторая прогностическая модель по принципу логистической регрессии (МЛР) с включением тех же пациентов в обучающую (42 пациента) и тестовую (12 пациентов) выборку на основе учета тех же факторов, что и при создании ММО. Пациенты из калибровочной выборки при создании и тестировании данной модели не использовались. Был проведен однофакторный (табл. 5) и многофакторный (табл. 6) регрессионный анализ. При однофакторном анализе было выявлено 26 статистически значимых факторов. Создано уравнение логистической регрессии:
Logit(P) = –0,8556 + 343,1066 × MainGroup + 6,2992 × LeftLungLateralUp_BLines_0 + –152,5780 × LeftLungLateralUp_LocalBSyndrome_1 + –20,8457 × LeftLungPosteriorUp_Consolidations_1 + 49,0374 × LeftLungPosteriorUp_AirBronchograms_1 + 4,2821 ×RightLungAnteriorUp_BLines_0 + 43,7875 × RightLungAnteriorUp_BLines_1 + 0,9157 × RightLungLateralUp_BLines_0 + 45,5332 × RightLungLateralUp_BLines_1 + –65,3959 × RightLungLateralUp_Consolidations_1 + –43,1994 × RightLungLateralUp_AirBronchograms_1 + 140,8244 × RightLungPosteriorUp_BLines_1 + 2,1094 × RightLungPosteriorUp_Consolidations_0 + 19,6377 × RightLungPosteriorUp_Consolidations_1 + 14,4657 × RightLungPosteriorUp_AirBronchograms_0 + 5,8946 ×RightLungPosteriorUp_AirBronchograms_1 + 16,1164 × RightLungLateralDown_Consolidations_1 + –101,0784 × RightLungLateralDown_LocalBSyndrome_0 + 77,5300 × RightLungLateralDown_AirBronchograms_1 + 11,0685 × RightLungPosteriorDown_BLines_1 + –35,5075 × RightLungPosteriorDown_Consolidations_1 + 37,3142 × RightLungPosteriorDown_AirBronchograms_1 + 27,4746 × RightLungIntersticialSyndrome_0 + –31,8331 × RightLungIntersticialSyndrome_1 + –14,5012 × PatientHeight + 0,9210 × Age
Выполнено тестирование модели на тестовой выборке с выполнением ROC-анализа и построением ROC-кривой (рис. 4). AUC МЛР составила 0,70.
Далее была проведена кросс-валидация на тестовой выборке по методу Монте—Карло с 1000 итераций по принципам, идентичным ММО. Важно отметить, что МЛР также не переобучалась в ходе этих итераций. Показатели эффективности были следующими: accuracy (точности) — 0,742 (74,2 %), recall (полнота, чувствительность) — 0,387 (38,7 %), specificity (специфичности) — 1,000 (100 %), precision (точности предсказания) — 1,000, F1-меры — 0,558 (табл. 7). Построена Confusion Matrix (рис. 5).
Было проведено сравнение метрик двух прогностических моделей — ММО и МЛР. (табл. 7).
Показатель | Значение |
---|---|
Возраст, сут | 114,0 (61,5; 184,8) |
Масса пациента, кг | 5,8 (4,9; 6,8) |
Рост пациента, см | 61,0 (56,8; 64,0) |
Пол пациента, м | 29 (48,3 %) |
ВПС с гиперволемией МКК | 42 (70,0 %) |
Дыхательная недостаточность | 35 (58,3 %) |
Длительность ИК, мин | 50,0 (40,0; 70,0) |
Длительность пережатия аорты, мин | 28,5 (22,8; 42,5) |
Значения | Обучающая выборка (n = 42) | Тестовая выборка (n = 12) | p-value |
---|---|---|---|
Возраст, сут | 120,00 (60,50; 186,25) | 170,67 ± 104,68 | 0,382 |
Масса, кг | 5,97 ± 1,76 | 6,54 ± 2,37 | 0,377 |
Рост, см | 61,10 ± 8,02 | 64,17 ± 8,65 | 0,265 |
Мужской пол, n (%) | 22 (52,4) | 6 (50,0) | 1,000 |
ВПС с гиперволемией МКК, n (%) | 33 (78,6) | 6 (50,0) | 0,113 |
Дыхательная недостаточность, n (%) | 25 (59,5) | 7 (58,3) | 0,442 |
Продолжительность искусственного кровообращения, мин | 50,00 (43,00; 75,75) | 45,00 (38,00; 75,00) | 0,755 |
Продолжительность пережатия аорты, мин | 28,50 (23,25; 43,50) | 27,50 (23,50; 40,00) | 0,992 |
Значения | Обучающая выборка (n = 42) | Калибровочная выборка (n = 6) | p-value |
---|---|---|---|
Возраст, сут | 120,00 (60,50; 186,25) | 76,67 ± 26,29 | 0,078 |
Масса, кг | 5,97 ± 1,76 | 5,69 (4,27; 5,70) | 0,249 |
Рост, см | 61,10 ± 8,02 | 55,67 ± 3,82 | 0,117 |
Мужской пол, n (%) | 22 (52,4) | 3 (50,0) | 1.000 |
ВПС с гиперволемией МКК, n (%) | 33 (78,6) | 3 (50,0) | 0,313 |
Дыхательная недостаточность, n (%) | 25 (59,5) | 5 (83,3) | 0,499 |
Продолжительность ИК, мин | 50,00 (43,00; 75,75) | 58,00 ± 12,79 | 0,492 |
Продолжительность пережатия аорты, мин | 28,50 (23,25; 43,50) | 31,33 ± 11,37 | 0,938 |
Значения | Группа 1 (n = 6) | Группа 2 (n = 6) | p-value |
---|---|---|---|
Возраст, сут | 191,67 ± 113,29 | 149,67 ± 90,55 | 0,532 |
Масса, кг | 7,12 ± 3,04 | 5,96 ± 1,14 | 0,439 |
Рост, см | 64,50 ± 11,59 | 63,83 ± 3,89 | 0,905 |
Мужской пол, n (%) | 4 (66,7) | 4 (66,7) | 0,564 |
ВПС с гиперволемией МКК, n (%) | 4 (66,7) | 4 (66,7) | 0,564 |
Дыхательная недостаточность, n (%) | 4 (66,7) | 5 (83,3) | 0,242 |
Продолжительность ИК, мин | 57,50 (42,50; 66,50) | 39,00 (38,00; 84,25) | 0,630 |
Продолжительность пережатия аорты, мин | 27,50 (21,75; 32,50) | 27,50 (24,50; 50,75) | 0,818 |
Рис. 3. Калибровочная кривая модели ММО (алгоритм машинного обучения). Brier Score = 0,095 Fig. 3. Calibration curve of the MMO model (machine learning algorithm). Brier Score = 0.095
Фактор | Коэффициент | p-значение | 95% ДИ (нижняя) | 95% ДИ (верхняя) |
---|---|---|---|---|
Группа исследования | 3,296 | 0,000 | 1,860 | 4,732 |
Рост пациента | –0,078 | 0,031 | –0,150 | –0,007 |
Возраст пациента | –0,008 | 0,017 | –0,014 | –0,001 |
Боковая верхняя часть левого легкого, интерстициальный синдром (до операции) | 0,809 | 0,026 | 0,096 | 1,522 |
Боковая верхняя часть левого легкого, локальный В+-синдром (после операции) | –1,266 | 0,029 | –2,399 | –0,132 |
Задневерхняя часть левого легкого, консолидации (после операции) | 0,616 | 0,021 | 0,091 | 1,141 |
Задневерхняя часть левого легкого, воздушные бронхограммы (после операции) | 0,635 | 0,025 | 0,080 | 1,191 |
Передневерхняя часть правого легкого, интерстициальный синдром (до операции) | 0,719 | 0,039 | 0,035 | 1,403 |
Боковая верхняя часть правого легкого, интерстициальный синдром (до операции) | 0,650 | 0,033 | 0,053 | 1,248 |
Боковая верхняя часть правого легкого, интерстициальный синдром (после операции) | 1,072 | 0,008 | 0,274 | 1,870 |
Боковая верхняя часть правого легкого, консолидации (после операции) | 0,859 | 0,048 | 0,009 | 1,710 |
Боковая верхняя часть правого легкого, воздушные бронхограммы (после операции) | 0,876 | 0,034 | 0,065 | 1,686 |
Задневерхняя часть правого легкого, интерстициальный синдром (после операции) | 1,295 | 0,003 | 0,428 | 2,162 |
Задневерхняя часть правого легкого, консолидации (до операции) | 0,632 | 0,015 | 0,122 | 1,142 |
Задневерхняя часть правого легкого, консолидации (после операции) | 0,965 | 0,002 | 0,357 | 1,574 |
Задневерхняя часть правого легкого, воздушные бронхограммы (до операции) | 0,579 | 0,035 | 0,041 | 1,118 |
Задневерхняя часть правого легкого, воздушные бронхограммы (после операции) | 0,824 | 0,005 | 0,244 | 1,403 |
Боковая нижняя часть правого легкого: консолидации (после операции) | 0,694 | 0,016 | 0,132 | 1,257 |
Боковая нижняя часть правого легкого: локальный В+-синдром (до операции) | –2,015 | 0,018 | –3,679 | –0,351 |
Боковая нижняя часть правого легкого: воздушные бронхограммы (после операции) | 0,796 | 0,012 | 0,175 | 1,416 |
Задняя нижняя часть правого легкого: интерстициальный синдром (после операции) | 0,695 | 0,040 | 0,030 | 1,360 |
Задняя нижняя часть правого легкого: консолидации (после операции) | 0,845 | 0,002 | 0,320 | 1,369 |
Задняя нижняя часть правого легкого: воздушные бронхограммы (после операции) | 1,099 | 0,000 | 0,487 | 1,710 |
Правое легкое: интерстициальный синдром (до операции) | 0,859 | 0,016 | 0,163 | 1,556 |
Правое легкое: интерстициальный синдром (после операции) | 0,765 | 0,041 | 0,030 | 1,499 |
Фактор | Коэффициент |
---|---|
Группа исследования | 343,107 |
Боковая верхняя часть левого легкого, интерстициальный синдром (до операции) | 6,299 |
Боковая верхняя часть левого легкого, локальный В+-синдром (после операции) | –152,578 |
Задневерхняя часть левого легкого, консолидации (после операции) | –20,846 |
Задневерхняя часть левого легкого, воздушные бронхограммы (после операции) | 49,037 |
Передневерхняя часть правого легкого, интерстициальный синдром (до операции) | 4,282 |
Передневерхняя часть правого легкого, интерстициальный синдром (после операции) | 43,788 |
Боковая верхняя часть правого легкого, интерстициальный синдром (до операции) | 0,916 |
Боковая верхняя часть правого легкого, интерстициальный синдром (после операции) | 45,533 |
Боковая верхняя часть правого легкого, консолидации (после операции) | –65,396 |
Боковая верхняя часть правого легкого, воздушные бронхограммы (после операции) | –43,199 |
Задневерхняя часть правого легкого, интерстициальный синдром (после операции) | 140,824 |
Задневерхняя часть правого легкого, консолидации (до операции) | 2,109 |
Задневерхняя часть правого легкого, консолидации (после операции) | 19,638 |
Задневерхняя часть правого легкого, воздушные бронхограммы (до операции) | 14,466 |
Задневерхняя часть правого легкого, воздушные бронхограммы (после операции) | 5,895 |
Боковая нижняя часть правого легкого: консолидации (после операции) | 16,116 |
Боковая нижняя часть правого легкого: локальный В+-синдром (до операции) | –101,078 |
Боковая нижняя часть правого легкого: воздушные бронхограммы (после операции) | 77,530 |
Задняя нижняя часть правого легкого: интерстициальный синдром (после операции) | 11,068 |
Задняя нижняя часть правого легкого: консолидации (после операции) | –35,508 |
Задняя нижняя часть правого легкого: воздушные бронхограммы (после операции) | 37,314 |
Правое легкое: интерстициальный синдром (до операции), сумма баллов | 27,475 |
Правое легкое: интерстициальный синдром (после операции), сумма баллов | –31,833 |
Рост пациента | –14,501 |
Возраст пациента | 0,921 |
Рис. 4. Результаты ROC-анализа предиктивных моделей до выполнения кросс-валидации. ROC-кривая предиктивной модели на основе логистической регрессии (верхний график) имеет AUC = 0,70. ROC-кривая предиктивной модели на основе машинного обучения (нижний график) демонстрирует AUC = 0,929 Fig. 4. Results of the ROC analysis of predictive models before performing cross-validation. The ROC curve of the predictive model based on logistic regression (upper graph) has an AUC of 0.70. The ROC curve of the predictive model based on machine learning (lower graph) demonstrates an AUC of 0.929
Рис. 5. Confusion Matrix после выполнения кросс-валидации Монте—Карло с 1000 итераций для предиктивной модели на основе логистической регрессии (верхняя матрица) и модели на основе машинного обучения (нижняя матрица) Fig. 5. Confusion Matrix after performing Monte Carlo cross-validation with 1000 iterations for the predictive model based on logistic regression (upper matrix) and the model based on machine learning (lower matrix)
Предиктивные модели | Accuracy | Recall | Specificity | Precision | F1-мера | AUC |
---|---|---|---|---|---|---|
ММО | 0,922 | 1,000 | 0,867 | 0,840 | 0,913 | 0,929 |
МЛР | 0,742 | 0,387 | 1,000 | 1,000 | 0,558 | 0,700 |
Обсуждение
Разделение пациентов случайным образом в обучающую, калибровочную и тестовую выборки позволило моделям обучаться на одной части и проверять свою эффективность на другой, неизвестной ей части пациентов. Это помогло избежать переобучения. При этом важно отметить, что между выборками не было статистически значимой разницы, что указывает на то, что модели обучены и протестированы на данных, которые имеют схожие характеристики. Это может потенциально свидетельствовать о том, что модели будут сопоставимо работать на новых данных, так как они не переобучены на специфических особенностях одной из выборок. Калибровочная выборка использовалась для настройки гиперпараметров ММО. Это позволило исследовать, как изменения в параметрах влияют на производительность модели, и выбрать наиболее подходящие настройки, что в свою очередь улучшило точность прогнозов. Нами были подобраны и установлены следующие значения гиперпараметров для ММО, созданной на основе алгоритма Random Forest: n_estimators, равное100 — это количество деревьев в лесу, что позволяет улучшить стабильность и точность модели; max_depth, равное 30 — максимальная глубина каждого дерева, что помогает контролировать переобучение, позволяя деревьям быть достаточно глубокими для захвата сложных паттернов, но не настолько глубокими, чтобы они начали подстраиваться под шум в данных, min_samples_split; равное 5 — минимальное количество образцов, необходимое для разделения узла, это значение помогает предотвратить создание узлов, которые могут быть слишком специфичными для обучающего набора данных; min_samples_leaf, равное2 — минимальное количество образцов, которые должны находиться в листовом узле, это значение также способствует уменьшению переобучения, обеспечивает то, что каждый лист содержит достаточное количество данных; bootstrap в значении True — использование бутстрэппинга для создания подвыборок данных для обучения каждого дерева. Это помогает улучшить обобщающую способность модели, так как каждое дерево обучается на случайной подвыборке данных. Эти настройки гиперпараметров были выбраны с целью оптимизации производительности модели и достижения лучшего баланса между точностью и обобщающей способностью. Как итог, Brier Score = 0,095 является показателем хорошей калибровки прогностической модели.
Сравнение показателей двух моделей демонстрирует значительные различия в их эффективности. Модель ММО, основанная на Random Forest, продемонстрировала высокую точность (accuracy) на уровне 92,2 %, что указывает на ее способность правильно классифицировать большую часть наблюдений. В то же время МЛР показала значительно более низкую точность в 74,2 %. Значение AUC = 0,929 для ММО указывает на отличную способность модели различать положительные и отрицательные классы, в то время как AUC = 0,70 для МЛР указывает на среднюю способность модели. При глубоком анализе эффективности параметр recall (полнота, чувствительность) модели ММО составил 100 %, что свидетельствует о ее способности эффективно выявлять положительные случаи. В отличие от этого, МЛР продемонстрировала значительно более низкий уровень чувствительности, равный 38,7 %, что указывает на высокую вероятность пропуска положительных случаев ОДН. Что касается специфичности, модель ММО показала значение 86,7 %, в то время как МЛР достигла 100 %, что указывает на ее способность правильно классифицировать отрицательные случаи. Однако, несмотря на высокую специфичность, МЛР имеет низкие F1-меры (0,558), что указывает на несоответствие между количеством истинных положительных и ложноположительных предсказаний, в то время как показатель F1-меры ММО, равный 0,913, является очень высоким значением. При этом ситуация, когда precision = 1,0, а recall = 0,387, может возникнуть, когда модель делает очень точные предсказания, но пропускает значительное количество истинных положительных случаев. Это может произойти, если модель предсказывает положительный класс только в тех случаях, когда она абсолютно уверена в правильности своего предсказания, что приводит к отсутствию ложноположительных результатов (FP = 0). Это и объясняет высокое значение параметра precision у МЛР и говорит о том, что все положительные предсказания модели являются верными, однако это происходит из-за того, что модель в целом делает малое количество положительных предсказаний и, соответственно, не находит многие из фактических положительных случаев (то есть у нее много ложноотрицательных результатов — FN), а это приводит к низкому значению recall. В данном случае recall = 0,387 указывает на то, что модель смогла идентифицировать лишь 38,7 % всех истинных положительных случаев. Построенные Confusion Matrix позволяют более детально проанализировать качества предсказаний предиктивных моделей (рис. 5).
Сравнение моделей ММО и МЛР показывает, что ММО превосходит МЛР по всем ключевым метрикам, включая AUC, точность, полноту и F1-меру. ММО демонстрирует высокую эффективность в классификации, в то время как логистическая регрессия, несмотря на высокую специфичность и точность предсказаний, показывает недостаточную полноту и общую эффективность. Таким образом, модель ММО демонстрирует более сбалансированные и высокие показатели по сравнению с МЛР, что делает ее более предпочтительной для задач классификации в данном контексте.
Мы проанализировали возможные причины различий в эффективности двух созданных нами моделей. Различия в сложности: Random Forest является ансамблевым методом, который использует множество деревьев решений (Decision Trees) для улучшения предсказаний. Это позволяет модели лучше захватывать сложные зависимости в данных, в то время как логистическая регрессия может быть слишком простой для данной задачи. Малый объем выборки: объем выборки для обучения (42 человека) и тестирования (12 человек) достаточно мал. В таких условиях Random Forest может лучше обобщать данные благодаря своей структуре, в то время как логистическая регрессия может страдать от переобучения или недостаточной способности к обобщению. Непараметрическая природа Random Forest: этот метод не предполагает линейные зависимости между переменными, что делает его более гибким в работе с различными типами данных.
В нескольких работах были предложены прогностические модели для диагностики легочных послеоперационных осложнений в детской кардиохирургии с применением УЗИ легких. В исследовании Cantinotti M. et al. были созданы две предиктивные модели, прогнозирующие успешность экстубации трахеи и продолжительность нахождения пациента в реанимации [19]. В исследование были включены дети всех возрастных групп (от новорожденных до 18 лет) с радикальным и паллиативным характером коррекции ВПС, а УЗИ легких выполнялось исключительно в послеоперационный период. Кроме того, оценка состояния легких в исследовании проводилась по 36-балльной шкале с учетом только интерстициального синдрома и синдрома альвеолярной консолидации с суммацией полученных баллов, оценка остальных ультразвуковых синдромов не выполнялась. Определение наличия ОДН в послеоперационный период не являлось первичной контрольной точкой и не проводилось. Кроме того, не были оценены показатели эффективности разработанных авторами предиктивных моделей. Были также предложены предиктивные модели развития послеоперационных легочных осложнений с учетом выполнения УЗИ легких на дооперационном и послеоперационном этапах [17] и неудачи экстубации трахеи на основе измерения фракции утолщения диафрагмы [20]. При этом также не была проведена оценка их эффективности на тестовой выборке пациентов, что ставит под сомнение обобщающие возможности созданных моделей.
Было опубликовано несколько предиктивных моделей прогнозирования легочных осложнений в детской кардиохирургии с включением большого числа пациентов, созданных на основе алгоритма машинного обучения, с выполненной оценкой их эффективности на тестовой выборке пациентов, однако УЗИ легких в этих исследованиях не выполнялось [33, 34]. Так, были предложены предиктивная модель прогнозирования легочных осложнений в детской кардиохирургии с применением алгоритма машинного обучения на основе учета демографических данных, особенностей операции и данных об интраоперационном артериальном давлении 1964 пациентов с AUC = 0,785 [33] и предиктивная модель для прогнозирования развития пневмонии в детской кардиохирургии с включением 23 000 пациентов с AUC = 0,929 [34]. Однако УЗИ легких в данных исследованиях не проводилось и не учитывалось.
Есть данные, что включение уровней BNP [35] и цистатина С [36] в прогностическую модель может дополнительно увеличить ее эффективность, однако это требует дополнительных финансовых затрат и наличия специализированной лаборатории.
Исходя из этого научная и практическая новизна нашего исследования заключается в том, что нами были созданы две уникальные прогностические модели развития ОДН в послеоперационный период у детей грудного возраста после радикальных кардиохирургических операций на основе УЗИ легких и клинических данных, в которых учитывались все основные ультразвуковые синдромы, также были изучены показатели эффективности созданных прогностических моделей на тестовой выборке пациентов: accuracy (точность), recall (полнота, чувствительность), specificity (специфичность), precision (точность предсказания), F1-меры, AUC.
Прогностическая модель, созданная на основе алгоритма машинного обучения (ММО), показала более высокую эффективность и была названа LUCH-D — Lung Ultrasound in Congenital Heart Disease.
Данное исследование имеет несколько ограничений:
- одноцентровой характер исследования, а также проведение УЗИ легких одним исследователем на всех этапах;
- оценка наличия ОДН, которая проводилась в момент перевода пациента из отделения реанимации в профильное отделение, что в свою очередь могло быть осуществлено у разных пациентов на разные реанимационные сутки и могло отрицательно повлиять на эффективность моделей;
- небольшая выборка, которая могла повлиять на эффективность и обобщающую способность предиктивных моделей, а также на репрезентативность результатов. Необходимы дальнейшие исследования с включением большего числа пациентов.
Результаты нашего исследования демонстрируют высокую важность включения данных УЗИ легких в предиктивную модель для прогнозирования риска возникновения ОДН у пациентов в послеоперационный период. Прогностические модели были обучены и протестированы на относительно малом количестве пациентов, дальнейшие исследования могут быть направлены на улучшение моделей и их адаптацию к более широким выборкам, что позволит повысить точность и надежность прогнозов. Также наши результаты подтверждают целесообразность применения методов машинного обучения в медицинской практике для прогнозирования различных исходов.
Заключение
Проведенное исследование позволило создать прогностическую модель LUCH-D (Lung Ultrasound in Congenital Heart Disease), разработанную на основе алгоритма машинного обучения для предсказания развития ОДН в послеоперационный период у детей грудного возраста после радикальных кардиохирургических операций с высокой эффективностью, а также предиктивную модель на основе логистической регрессии. Необходимо отметить, что модели были созданы и протестированы на малой выборке пациентов, что могло повлиять на результаты и требует проведения дальнейших исследований. Учет показателей УЗИ легких может улучшать эффективность предиктивных моделей. Оценка выраженности ультразвуковых признаков, согласно представленному нами протоколу, может быть полезна для планирования и проведения исследований, посвященных созданию предиктивных моделей, которые прогнозируют развитие респираторных осложнений в послеоперационный период. Однако данное исследование является пилотным и требует валидации на более крупных и разнообразных выборках. Будущие исследования должны включать пациентов из разных медицинских центров и рассматривать возможность модификации предложенной модели для ее упрощения и дальнейшего повышения точности прогнозов.
Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов.
Disclosure. The authors declare no competing interests.
Вклад авторов. Все авторы в равной степени участвовали в разработке концепции статьи, получении и анализе фактических данных, написании и редактировании текста статьи, проверке и утверждении текста статьи.
Author contribution. All authors according to the ICMJE criteria participated in the development of the concept of the article, obtaining and analyzing factual data, writing and editing the text of the article, checking and approving the text of the article.
Этическое утверждение.Протоколы исследований и проекты информированных согласий были одобрены локальным этическим комитетом ФГБОУ ВО «Красноярский государственный медицинский университет им. проф. В.Ф. Войно-Ясенецкого» Минздрава России (протокол № 122/2023 от 29.11.2023 г.).
Ethics approval. The research protocols and informed consent projects were approved by the local ethics committee of the Voino-Yasenetsky Krasnoyarsk State Medical University (reference number: 122/2023-23.11.2023).
Информация о финансировании. Авторы заявляют об отсутствии внешнего финансирования при проведении исследования.
Funding source. This study was not supported by any external sources of funding.
Декларация о наличии данных.Данные, подтверждающие выводы этого исследования, можно получить у корреспондирующего автора по обоснованному запросу. Данные не являются общедоступными, так как они содержат информацию, которая может поставить под угрозу конфиденциальность участников исследования.
Data Availability Statement. The data supporting the conclusions of this study can be obtained from the corresponding author upon reasonable request. The data are not publicly available as they contain information that may jeopardize the confidentiality of the research participants.