LUCH-D — прогностическая модель развития острой дыхательной недостаточности в послеоперационный период у детей грудного возраста после радикальных кардиохирургических операций на основе оригинального протокола ультразвукового исследования легких: пилотное рандомизированное контролируемое исследование
ISSN (print) 1726-9806     ISSN (online) 1818-474X
PDF_2025-2-125-144
PDF_2025-2-125-144 (Английский)

Ключевые слова

кардиохирургические процедуры
врожденные пороки сердца
заболевания легких
ультразвуковое исследование
отделение интенсивной терапии
ребенок
алгоритм случайного леса

Как цитировать

Пфейфер А.А., Миллер А.Ю., Гурченко С.А., Ильиных К.А., Сакович В.А., Грицан А.И. LUCH-D — прогностическая модель развития острой дыхательной недостаточности в послеоперационный период у детей грудного возраста после радикальных кардиохирургических операций на основе оригинального протокола ультразвукового исследования легких: пилотное рандомизированное контролируемое исследование. Вестник интенсивной терапии имени А.И. Салтанова. 2025;(2):125–144. doi:10.21320/1818-474X-2025-2-125-144.

Статистика

Просмотров аннотации: 811
PDF_2025-2-125-144 загрузок: 80
PDF_2025-2-125-144 (Английский) загрузок: 15
Статистика с 01.07.2024

Язык

Мы в соцсетях

Аннотация

АКТУАЛЬНОСТЬ: Острая дыхательная недостаточность (ОДН) является одним из самых частых послеоперационных осложнений в детской кардиохирургии, и прогнозирование ее развития может благоприятно повлиять на эффективность проводимой интенсивной терапии. В последнее время появляется все больше данных о высокой чувствительности ультразвукового исследования (УЗИ) в диагностике патологических процессов в легких, и включение данного метода в комплексную предиктивную модель может значительно увеличить ее эффективность. ЦЕЛЬ ИССЛЕДОВАНИЯ: Разработать прогностическую модель развития ОДН в послеоперационный период у детей грудного возраста после радикальных кардиохирургических операций на основе УЗИ легких и оценить показатели ее эффективности на тестовой выборке пациентов. МАТЕРИАЛЫ И МЕТОДЫ: В пилотное исследование было включено 60 детей с врожденными пороками сердца (ВПС) в возрасте 1–12 мес. Пациенты были случайным образом разделены в обучающую (70 %), калибровочную (10 %) и тестовую (20 %) выборки. Были созданы две прогностические модели: на основе алгоритма машинного обучения Random Forest (ММО) и на основе логистической регрессии (МЛР). При создании моделей учитывались клинические данные и данные УЗИ легких, выполненного по оригинальному протоколу. Модели обучали на обучающей выборке и тестировались на тестовой выборке, калибровка ММО производилась на калибровочной выборке. Были проведены ROC-анализ и более глубокая оценка эффективности предварительно зафиксированной модели с помощью кросс-валидации Монте—Карло с 1000 итераций. РЕЗУЛЬТАТЫ: Получены следующие показатели эффективности ММО: AUC = 0,929, accuracy — 0,922, recall — 1,0, specificity — 0,867, precision — 0,840, F1-мера — 0,913. МЛР: AUC = 0,700, accuracy — 0,742, recall — 0,387, specificity — 1,0, precision — 1,0, F1-меры — 0,558.

Модель, созданная на основе алгоритма машинного обучения, показала более высокую эффективность и была названа LUCH-D — Lung Ultrasound in Congenital Heart Disease. ВЫВОДЫ: Созданная прогностическая модель LUCH-D позволяет предсказывать развитие ОДН в послеоперационный период у детей после радикальных кардиохирургических операций. Требуются дальнейшие исследования с включением большего числа пациентов.

PDF_2025-2-125-144
PDF_2025-2-125-144 (Английский)

Введение

Острая дыхательная недостаточность (ОДН) является одним из самых частых послеоперационных осложнений в детской кардиохирургии. Патофизиология ОДН после операции на сердце мультифакторна и включает неблагоприятные эффекты общей анестезии, в том числе ятрогенного ателектазирования при индуцированном апноэ в момент выполнения основного этапа операции, искусственного кровообращения (ИК), хирургической травмы, гипотермии [1, 2, 3], а также, вероятно, предсуществующего поражения легких.

Общая анестезия приводит к снижению тонуса диафрагмальных и межреберных мышц, а также функциональной остаточной емкости легких, что потенциально приводит к развитию в послеоперационный период ателектазирования и увеличению фракции шунта до 15 % и выше [4]. ИК вызывает системную воспалительную реакцию с активацией лейкоцитов и тромбоцитов, компонентов комплимента, системы коагуляции и фибринолиза, цитокинов, способствуя развитию капиллярной утечки, воспалению и микроателектазированию паренхимы, интерстициальному отеку, что приводит к постперфузионному повреждению легких [2, 3, 5]. В процессе проведения ревизии и перикардиотомии, а также в результате работы коагулятором существует риск травматизации диафрагмальных нервов, что может вызвать парез или паралич купола диафрагмы и способствовать развитию ателектазов в нижних долях легких [6, 7]. Кроме того, мы полагаем, что вклад в развитие послеоперационной ОДН в значительной степени вносит предсуществующее повреждение легких, а также тип врожденного порока сердца (ВПС), который потенциально обусловливает степень этого поражения в виде интерстициального отека и ателектазирования. В свою очередь послеоперационная ОДН увеличивает риск неблагоприятных исходов, включая почечные, неврологические и инфекционные осложнения, увеличение продолжительности искусственной вентиляции легких (ИВЛ), пребывания в отделении интенсивной терапии и стационаре, а также риск летального исхода [8].

Несмотря на существование классических методов диагностики причин ОДН, все они имеют свои ограничения, особенно в критическом состоянии пациента и при ограниченных возможностях транспортировки. В последние десятилетия наблюдается развитие нового метода диагностики дыхательной системы, основанного на ультразвуковой визуализации, который успешно применяется во взрослой практике и активно внедряется в педиатрии. Ультразвуковая визуализация позволяет своевременно выявлять патологии легких в отделениях интенсивной терапии. Метод демонстрирует высокую чувствительность к различным патологическим процессам в легких, включая альвеолярные консолидации [9], интерстициальный синдром [10, 11], плевральный выпот [12, 13] и пневмоторакс [9, 14, 15].

Имеются данные, что ультразвуковое исследование (УЗИ) легких позволяет прогнозировать послеоперационные осложнения в детской кардиохирургии, а также используется для проведения визуально контролируемой интенсивной терапии [16]. Так, в статье Ghotra G.S. et al. многофакторный анализ показал, что балльная оценка УЗИ легких является независимым предиктором легочных осложнений, продолжительности ИВЛ и пребывания в отделении интенсивной терапии [17] Girona-Alarcón M et al. получили схожие результаты [18]. В исследовании Cantinotti M. et al. было показано, что оценка УЗИ легких является независимым предиктором длительности нахождения в реанимации и успешности экстубации трахеи [19]. УЗИ диафрагмы, по данным литературы, также позволяет прогнозировать успешную экстубацию [20].

Прогнозирование развития ОДН в послеоперационный период поможет принимать обоснованные решения о дальнейшей стратегии лечения и предотвращении возможных осложнений.

Проведенное нами исследование выполняет роль пилотного проекта, позволяя проверить техническую реализуемость предложенного подхода в предсказании развития ОДН у данной категории пациентов с целью принятия обоснованных решений о дальнейшей стратегии лечения и минимизации возможных осложнений. Представленная статья позволяет получить первичные результаты, которые могут быть использованы для планирования более крупномасштабных исследований, а также выявить ограничения текущего подхода и предложить пути их преодоления. Таким образом, результаты пилотного исследования могут стать основой для дальнейшего развития прогностической модели и ее внедрения в клиническую практику.

Цель исследования

Разработать прогностическую модель развития ОДН в послеоперационный период у детей грудного возраста после радикальных кардиохирургических операций на основе УЗИ легких.

Материалы и методы

Рандомизированное контролируемое пилотное исследование проводилось на базе детского отделения анестезиологии-реанимации (ОАРд) Федерального центра сердечно-сосудистой хирургии г. Красноярска. В исследование было включено 60 детей с ВПС в возрасте 1–12 месяцев, получавших комплексное лечение и диагностику с октября 2023 по декабрь 2024 г., методом сплошного охвата при соответствии критериям включения. Такой подход обеспечивает репрезентативность выборки и минимизирует возможные смещения. Объем выборки в 60 пациентов является ограниченным, что характерно для клинических исследований в области детской кардиохирургии. Это ограничение связано с малым числом пациентов, нуждающихся в таких вмешательствах. Учитывая ограниченный объем выборки, была применена строгая методология: обучение модели на обучающей выборке, ее фиксация, последующая калибровка на независимой калибровочной выборке и кросс-валидация по методу Монте—Карло с 1000 итераций на независимой тестовой выборке.

Протоколы исследований и проекты информированных согласий были одобрены локальным этическим комитетом ФГБОУ ВО «Красноярский государственный медицинский университет им. проф. В.Ф. Войно-Ясенецкого» Минздрава России (протокол № 122/2023 от 29.11.2023 г.). Информированное согласие было подписано законными представителями всех пациентов, включенных в исследование при поступлении в кардиохирургическое отделение, до начала исследования.

Критерии включения:

  • возраст 1–12 месяцев на момент проведения исследования;
  • предполагаемая первичная радикальная коррекция ВПС в условиях искусственного кровообращения (ИК);
  • наличие подписанного добровольного информированного согласия родителей или законных представителей ребенка.

Критерии невключения:

  • новорожденные или дети старше 1 года;
  • наличие тяжелых сопутствующих заболеваний в анамнезе, способных значимо повлиять на течение раннего послеоперационного периода;
  • цианотические ВПС;
  • паллиативная коррекция ВПС;
  • коррекция ВПС без проведения ИК;
  • отсутствие подписанного добровольного информированного согласия на проведение исследования.

Критерии исключения:

  • отзыв добровольного информированного согласия на проведение исследования;
  • летальный исход (1 случай).

Исследование включало 3 этапа. На первом этапе производился сбор данных для создания прогностической модели на дооперационном и послеоперационном оценочных периодах. На втором этапе выполнялось определение наличия или отсутствия ОДН в оценочном периоде перед переводом в профильное отделение (первичная конечная точка). На третьем этапе осуществлялись создание и тестирование прогностических моделей, статистическая обработка данных и формирование результатов исследования (рис. 1).

Блок-схема дизайна
    исследования. Этап 1 — дооперационный
    и послеоперационный оценочные периоды. Этап 2 — оценочный период перед
переводом в профильное отделение

Рис. 1. Блок-схема дизайна исследования. Этап 1 — дооперационный и послеоперационный оценочные периоды. Этап 2 — оценочный период перед переводом в профильное отделение Fig. 1. Flowchart of the research design. Stage 1 — preoperative and postoperative assessment periods. Stage 2 — assessment period prior to transfer to the specialized department

Протокол УЗИ легких

УЗИ легких выполнялось линейными датчиками 5–12 МГц (Philips CX50, Сингапур) и 8–18 МГц (GE Logiq E, США) для оценки интерстициального синдрома, синдрома альвеолярной консолидации, воздушных бронхограмм, локального В+-синдрома, плеврального выпота и пневмоторакса. Базовый режим: абдоминальный, глубина сканирования — 3,0–4,5 см. Для диагностики характера движения диафрагмы использовался конвексный датчик 1–5 МГц (Philips CX50, Сингапур) и микроконвексный датчик 4,2–11 МГц (G.E. Logiq E, США). Базовый режим: абдоминальный, глубина сканирования подбиралась индивидуально в зависимости от конституциональных особенностей пациентов.

Протокол УЗИ легких выполнялся одним исследователем на каждом оценочном периоде исследования.

Было решено учитывать следующие ультразвуковые синдромы:

  • интерстициальный синдром;
  • синдром альвеолярной консолидации;
  • синдром плеврального выпота (гидроторакс);
  • пневмоторакс;
  • характер движения диафрагмы;
  • локальный B+-синдром.

В большинстве исследований, посвященных оценке предиктивных возможностей УЗИ легких, предлагалась оценка ультразвуковых синдромов по 36 балльной шкале (сумме баллов, полученных при сканировании 12 зон легких [17, 21]) либо альтернативным шкалам [18], при этом разные ультразвуковые синдромы учитывались в рамках одной единой балльной шкалы (например, в случае изолированного присутствия интерстициального синдрома в зоне исследования выставляется 1–2 балла, при обнаружении альвеолярной консолидации в зоне исследования выставляется 3 балла [17, 21]). На основе выдвинутой гипотезы о том, что все ультразвуковые синдромы имеют разный вклад в увеличение вероятности развития ОДН в послеоперационный период, было решено отдельно учитывать все ультразвуковые синдромы и ввести оригинальную балльную систему для подсчета выраженности каждого синдрома независимо друг от друга в рамках одного ультразвукового протокола.

Грудная клетка была разделена на 2 половины — левую и правую по грудине спереди и по позвоночному столбу сзади. Каждая половина грудной клетки разделялась на 3 отдела: передний, боковой и задний. Передний отдел начинался от парастернальной линии и заканчивался передней подмышечной линией. Боковой отдел начинался от передней подмышечной линии и заканчивался задней подмышечной линией. Задний отдел начинался от задней подмышечной линии и заканчивался позвоночным столбом. Каждый отдел в свою очередь разделялся на верхнюю и нижнюю зоны примерно пополам по причине отсутствия стандартизированных ориентиров для всех комплекций детей от 1 месяца до 1 года. Суммарно в каждой половине грудной клетки выделялось 6 зон, суммарно — 12 зон. Сканирование проводилось при продольном положении линейного датчика (параллельно межреберью) ковровым методом справа-налево и сверху-вниз.

Интерстициальный синдром

Оценка наличия интерстициального синдрома выполнялась по общепризнанным ультразвуковым критериями [9, 11, 22–25]. Выраженность интерстициального синдрома оценивалась полуколичественным методом по выраженности В-линий. В каждом сегменте выбирался межреберный промежуток с наибольшим количеством В-линий, входящих в один ультразвуковой срез.

Выраженность интерстициального синдрома оценивалась в баллах по отношению количества В-линий к межреберному промежутку. 0 баллов — В-линии отсутствуют, 1 балл — до 10 % В-линий в одном ультразвуковом срезе (единичные В-линии), 2 балла — от 10 % до 50 % В-линий в одном ультразвуковом срезе, 3 балла — от 50 % до 90 % В-линий в одном ультразвуковом срезе, 4 балла — более 90 % В-линий в одном ультразвуковом срезе («белое легкое») (рис. 2). В случаях пограничного значения выраженности В-линий в ультразвуковом срезе (например, 50 %) выставлялся высший балл (3 балла).

Оценивалась выраженность интерстициального синдрома в каждом легком отдельно путем суммации баллов всех зон: интерстициальный синдром легкой степени (до 6 баллов включительно в одном легком), средней степени (от 7 до 12 баллов включительно), тяжелой степени (от 13 до 18 баллов включительно), крайне тяжелой степени (от 19 до 24 баллов). Результат вносился в базу данных.

Оценка выраженности
интерстициального синдрома в баллах. Белой стрелкой указана B-линия — вертикальный гиперэхогенный луч, исходящий из плевральной линии (синяя стрелка):

Рис. 2. Оценка выраженности интерстициального синдрома в баллах. Белой стрелкой указана B-линия — вертикальный гиперэхогенный луч, исходящий из плевральной линии (синяя стрелка): A — 1 балл (до 10 % В-линий в ультразвуковом срезе — единичные В-линии); B — 2 балла (от 10 % до 50 % В-линий в ультразвуковом срезе); C — 3 балла (от 50 % до 90 % В-линий в ультразвуковом срезе); D — 4 балла (более 90 % В-линий в одном ультразвуковом срезе — «белое легкое») (Автор рисунка — Пфейфер А.А.) Fig. 2. Assessment of the severity of interstitial syndrome in points. The white arrow indicates the B-line — a vertical hyperechoic beam originating from the pleural line (blue arrow): A — 1 point (up to 10 % B-lines in the ultrasound slice — single B-lines); B — 2 points (from 10 % to 50 % B-lines in the ultrasound slice); C — 3 points (from 50 % to 90 % B-lines in the ultrasound slice); D — 4 points (more than 90 % B-lines in one ultrasound slice — “white lung”) (Credit — Pfeifer A.A.)

Синдром альвеолярной консолидации

Диагностика наличия интерстициального синдрома выполнялась по общепризнанным ультразвуковым критериям [9, 25]. Оценка выраженности альвеолярной консолидации проходила путем оценки ее размера относительно всей исследуемой зоны. 0 баллов — альвеолярная консолидация отсутствует, 1 балл — небольшая субплевральная консолидация, визуализируемая в одном межреберном промежутке, 2 балла — альвеолярная консолидация, визуализируемая более чем в 1 межреберном промежутке, но занимающая менее 50 % исследуемой зоны, 3 балла — альвеолярная консолидация, занимающая более 50 % исследуемой зоны, 4 балла — альвеолярная консолидация, занимающая всю зону сканирования. При наличии альвеолярной консолидации, оцениваемой в 4 балла, подсчет В-линий невозможен. В таких случаях в оценке интерстициального синдрома выставлялось 0 баллов. В случаях пограничного значения выраженности альвеолярной консолидации выставлялся высший балл.

При наличии альвеолярной консолидации также оценивалось наличие воздушных бронхограмм [9]. Отдельно выделялись динамические и статические воздушные бронхограммы, а также их отсутствие, где 0 баллов — бронхограммы отсутствуют, так как нет альвеолярной консолидации, 1 балл — динамическая воздушная бронхограмма, 2 балла — статическая воздушная бронхограмма, 3 балла — воздушной бронхограммы в зоне альвеолярной консолидации нет.

Синдром плеврального выпота

При обнаружении признаков наличия плеврального выпота [9, 25] проводился подсчет его примерного объема. Для этого пациент укладывался в строго горизонтальное положение на 5 мин с целью равномерного распределения выпота по плевральной полости. После этого производилось измерение толщины выпота по задней подмышечной линии трехкратно. Максимальная толщина в миллиметрах подставлялась в модифицированную формулу Balik [26] с поправочными коэффициентами по массе тела.

0 баллов — плевральный выпот отсутствует, 1 балл — малый плевральный выпот менее 5 мл/кг массы тела, 2 балла — умеренный плевральный выпот от 5 до 10 мл/кг, 3 балла — массивный плевральный выпот более 10 мл/кг. В случаях пограничного значения выраженности плеврального выпота выставлялся высший балл.

Пневмоторакс

Пневмоторакс оценивался в положении пациента лежа на спине строго горизонтально. Определялось положение «точки легкого» — границы пневмоторакса [9].

0 баллов — пневмоторакса нет, 1 балл — малый пневмоторакс при наличии «точки легкого», не достигающей передней подмышечной линии, 2 балла — умеренный пневмоторакс при наличии «точки легкого» между передней и средней подмышечными линиями, 3 балла — массивный пневмоторакс, когда «точка легкого» находится кзади от средней подмышечной линии или не определяется вовсе.

В случаях пограничного значения выраженности пневмоторакса выставлялся высший балл.

Характер движения диафрагмы

Проводилась оценка характера движения обоих куполов диафрагмы в B- и М-режимах согласно описанной в литературе методике [27]. При самостоятельном дыхании ребенка характер движения купола диафрагмы подразделялся на следующие баллы: 0 баллов — норма, движения куполов диафрагмы синхронны, движение на вдохе направлено каудально, в М-режиме волна направлена вершиной вверх, 1 балл — парез (паралич), движение купола отсутствует или минимально присутствует, в М-режиме изолиния или низкоамплитудная волна, направленная вверх, 2 балла — парадоксальное движение, движение купола диафрагмы направлено краниально, в М-режиме отмечается инвертированная волна.

При проведении аппаратной ИВЛ в соответствующем оценочном периоде характер движения диафрагмы указывался как норма.

Локальный B+-синдром

Локальный В+-синдром фиксировался отдельно для каждой зоны легкого в случае локального появления компактно расположенных множественных «сливных» В-линий, значимо превышающих по количеству число В-линий в остальном исследуемом межреберном промежутке зоны. Результат вносился в электронную базу данных в формате есть/нет (1/0).

Дооперационный и послеоперационный оценочные периоды

Группы интенсивной терапии

В связи с тем, что авторами также проводится параллельное исследование оценки эффективности интенсивной терапии с применением УЗИ легких, в котором участвуют все 60 пациентов, включенных в данное исследование, а также в связи с потенциальной клинической значимостью возможности учета предиктивной моделью стратегии интенсивной терапии (под контролем или без УЗИ легких) на дооперационном этапе при поступлении в кардиохирургическое отделение № 4 пациенты разделялись на 2 группы при помощи рандомизации:

  1. 1 группа — группа интенсивной терапии под контролем УЗИ легких. Интенсивная терапия в послеоперационный период осуществлялась с учетом данных УЗИ легких, и проводился УЗИ-контроль в динамике. УЗИ в послеоперационный период проводилось минимум трижды: в течение 2 ч после поступления пациента из операционной в палату интенсивной терапии ОАРд, через 2–4 ч после начала терапии и после экстубации трахеи. Количество и частота УЗИ легких в данной группе ограничены не были.
  2. 2 группа — группа интенсивной терапии без контроля УЗИ легких. Интенсивная терапия проводилась исходя из данных объективного осмотра, лабораторных и инструментальных данных, исходного типа ВПС, характера выполненного оперативного вмешательства, опыта дежурного врача-реаниматолога. Результаты проведенного УЗИ легких дежурному врачу-реаниматологу не сообщались, рекомендации не выдавались. Интенсивная терапия осуществлялась без использования данного метода, что учитывалось при формировании базы данных и создании прогностической модели с целью повышения ее точности, чувствительности и специфичности.

Демографические данные

В базе данных учитывались пол, масса, рост, возраст.

УЗИ легких

Выполнялось исследователем по оригинальному протоколу, описанному выше. В базе данных учитывались результаты УЗИ легких в дооперационный период за 18–24 ч до выполнения оперативного вмешательства и в послеоперационный оценочный период в течение 2 ч после поступления пациента из операционной в палату интенсивной терапии ОАРд.

Интраоперационные данные

В данном разделе фиксировалось влияние ВПС на легочный кровоток (ВПС с гиперволемией малого круга кровообращения или ВПС без гиперволемии малого круга кровообращения), продолжительность ИК в минутах, продолжительность окклюзии аорты в минутах.

В исследование были включены дети со следующими ВПС:

  • ВПС с гиперволемией малого круга кровообращения: септальные дефекты (дефект межжелудочковой перегородки, дефект межпредсердной перегородки, их комбинации);
  • ВПС без гиперволемии малого круга кровообращения: клапанный стеноз легочной артерии, клапанный стеноз аорты, коарктация аорты, аномальное отхождение левой коронарной артерии от легочной артерии, недостаточность митрального клапана.

Особенности интенсивной терапии под контролем УЗИ легких

Интерстициальный синдром

Терапия интерстициально синдрома осуществлялась относительно его выраженности по данным УЗИ легких путем назначения диуретической терапии, снижения объема инфузии и контроля нормального уровня общего белка в крови. При наличии интерстициального синдрома легкой степени тяжести коррекция терапии не проводилась, проводился динамический контроль гидробаланса с повторной оценкой УЗИ легких через 2–4 ч после начала терапии и после экстубации трахеи.

Известно, что диуретическая терапия уменьшает объем внесосудистой жидкости в легких, что проявляется снижением выраженности интерстициального синдрома по данным УЗИ [28]. При выраженности интерстициального синдрома выше легкой степени тяжести диуретическая терапия проводилась путем дробного внутривенного назначения 0,2–0,4 мг/кг фуросемида с возможным переходом на микроструйное введение с повышением дозировки максимально до 1 мг/кг/ч под контролем клинического состояния, уровня диуреза, гидробаланса и УЗИ легких.

По литературным данным, снижение уровня альбумина вызывает накопление внесосудистой жидкости в легких за счет снижения онкотического давления крови, и поддержание его нормального уровня улучшает вентиляционно-перфузионные отношения [29]. В связи с этим проводилась оценка, контроль и поддержание нормального уровня общего белка путем внутривенного введения альбумина при наличии интерстициального синдрома тяжелой и крайне тяжелой степени тяжести, выявленного при выполнении УЗИ легких.

Синдром альвеолярной консолидации

Интенсивная терапия осуществлялась путем проведения рекрутмент-маневров, установки уровня PEEP (Positive End Expiratory Pressure), позиционирования пациента, постурального дренажа c санацией трахеобронхиального дерева.

Рекрутмент-маневр проводился под контролем УЗИ путем ступенчатого повышения уровня PEEP по методике [30], однако с некоторыми модификациями, в частности, мы снижали уровень PEEP при проведении рекрутмент-маневра не до 0, как было предложено авторами, а до персонально установленного для каждого пациента уровня, подбор которого описан далее. Также данный рекрутмент-маневр выполнялся нами ручным методом, без использования интеллектуальных аппаратных режимов. В случаях уменьшения размеров консолидаций по данным УЗИ (рекрутабельности участков легкого) рекрутмент-маневр повторялся при каждом отсоединении дыхательного контура.

Так как есть данные, что PEEP может негативно влиять на лимфатический дренаж паренхимы легкого [31], что может приводить к увеличению в ней внесосудистой жидкости, уровень PEEP устанавливался персонифицированно в зависимости от суммы баллов, полученных при оценке синдрома альвеолярной консолидации: при отсутствии альвеолярных консолидаций — PEEP 5, при сумме от 1 до 8 баллов — PEEP 6, при сумме более 8 баллов — PEEP 7.

Выполнялось позиционирование пациента и постуральный дренаж с учетом выявленных зон с наиболее выраженным синдромом альвеолярной консолидации, так как есть данные позитивного влияния данных лечебных мероприятий на ателектазированную паренхиму легких [32].

Плевральный выпот

Терапия осуществлялась в зависимости от объема выпота. При объеме выпота менее 5 мл/кг массы тела выполнялась консервативная терапия фуросемидом, проводилось снижение объема инфузионной терапии с последующим контролем в динамике. При объеме выпота от 5 до 10 мл/кг терапия зависела от выраженности клинических проявлений дыхательной недостаточности. Решение о дренировании плевральной полости или проведении консервативной терапии принималось совместно с детскими кардиохирургами. При объеме более 10 мл/кг выполнялось дренирование.

Пневмоторакс

При выявлении малого пневмоторакса проводилась оценка его объема в динамике либо дренирование после обсуждения с заведующим отделения ОАРд и детским кардиохирургом. При выявлении умеренного и массивного пневмоторакса выполнялось дренирование плевральной полости.

Аномальное движение диафрагмы

При выявлении аномального движения диафрагмы оповещался детский кардиохирург для решения вопроса о выполнении ее пликации.

Оценочный период перед переводом пациента в профильное отделение

В данный оценочный период производилась оценка наличия или отсутствия проявления ОДН.

Критерии ОДН

Оценка наличия ОДН у пациентов осуществлялась непосредственно перед переводом из ОАРд в кардиохирургическое отделение № 4. Решение о переводе принималось совместно после обсуждения на обходе с заведующим ОАРд и заведующим кардиохирургическим отделением № 4, учитывая клиническое состояние пациента, лабораторные и инструментальные данные.

Для оценки проявлений ОДН все дети переводились на самостоятельное дыхание атмосферным кислородом на 10 мин, после чего осуществлялся забор артериальной крови для оценки PaO2, SaO2 и PaO2/FiO2.

В исследовании критериями наличия ОДН были: значение PaO2/FiO< 300 и/или SaO2 < 92 %, и/или нарастание частоты дыхательных движений > 30 % от исходной величины. Все критерии фиксировались в базе данных. Отмечалось резюмирующее значение: ОДН есть или ОДН нет.

Статистическая обработка данных

Накопление и первичный анализ данных проводили в написанной нами на языке программирования C# программе (интерфейсе), облегчающей взаимодействие с базой данных SQLite и формирующей файлы (книги) Excel, на основе которых далее осуществлялось формирование предиктивных моделей. При нормальном распределении данные были представлены средним значением и стандартным отклонением М ± SD; описание количественных данных, не подчиняющихся закону нормального распределения, представляли в виде Me (Q1; Q3), где Me — медианное значение, Q1 — первый квартиль (25-й процентиль), Q3 — третий квартиль (75-й процентиль). Частотные данные представлены в формате n (%), где n — абсолютное количество наблюдений в группе, а % — процент числа наблюдений в группе. Значимым считалось значение p < 0,05.

Нормальность распределения полученных данных оценивалась с использованием критерия Шапиро—Уилка. Поскольку распределение большинства исследуемых параметров существенно отличалось от нормального, для сравнительного анализа количественных независимых переменных был применен непараметрический U-критерий Манна—Уитни. Для параметров, распределение которых соответствовало нормальному, сравнительный анализ количественных независимых переменных проводился с использованием t-критерия Стьюдента.

Всего в исследование было включено 60 пациентов. Все пациенты были случайным образом разделены на 3 выборки: для обучения — 42 пациента (70 %), калибровки модели — 6 пациентов (10 %) и тестирования модели — 12 пациентов (20 %).

Для создания прогностической модели на основе машинного обучения (ММО) использовался метод Random Forest — ансамблевый метод, основанный на множестве деревьев решений. Каждое дерево обучается на случайной подвыборке данных и признаков, что снижает риск переобучения по сравнению с отдельными деревьями решений. Ансамблирование деревьев решений позволяет улучшить качество прогнозов за счет усреднения результатов нескольких моделей, эффективно работать с нелинейными взаимосвязями между признаками, небольшими выборками и разнородными данными.

Случайное разделение пациентов на обучающую, калибровочную и тестовую выборки с отсутствием статистически значимых различий по базовым характеристикам пациентов, включая основной класс (пациенты с ОДН), обеспечивает высокую представительность каждой выборки, минимизирует предвзятость, уменьшает риск переобучения модели и повышает достоверность результатов исследования. Этот подход особенно важен в условиях ограниченных данных.

Проводилось обучение модели и ее калибровка на отдельных выборках с дальнейшей фиксацией и сохранением модели. Калибровочная выборка использовалась для настройки гиперпараметров ММО. Оценка калибровки ММО выполнялась с помощью расчета Brier Score. Далее выполнялось тестирование модели на тестовой выборке без кросс-валидации с выполнением ROC-анализа по трем точкам с расчетом AUC. Для более глубокой оценки эффективности созданной предиктивной модели ММО проводилась кросс-валидация методом Монте—Карло с 1000 итераций. Метрики оценки прогностической модели рассчитывались для каждого разбиения, а итоговая оценка определялась как среднее значение метрик по всем итерациям. Показателями эффективности (performance) моделей были следующие общепризнанные метрики: accuracy (точность), recall (полнота), specificity (специфичность), precision (точность предсказания), F1-мера. Метрики рассчитывались с использованием Confusion Matrix (матрицы ошибок), где выделялись истинно положительные, истинно отрицательные, ложноположительные и ложноотрицательные значения.

Также была создана предиктивная модель на основе логистической регрессии (МЛР) с обучением модели и ее тестированием на отдельных выборках. Был выполнен однофакторный и многофакторный регрессионные анализы, создано уравнение логистической регрессии. Далее выполнялось тестирование модели на тестовой выборке с выполнением ROC-анализа с расчетом AUC. Для глубокой оценки эффективности МЛР проводилась кросс-валидация Монте—Карло с 1000 итераций. В качестве оценки эффективности модели использовались аналогичные метрики. Метрики рассчитывались с использованием матрицы ошибок.

Обработка данных, построение предиктивных моделей (ММО и МЛР), статистический анализ данных, исследование эффективности построенных предиктивных моделей и визуализация данных осуществлялись с применением программных алгоритмов, написанных на языке программирования Python (Python Software Foundation, Version 3.12.0, Wilmington, DE: Python Software Foundation) с использованием следующих библиотек: numpy, pandas, sklearn, sqlite3, scipy, matplotlib, seaborn, docx, joblib, statsmodels.

Выбор методологии Random Forest с разбиением данных на три выборки (обучение, калибровка, тестирование) с фиксацией модели и с последующей калибровкой и проведением кросс-валидации обусловлен следующими факторами: ограниченный объем данных (60 пациентов), необходимость получения надежных и интерпретируемых результатов, важность оценки вероятностных прогнозов и их калибровки, требования к стабильности и точности модели для медицинского применения. Эта методология обеспечивает баланс между качеством модели и возможностями исследования с ограниченной выборкой данных. Использование замороженной модели (модели, обученной на обучающей выборке и фиксированной без дальнейшей перенастройки параметров) для калибровки и кросс-валидации имеет несколько важных преимуществ, которые улучшают качество прогнозов и надежность результатов:

  • устойчивость к переобучению и обеспечение стабильных прогнозов для каждого случая — когда модель фиксируется после обучения, ее параметры больше не меняются в процессе калибровки или тестирования, это помогает избежать риска переобучения на новых данных, калибровка выполняется только для корректировки вероятностных прогнозов модели, а не для изменения ее структуры или параметров, таким образом, сохраняется способность модели обобщать данные, полученные на обучающей выборке;
  • возможность повторного использования модели — фиксированная модель может быть легко повторно использована для других задач или данных, так как ее параметры остаются фиксированными. Это делает ее более универсальной и удобной для практического применения. Кросс-валидация по методу Монте—Карло с использованием 1000 итераций обеспечивает стабильность и надежность полученных результатов, компенсируя ограничения объема данных. Выполнение калибровки позволяет улучшить адекватность вероятностных прогнозов;
  • объективная оценка обобщающей способности — поскольку модель уже обучена и фиксирована, результаты кросс-валидации отражают реальную производительность модели на новых данных, а не ее способность адаптироваться к каждому разбиению. Это минимизирует риск оптимистического искажения метрик, которое может возникнуть при повторном обучении модели на каждом разбиении;
  • при использовании фиксированной модели результаты кросс-валидации становятся более стабильными, так как модель не зависит от случайных факторов, связанных с повторным обучением. Это позволяет получить более надежные средние значения метрик и их распределение;
  • результаты кросс-валидации на замороженной модели легче интерпретировать, так как они показывают, как модель работает на данных, которых она не видела во время обучения. Это дает четкое представление о ее производительности в реальных условиях.

Результаты

Базовые характеристики пациентов представлены в табл. 1. Базовые характеристики у пациентов в обучающей и калибровочной выборках представлены в табл. 2. Базовые характеристики пациентов в тестовой выборке представлены в табл. 3. Статистически значимых различий между выборками не было.

Обучающая и тестовая выборки при обучении и тестировании обеих моделей (ММО и МЛР) были идентичными по объему, включенным пациентам и учитываемым факторам.

В результате обучения модели ММО производилась настройка гиперпараметров. С последующей калибровкой на калибровочной выборке были настроены следующие гиперпараметры: n_estimators (число деревьев в лесу; увеличение числа деревьев может улучшить качество модели, но повышает время обучения), max_depth (максимальная глубина дерева; ограничивает глубину дерева для предотвращения переобучения), min_samples_split (минимальное число образцов для разделения узла), min_samples_leaf (минимальное число образцов в листе), max_features (максимальное количество признаков для выбора при делении узла; влияет на случайность модели), bootstrap (использование выборки с возвращением). Нами были установлены следующие значения гиперпараметров: n_estimators, равное 100, max_depth, равное 30, min_samples_split, равное 5, min_samples_leaf, равное 2, bootstrap установили True. Brier Score составил 0,095. Построена калибровочная кривая (рис. 3). Модель была зафиксирована (сохранена). Далее было выполнено тестирование модели на тестовой выборке с выполнением ROC-анализа и построением ROC-кривой (рис. 4). AUC ММО составила 0,929. Вторым этапом была проведена кросс-валидация сохраненной модели ММО на тестовой выборке по методу Монте—Карло с 1000 итераций для оценки обобщающей способности заранее обученной и зафиксированной модели. Исходные 12 тестовых случаев случайным образом разбивались на подмножества в ходе 1000 итераций, в каждую обучающую выборку попадали 9 случаев, а оставшиеся 3 использовались для тестирования, причем модель использовалась исключительно для прогнозирования без повторного обучения; 9 случаев, отобранных для обучающей выборки, использовались исключительно для симуляции и проверки модели на согласованность ее прогнозов с обучающими данными, а не для обновления параметров модели. Метрики эффективности прогностической модели рассчитывались для каждого разбиения, а итоговая оценка определялась как среднее значение метрик по всем итерациям. Показатели эффективности были следующими: accuracy (точность) — 0,922 (92,2 %), recall (полнота, чувствительность) — 1,0 (100 %), specificity (специфичности) — 0,867 (86,7 %), precision (точность предсказания) — 0,840, F1-меры — 0,913. Результаты представлены в таблице 4. Построена Confusion Matrix (рис. 5).

Также была создана вторая прогностическая модель по принципу логистической регрессии (МЛР) с включением тех же пациентов в обучающую (42 пациента) и тестовую (12 пациентов) выборку на основе учета тех же факторов, что и при создании ММО. Пациенты из калибровочной выборки при создании и тестировании данной модели не использовались. Был проведен однофакторный (табл. 5) и многофакторный (табл. 6) регрессионный анализ. При однофакторном анализе было выявлено 26 статистически значимых факторов. Создано уравнение логистической регрессии:

Logit(P) = –0,8556 + 343,1066 × MainGroup + 6,2992 × LeftLungLateralUp_BLines_0 + –152,5780 × LeftLungLateralUp_LocalBSyndrome_1 + –20,8457 × LeftLungPosteriorUp_Consolidations_1 + 49,0374 × LeftLungPosteriorUp_AirBronchograms_1 + 4,2821 ×RightLungAnteriorUp_BLines_0 + 43,7875 × RightLungAnteriorUp_BLines_1 + 0,9157 × RightLungLateralUp_BLines_0 + 45,5332 × RightLungLateralUp_BLines_1 + –65,3959 × RightLungLateralUp_Consolidations_1 + –43,1994 × RightLungLateralUp_AirBronchograms_1 + 140,8244 × RightLungPosteriorUp_BLines_1 + 2,1094 × RightLungPosteriorUp_Consolidations_0 + 19,6377 × RightLungPosteriorUp_Consolidations_1 + 14,4657 × RightLungPosteriorUp_AirBronchograms_0 + 5,8946 ×RightLungPosteriorUp_AirBronchograms_1 + 16,1164 × RightLungLateralDown_Consolidations_1 + –101,0784 × RightLungLateralDown_LocalBSyndrome_0 + 77,5300 × RightLungLateralDown_AirBronchograms_1 + 11,0685 × RightLungPosteriorDown_BLines_1 + –35,5075 × RightLungPosteriorDown_Consolidations_1 + 37,3142 × RightLungPosteriorDown_AirBronchograms_1 + 27,4746 × RightLungIntersticialSyndrome_0 + –31,8331 × RightLungIntersticialSyndrome_1 + –14,5012 × PatientHeight + 0,9210 × Age

Выполнено тестирование модели на тестовой выборке с выполнением ROC-анализа и построением ROC-кривой (рис. 4). AUC МЛР составила 0,70.

Далее была проведена кросс-валидация на тестовой выборке по методу Монте—Карло с 1000 итераций по принципам, идентичным ММО. Важно отметить, что МЛР также не переобучалась в ходе этих итераций. Показатели эффективности были следующими: accuracy (точности) — 0,742 (74,2 %), recall (полнота, чувствительность) — 0,387 (38,7 %), specificity (специфичности) — 1,000 (100 %), precision (точности предсказания) — 1,000, F1-меры — 0,558 (табл. 7). Построена Confusion Matrix (рис. 5).

Было проведено сравнение метрик двух прогностических моделей — ММО и МЛР. (табл. 7).

Показатель Значение
Возраст, сут 114,0 (61,5; 184,8)
Масса пациента, кг 5,8 (4,9; 6,8)
Рост пациента, см 61,0 (56,8; 64,0)
Пол пациента, м 29 (48,3 %)
ВПС с гиперволемией МКК 42 (70,0 %)
Дыхательная недостаточность 35 (58,3 %)
Длительность ИК, мин 50,0 (40,0; 70,0)
Длительность пережатия аорты, мин 28,5 (22,8; 42,5)
Таблица 1. Базовые характеристики пациентов (n = 60), включенных в исследование
Table 1. Basic characteristics of patients (n = 60) included in the study
Значения Обучающая выборка (n = 42) Тестовая выборка (n = 12) p-value
Возраст, сут 120,00 (60,50; 186,25) 170,67 ± 104,68 0,382
Масса, кг 5,97 ± 1,76 6,54 ± 2,37 0,377
Рост, см 61,10 ± 8,02 64,17 ± 8,65 0,265
Мужской пол, n (%) 22 (52,4) 6 (50,0) 1,000
ВПС с гиперволемией МКК, n (%) 33 (78,6) 6 (50,0) 0,113
Дыхательная недостаточность, n (%) 25 (59,5) 7 (58,3) 0,442
Продолжительность искусственного кровообращения, мин 50,00 (43,00; 75,75) 45,00 (38,00; 75,00) 0,755
Продолжительность пережатия аорты, мин 28,50 (23,25; 43,50) 27,50 (23,50; 40,00) 0,992
Таблица 2. Сравнение базовых характеристик пациентов обучающей и тестовой выборок
Table 2. Comparison of basic characteristics of patients in the training and test samples
Значения Обучающая выборка (n = 42) Калибровочная выборка (n = 6) p-value
Возраст, сут 120,00 (60,50; 186,25) 76,67 ± 26,29 0,078
Масса, кг 5,97 ± 1,76 5,69 (4,27; 5,70) 0,249
Рост, см 61,10 ± 8,02 55,67 ± 3,82 0,117
Мужской пол, n (%) 22 (52,4) 3 (50,0) 1.000
ВПС с гиперволемией МКК, n (%) 33 (78,6) 3 (50,0) 0,313
Дыхательная недостаточность, n (%) 25 (59,5) 5 (83,3) 0,499
Продолжительность ИК, мин 50,00 (43,00; 75,75) 58,00 ± 12,79 0,492
Продолжительность пережатия аорты, мин 28,50 (23,25; 43,50) 31,33 ± 11,37 0,938
Таблица 3. Сравнение базовых характеристик пациентов обучающей и калибровочной выборок
Table 3. Comparison of basic characteristics of patients in the training and calibration samples
Значения Группа 1 (n = 6) Группа 2 (n = 6) p-value
Возраст, сут 191,67 ± 113,29 149,67 ± 90,55 0,532
Масса, кг 7,12 ± 3,04 5,96 ± 1,14 0,439
Рост, см 64,50 ± 11,59 63,83 ± 3,89 0,905
Мужской пол, n (%) 4 (66,7) 4 (66,7) 0,564
ВПС с гиперволемией МКК, n (%) 4 (66,7) 4 (66,7) 0,564
Дыхательная недостаточность, n (%) 4 (66,7) 5 (83,3) 0,242
Продолжительность ИК, мин 57,50 (42,50; 66,50) 39,00 (38,00; 84,25) 0,630
Продолжительность пережатия аорты, мин 27,50 (21,75; 32,50) 27,50 (24,50; 50,75) 0,818
Таблица 4. Базовые характеристики пациентов тестовой выборки Группа 1 — группа интенсивной терапии под контролем УЗИ легких, группа 2 — группа интенсивной терапии без контроля УЗИ легких.
Table 4. Basic characteristics of patients in the test sample Group 1 — intensive care group under ultrasound lung monitoring, group 2 — intensive care group without ultrasound lung monitoring.
Калибровочная
    кривая модели ММО (алгоритм машинного обучения). Brier Score = 0,095

Рис. 3. Калибровочная кривая модели ММО (алгоритм машинного обучения). Brier Score = 0,095 Fig. 3. Calibration curve of the MMO model (machine learning algorithm). Brier Score = 0.095

Фактор Коэффициент p-значение 95% ДИ (нижняя) 95% ДИ (верхняя)
Группа исследования 3,296 0,000 1,860 4,732
Рост пациента –0,078 0,031 –0,150 –0,007
Возраст пациента –0,008 0,017 –0,014 –0,001
Боковая верхняя часть левого легкого, интерстициальный синдром (до операции) 0,809 0,026 0,096 1,522
Боковая верхняя часть левого легкого, локальный В+-синдром (после операции) –1,266 0,029 –2,399 –0,132
Задневерхняя часть левого легкого, консолидации (после операции) 0,616 0,021 0,091 1,141
Задневерхняя часть левого легкого, воздушные бронхограммы (после операции) 0,635 0,025 0,080 1,191
Передневерхняя часть правого легкого, интерстициальный синдром (до операции) 0,719 0,039 0,035 1,403
Боковая верхняя часть правого легкого, интерстициальный синдром (до операции) 0,650 0,033 0,053 1,248
Боковая верхняя часть правого легкого, интерстициальный синдром (после операции) 1,072 0,008 0,274 1,870
Боковая верхняя часть правого легкого, консолидации (после операции) 0,859 0,048 0,009 1,710
Боковая верхняя часть правого легкого, воздушные бронхограммы (после операции) 0,876 0,034 0,065 1,686
Задневерхняя часть правого легкого, интерстициальный синдром (после операции) 1,295 0,003 0,428 2,162
Задневерхняя часть правого легкого, консолидации (до операции) 0,632 0,015 0,122 1,142
Задневерхняя часть правого легкого, консолидации (после операции) 0,965 0,002 0,357 1,574
Задневерхняя часть правого легкого, воздушные бронхограммы (до операции) 0,579 0,035 0,041 1,118
Задневерхняя часть правого легкого, воздушные бронхограммы (после операции) 0,824 0,005 0,244 1,403
Боковая нижняя часть правого легкого: консолидации (после операции) 0,694 0,016 0,132 1,257
Боковая нижняя часть правого легкого: локальный В+-синдром (до операции) –2,015 0,018 –3,679 –0,351
Боковая нижняя часть правого легкого: воздушные бронхограммы (после операции) 0,796 0,012 0,175 1,416
Задняя нижняя часть правого легкого: интерстициальный синдром (после операции) 0,695 0,040 0,030 1,360
Задняя нижняя часть правого легкого: консолидации (после операции) 0,845 0,002 0,320 1,369
Задняя нижняя часть правого легкого: воздушные бронхограммы (после операции) 1,099 0,000 0,487 1,710
Правое легкое: интерстициальный синдром (до операции) 0,859 0,016 0,163 1,556
Правое легкое: интерстициальный синдром (после операции) 0,765 0,041 0,030 1,499
Таблица 5. Однофакторный регрессионный анализ модели логистической регрессии. Статистически значимые факторы Примечание: статистически значимые факторы определялись при выполнении теста Вальда, если p-value было меньше 0,05.
Table 5. Univariate regression analysis of the logistic regression model. Statistically significant factors Note: statistically significant factors were determined using the Wald test if the p-value was less than 0.05.
Фактор Коэффициент
Группа исследования 343,107
Боковая верхняя часть левого легкого, интерстициальный синдром (до операции) 6,299
Боковая верхняя часть левого легкого, локальный В+-синдром (после операции) –152,578
Задневерхняя часть левого легкого, консолидации (после операции) –20,846
Задневерхняя часть левого легкого, воздушные бронхограммы (после операции) 49,037
Передневерхняя часть правого легкого, интерстициальный синдром (до операции) 4,282
Передневерхняя часть правого легкого, интерстициальный синдром (после операции) 43,788
Боковая верхняя часть правого легкого, интерстициальный синдром (до операции) 0,916
Боковая верхняя часть правого легкого, интерстициальный синдром (после операции) 45,533
Боковая верхняя часть правого легкого, консолидации (после операции) –65,396
Боковая верхняя часть правого легкого, воздушные бронхограммы (после операции) –43,199
Задневерхняя часть правого легкого, интерстициальный синдром (после операции) 140,824
Задневерхняя часть правого легкого, консолидации (до операции) 2,109
Задневерхняя часть правого легкого, консолидации (после операции) 19,638
Задневерхняя часть правого легкого, воздушные бронхограммы (до операции) 14,466
Задневерхняя часть правого легкого, воздушные бронхограммы (после операции) 5,895
Боковая нижняя часть правого легкого: консолидации (после операции) 16,116
Боковая нижняя часть правого легкого: локальный В+-синдром (до операции) –101,078
Боковая нижняя часть правого легкого: воздушные бронхограммы (после операции) 77,530
Задняя нижняя часть правого легкого: интерстициальный синдром (после операции) 11,068
Задняя нижняя часть правого легкого: консолидации (после операции) –35,508
Задняя нижняя часть правого легкого: воздушные бронхограммы (после операции) 37,314
Правое легкое: интерстициальный синдром (до операции), сумма баллов 27,475
Правое легкое: интерстициальный синдром (после операции), сумма баллов –31,833
Рост пациента –14,501
Возраст пациента 0,921
Таблица 6. Многофакторный регрессионный анализ модели логистической регрессии
Table 6. Multivariate regression analysis of the logistic regression model
Результаты
    ROC-анализа предиктивных моделей до выполнения кросс-валидации. ROC-кривая
    предиктивной модели на основе логистической регрессии (верхний график) имеет AUC = 0,70.
    ROC-кривая предиктивной модели на основе машинного обучения (нижний график)
    демонстрирует AUC = 0,929

Рис. 4. Результаты ROC-анализа предиктивных моделей до выполнения кросс-валидации. ROC-кривая предиктивной модели на основе логистической регрессии (верхний график) имеет AUC = 0,70. ROC-кривая предиктивной модели на основе машинного обучения (нижний график) демонстрирует AUC = 0,929 Fig. 4. Results of the ROC analysis of predictive models before performing cross-validation. The ROC curve of the predictive model based on logistic regression (upper graph) has an AUC of 0.70. The ROC curve of the predictive model based on machine learning (lower graph) demonstrates an AUC of 0.929

Confusion
    Matrix после выполнения кросс-валидации Монте—Карло с 1000 итераций для предиктивной
    модели на основе логистической регрессии (верхняя матрица) и модели на основе машинного
    обучения (нижняя матрица)

Рис. 5. Confusion Matrix после выполнения кросс-валидации Монте—Карло с 1000 итераций для предиктивной модели на основе логистической регрессии (верхняя матрица) и модели на основе машинного обучения (нижняя матрица) Fig. 5. Confusion Matrix after performing Monte Carlo cross-validation with 1000 iterations for the predictive model based on logistic regression (upper matrix) and the model based on machine learning (lower matrix)

Предиктивные модели Accuracy Recall Specificity Precision F1-мера AUC
ММО 0,922 1,000 0,867 0,840 0,913 0,929
МЛР 0,742 0,387 1,000 1,000 0,558 0,700
Таблица 7. Сравнение предиктивных моделей ММО — предиктивная модель на основе машинного обучения; МЛР — предиктивная модель на основе логистической регрессии.
Table 7. Comparison of predictive models MMO — predictive model based on machine learning; MLR — predictive model based on logistic regression.

Обсуждение

Разделение пациентов случайным образом в обучающую, калибровочную и тестовую выборки позволило моделям обучаться на одной части и проверять свою эффективность на другой, неизвестной ей части пациентов. Это помогло избежать переобучения. При этом важно отметить, что между выборками не было статистически значимой разницы, что указывает на то, что модели обучены и протестированы на данных, которые имеют схожие характеристики. Это может потенциально свидетельствовать о том, что модели будут сопоставимо работать на новых данных, так как они не переобучены на специфических особенностях одной из выборок. Калибровочная выборка использовалась для настройки гиперпараметров ММО. Это позволило исследовать, как изменения в параметрах влияют на производительность модели, и выбрать наиболее подходящие настройки, что в свою очередь улучшило точность прогнозов. Нами были подобраны и установлены следующие значения гиперпараметров для ММО, созданной на основе алгоритма Random Forest: n_estimators, равное100 — это количество деревьев в лесу, что позволяет улучшить стабильность и точность модели; max_depth, равное 30 — максимальная глубина каждого дерева, что помогает контролировать переобучение, позволяя деревьям быть достаточно глубокими для захвата сложных паттернов, но не настолько глубокими, чтобы они начали подстраиваться под шум в данных, min_samples_split; равное 5 — минимальное количество образцов, необходимое для разделения узла, это значение помогает предотвратить создание узлов, которые могут быть слишком специфичными для обучающего набора данных; min_samples_leaf, равное2 — минимальное количество образцов, которые должны находиться в листовом узле, это значение также способствует уменьшению переобучения, обеспечивает то, что каждый лист содержит достаточное количество данных; bootstrap в значении True — использование бутстрэппинга для создания подвыборок данных для обучения каждого дерева. Это помогает улучшить обобщающую способность модели, так как каждое дерево обучается на случайной подвыборке данных. Эти настройки гиперпараметров были выбраны с целью оптимизации производительности модели и достижения лучшего баланса между точностью и обобщающей способностью. Как итог, Brier Score = 0,095 является показателем хорошей калибровки прогностической модели.

Сравнение показателей двух моделей демонстрирует значительные различия в их эффективности. Модель ММО, основанная на Random Forest, продемонстрировала высокую точность (accuracy) на уровне 92,2 %, что указывает на ее способность правильно классифицировать большую часть наблюдений. В то же время МЛР показала значительно более низкую точность в 74,2 %. Значение AUC = 0,929 для ММО указывает на отличную способность модели различать положительные и отрицательные классы, в то время как AUC = 0,70 для МЛР указывает на среднюю способность модели. При глубоком анализе эффективности параметр recall (полнота, чувствительность) модели ММО составил 100 %, что свидетельствует о ее способности эффективно выявлять положительные случаи. В отличие от этого, МЛР продемонстрировала значительно более низкий уровень чувствительности, равный 38,7 %, что указывает на высокую вероятность пропуска положительных случаев ОДН. Что касается специфичности, модель ММО показала значение 86,7 %, в то время как МЛР достигла 100 %, что указывает на ее способность правильно классифицировать отрицательные случаи. Однако, несмотря на высокую специфичность, МЛР имеет низкие F1-меры (0,558), что указывает на несоответствие между количеством истинных положительных и ложноположительных предсказаний, в то время как показатель F1-меры ММО, равный 0,913, является очень высоким значением. При этом ситуация, когда precision = 1,0, а recall = 0,387, может возникнуть, когда модель делает очень точные предсказания, но пропускает значительное количество истинных положительных случаев. Это может произойти, если модель предсказывает положительный класс только в тех случаях, когда она абсолютно уверена в правильности своего предсказания, что приводит к отсутствию ложноположительных результатов (FP = 0). Это и объясняет высокое значение параметра precision у МЛР и говорит о том, что все положительные предсказания модели являются верными, однако это происходит из-за того, что модель в целом делает малое количество положительных предсказаний и, соответственно, не находит многие из фактических положительных случаев (то есть у нее много ложноотрицательных результатов — FN), а это приводит к низкому значению recall. В данном случае recall = 0,387 указывает на то, что модель смогла идентифицировать лишь 38,7 % всех истинных положительных случаев. Построенные Confusion Matrix позволяют более детально проанализировать качества предсказаний предиктивных моделей (рис. 5).

Сравнение моделей ММО и МЛР показывает, что ММО превосходит МЛР по всем ключевым метрикам, включая AUC, точность, полноту и F1-меру. ММО демонстрирует высокую эффективность в классификации, в то время как логистическая регрессия, несмотря на высокую специфичность и точность предсказаний, показывает недостаточную полноту и общую эффективность. Таким образом, модель ММО демонстрирует более сбалансированные и высокие показатели по сравнению с МЛР, что делает ее более предпочтительной для задач классификации в данном контексте.

Мы проанализировали возможные причины различий в эффективности двух созданных нами моделей. Различия в сложности: Random Forest является ансамблевым методом, который использует множество деревьев решений (Decision Trees) для улучшения предсказаний. Это позволяет модели лучше захватывать сложные зависимости в данных, в то время как логистическая регрессия может быть слишком простой для данной задачи. Малый объем выборки: объем выборки для обучения (42 человека) и тестирования (12 человек) достаточно мал. В таких условиях Random Forest может лучше обобщать данные благодаря своей структуре, в то время как логистическая регрессия может страдать от переобучения или недостаточной способности к обобщению. Непараметрическая природа Random Forest: этот метод не предполагает линейные зависимости между переменными, что делает его более гибким в работе с различными типами данных.

В нескольких работах были предложены прогностические модели для диагностики легочных послеоперационных осложнений в детской кардиохирургии с применением УЗИ легких. В исследовании Cantinotti M. et al. были созданы две предиктивные модели, прогнозирующие успешность экстубации трахеи и продолжительность нахождения пациента в реанимации [19]. В исследование были включены дети всех возрастных групп (от новорожденных до 18 лет) с радикальным и паллиативным характером коррекции ВПС, а УЗИ легких выполнялось исключительно в послеоперационный период. Кроме того, оценка состояния легких в исследовании проводилась по 36-балльной шкале с учетом только интерстициального синдрома и синдрома альвеолярной консолидации с суммацией полученных баллов, оценка остальных ультразвуковых синдромов не выполнялась. Определение наличия ОДН в послеоперационный период не являлось первичной контрольной точкой и не проводилось. Кроме того, не были оценены показатели эффективности разработанных авторами предиктивных моделей. Были также предложены предиктивные модели развития послеоперационных легочных осложнений с учетом выполнения УЗИ легких на дооперационном и послеоперационном этапах [17] и неудачи экстубации трахеи на основе измерения фракции утолщения диафрагмы [20]. При этом также не была проведена оценка их эффективности на тестовой выборке пациентов, что ставит под сомнение обобщающие возможности созданных моделей.

Было опубликовано несколько предиктивных моделей прогнозирования легочных осложнений в детской кардиохирургии с включением большого числа пациентов, созданных на основе алгоритма машинного обучения, с выполненной оценкой их эффективности на тестовой выборке пациентов, однако УЗИ легких в этих исследованиях не выполнялось [33, 34]. Так, были предложены предиктивная модель прогнозирования легочных осложнений в детской кардиохирургии с применением алгоритма машинного обучения на основе учета демографических данных, особенностей операции и данных об интраоперационном артериальном давлении 1964 пациентов с AUC = 0,785 [33] и предиктивная модель для прогнозирования развития пневмонии в детской кардиохирургии с включением 23 000 пациентов с AUC = 0,929 [34]. Однако УЗИ легких в данных исследованиях не проводилось и не учитывалось.

Есть данные, что включение уровней BNP [35] и цистатина С [36] в прогностическую модель может дополнительно увеличить ее эффективность, однако это требует дополнительных финансовых затрат и наличия специализированной лаборатории.

Исходя из этого научная и практическая новизна нашего исследования заключается в том, что нами были созданы две уникальные прогностические модели развития ОДН в послеоперационный период у детей грудного возраста после радикальных кардиохирургических операций на основе УЗИ легких и клинических данных, в которых учитывались все основные ультразвуковые синдромы, также были изучены показатели эффективности созданных прогностических моделей на тестовой выборке пациентов: accuracy (точность), recall (полнота, чувствительность), specificity (специфичность), precision (точность предсказания), F1-меры, AUC.

Прогностическая модель, созданная на основе алгоритма машинного обучения (ММО), показала более высокую эффективность и была названа LUCH-D — Lung Ultrasound in Congenital Heart Disease.

Данное исследование имеет несколько ограничений:

  • одноцентровой характер исследования, а также проведение УЗИ легких одним исследователем на всех этапах;
  • оценка наличия ОДН, которая проводилась в момент перевода пациента из отделения реанимации в профильное отделение, что в свою очередь могло быть осуществлено у разных пациентов на разные реанимационные сутки и могло отрицательно повлиять на эффективность моделей;
  • небольшая выборка, которая могла повлиять на эффективность и обобщающую способность предиктивных моделей, а также на репрезентативность результатов. Необходимы дальнейшие исследования с включением большего числа пациентов.

Результаты нашего исследования демонстрируют высокую важность включения данных УЗИ легких в предиктивную модель для прогнозирования риска возникновения ОДН у пациентов в послеоперационный период. Прогностические модели были обучены и протестированы на относительно малом количестве пациентов, дальнейшие исследования могут быть направлены на улучшение моделей и их адаптацию к более широким выборкам, что позволит повысить точность и надежность прогнозов. Также наши результаты подтверждают целесообразность применения методов машинного обучения в медицинской практике для прогнозирования различных исходов.

Заключение

Проведенное исследование позволило создать прогностическую модель LUCH-D (Lung Ultrasound in Congenital Heart Disease), разработанную на основе алгоритма машинного обучения для предсказания развития ОДН в послеоперационный период у детей грудного возраста после радикальных кардиохирургических операций с высокой эффективностью, а также предиктивную модель на основе логистической регрессии. Необходимо отметить, что модели были созданы и протестированы на малой выборке пациентов, что могло повлиять на результаты и требует проведения дальнейших исследований. Учет показателей УЗИ легких может улучшать эффективность предиктивных моделей. Оценка выраженности ультразвуковых признаков, согласно представленному нами протоколу, может быть полезна для планирования и проведения исследований, посвященных созданию предиктивных моделей, которые прогнозируют развитие респираторных осложнений в послеоперационный период. Однако данное исследование является пилотным и требует валидации на более крупных и разнообразных выборках. Будущие исследования должны включать пациентов из разных медицинских центров и рассматривать возможность модификации предложенной модели для ее упрощения и дальнейшего повышения точности прогнозов.

Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов.

Disclosure. The authors declare no competing interests.

Вклад авторов. Все авторы в равной степени участвовали в разработке концепции статьи, получении и анализе фактических данных, написании и редактировании текста статьи, проверке и утверждении текста статьи.

Author contribution. All authors according to the ICMJE criteria participated in the development of the concept of the article, obtaining and analyzing factual data, writing and editing the text of the article, checking and approving the text of the article.

Этическое утверждение.Протоколы исследований и проекты информированных согласий были одобрены локальным этическим комитетом ФГБОУ ВО «Красноярский государственный медицинский университет им. проф. В.Ф. Войно-Ясенецкого» Минздрава России (протокол № 122/2023 от 29.11.2023 г.).

Ethics approval. The research protocols and informed consent projects were approved by the local ethics committee of the Voino-Yasenetsky Krasnoyarsk State Medical University (reference number: 122/2023-23.11.2023).

Информация о финансировании. Авторы заявляют об отсутствии внешнего финансирования при проведении исследования.

Funding source. This study was not supported by any external sources of funding.

Декларация о наличии данных.Данные, подтверждающие выводы этого исследования, можно получить у корреспондирующего автора по обоснованному запросу. Данные не являются общедоступными, так как они содержат информацию, которая может поставить под угрозу конфиденциальность участников исследования.

Data Availability Statement. The data supporting the conclusions of this study can be obtained from the corresponding author upon reasonable request. The data are not publicly available as they contain information that may jeopardize the confidentiality of the research participants.

Библиографические ссылки

  1. [1] Badenes R., Lozano A., Belda F.J. Postoperative pulmonary dysfunction and mechanical ventilation in cardiac surgery. Crit Care Res Pract. 2015; 2015: 420513. DOI: 10.1155/2015/420513
  2. [2] Гонсалес-Гонсалес М.Б., Юкс К., Кловер Д. и др. Интенсивная терапия в детской кардиохирургии : практическое руководство. М.: ГЭОТАР-Медиа, 2023. 704 с. [Gonzales- Gonzales M.B., Juks K., Klauwer D., et al. ed. Intensive Care in Pediatric Cardiac Surgery: A Practical Guide. М.: GEOTAR-Media, 2023. 704 p. (In Russ)]
  3. [3] Хэнсли Ф.А. мл., Мартин Д.Е., Грэвли Г.П. Практическая кардиоанестезиология. 5-е изд. М.: Медицинское информационное агентство, 2017. 848 с. [Hensley F.A., Martin D.E., Gravlee G.P. Hensley’s Practical Approach to Cardiothoracic Anesthesia. 5th edition M.: Medical Information Agency, 2017. 848 p. (In Russ)]
  4. [4] Mills G.H. Respiratory complications of anaesthesia. Anaesthesia. 2018; 73 (1): 25–33. DOI: 10.1111/anae.14137
  5. [5] Laffey J.G., Boylan J.F., Cheng D.C. The systemic inflammatory response to cardiac surgery: implications for the anesthesiologist. Anesthesiology. 2002; 97(1): 215–52. DOI: 10.1097/00000542-200207000-00030
  6. [6] Aguirre V.J., Sinha P., Zimmet A., et al. Phrenic nerve injury during cardiac surgery: mechanisms, management and prevention. Heart Lung Circ. 2013; 22(11): 895–902. DOI: 10.1016/j.hlc.2013.06.010
  7. [7] Laghlam D., Pierre Le M., Srour A., et al. Diaphragm dysfunction after cardiac surgery: reappraisal. J Cardiothorac Vasc Anesth. 2021; 35(11): 3241–7. DOI: 10.1053/j.jvca.2021.02.023
  8. [8] Rady MY., Ryan T., Starr N.J. Early onset of acute pulmonary dysfunction after cardiovascular surgery: Risk factors and clinical outcome. Crit Care Med 1997; 25: 1831–9
  9. [9] Volpicelli G., Elbarbary M., Blaivas M. et al. International Liaison Committee on Lung Ultrasound (ILC-LUS) for International Consensus Conference on Lung Ultrasound (ICC-LUS). International evidence-based recommendations for point-of-care lung ultrasound. Intensive Care Med. 2012; 38(4): 577–91. DOI: 10.1007/s00134-012-2513-4. PMID: 22392031
  10. [10] Jambrik Z., Monti S., Coppola V., et al. Usefulness of ultrasound lung comets as a nonradiologic sign of extravascular lung water. Am J Cardiol. 2004; 93(10): 1265–70. DOI: 10.1016/j.amjcard.2004.02.012
  11. [11] Kaskinen A.K., Martelius L., Kirjavainen T., et al. Assessment of extravascular lung water by ultrasound after congenital cardiac surgery. Pediatr Pulmonol. 2017; 52(3): 345–52. DOI: 10.1002/ppul.23531
  12. [12] Vitale V., Ricci Z., Cogo P. Lung ultrasonography and pediatric cardiac surgery: first experience with a new tool for postoperative lung complications. Ann Thorac Surg. 2014; 97(4): 121–4. DOI: 10.1016/j.athoracsur.2014.01.060
  13. [13] Cattarossi L. Lung ultrasound: its role in neonatology and pediatrics. Early Hum Dev. 2013; 89(l): 17–9. DOI: 10.1016/S0378-3782(13)70006-9
  14. [14] Volpicelli G. Sonographic diagnosis of pneumothorax. Intensive Care Med. 2011; 37(2): 224–32. DOI: 10.1007/s00134-010-2079-y
  15. [15] Polito A., Biasucci DG., Cogo P. Point-of-care pleural and lung ultrasound in a newborn suffering from cardiac arrest due to tension pneumothorax after cardiac surgery. Cardiol Young. 2016; 26(2): 400–2. DOI: 10.1017/S1047951115001213
  16. [16] Грицан А.И., Пфейфер А.А., Гурченко С.А и др. Ультразвуковое исследование легких в отделении анестезиологии-реанимации детского кардиохирургического профиля: обзор литературы. Вестник интенсивной терапии им. А.И. Салтанова. 2024; 3: 161–176. [Gritsan A.I., Pfeifer A.A., Gurchenko S.A. et al. Lung ultrasound at the department of anesthesiology and intensive care for pediatric cardiac surgery: a narrative review. Annals of Critical Care. 2024; 3: 161–176. (In Russ)]. DOI: 10.21320/1818-474X-2024-3-161-176
  17. [17] Ghotra G.S., Kumar B., Niyogi S.G., et al. Role of Lung Ultrasound in the Detection of Postoperative Pulmonary Complications in Pediatric Patients: A Prospective Observational Study. J Cardiothorac Vasc Anesth. 2021; 35(5): 1360–8. DOI: 10.1053/j.jvca.2020.09.106
  18. [18] Girona-Alarcón M., Cuaresma-González A., Rodríguez-Fanjul J., et al. LUCAS (lung ultrasonography in cardiac surgery) score to monitor pulmonary edema after congenital cardiac surgery in children. J Matern Fetal Neonatal Med. 2022; 35(6): 1213–8. DOI: 10.1080/14767058.2020.1743660
  19. [19] Cantinotti M., Giordano R., Scalese M., et al. Prognostic Value of a New Lung Ultrasound Score to Predict Intensive Care Unit Stay in Pediatric Cardiac Surgery. Ann Thorac Surg. 2020; 109(1): 178–184. DOI: 10.1016/j.athoracsur.2019.06.057
  20. [20] Singh A., Mandal B., Negi S., Puri G.D., et al. Ultrasonic prediction of weaning failure in children undergoing cardiac surgery: A prospective observational study. Ann Card Anaesth. 2023; 26(3): 281–7. DOI: 10.4103/aca.aca_113_22
  21. [21] Soummer A., Perbet S., Brisson H., et al. Lung Ultrasound Study Group. Ultrasound assessment of lung aeration loss during a successful weaning trial predicts postextubation distress. Crit Care Med. 2012; 40(7): 2064–72. DOI: 10.1097/CCM.0b013e31824e68ae
  22. [22] Rodríguez-Fanjul J., Llop A.S., Balaguer M., et al. Usefulness of lung ultrasound in neonatal congenital heart disease (LUSNEHDI): lung ultrasound to assess pulmonary overflow in neonatal congenital heart disease. Pediatric cardiology. 2016; 37(8): 1482–7. DOI: 10.1007/s00246-016-1461-0
  23. [23] Cardinale L., Priola A.M., Moretti F., et al. Effectiveness of chest radiography, lung ultrasound and thoracic computed tomography in the diagnosis of congestive heart failure. World J Radiol. 2014; 6(6): 230–7. DOI: 10.4329/wjr.v6.i6.230
  24. [24] Pivetta E., Goffi A., Lupia E., et al. SIMEU Group for Lung Ultrasound in the Emergency Department in Piedmont. Lung Ultrasound-Implemented Diagnosis of Acute Decompensated Heart Failure in the ED: A SIMEU Multicenter Study. Chest. 2015; 148(1): 202–10. DOI: 10.1378/chest.14-2608
  25. [25] Лахин Р.Е., Щеголев А.В., Жирнова А.В., и др. Характеристика ультразвуковых признаков в диагностике объема и характера поражения легких. Вестник интенсивной терапии. 2016; (4): 5–11. [Lakhin R.E., Shchegolev A.V., Zhirnova A.V., et al. Features of ultrasonic signs in the diagnosis of the volume and nature of lung disease. Annals of Critical Care. 2016; (4): 5–11. (In Russ)]
  26. [26] Ольхова Е.Б., Хаспеков Д.В., Сар А.С. и др. Эхографическая оценка плеврального выпота у детей. Радиология – практика. 2020; (6): 16–30. [Olkhova E.B., Khaspekov D.V., Sar A.S., et al. Echographic Assessment of Pleural Effusion in Children. Radiology — Practice. 2020; (6):16–30. (In Russ)]
  27. [27] Hamadah H.K., Kabbani M.S., Elbarbary M., et al. Ultrasound for diaphragmatic dysfunction in postoperative cardiac children. Cardiol Young. 2017; 27(3): 452–58. DOI: 10.1017/S1047951116000718
  28. [28] Mohammed A.K., Madkour M.A., Hassanien H.M. Furosemide: Would it help to improve the lungs as evaluated by sonography and compliance during aortic coarctation surgery. Annals of Cardiac Anaesthesia. 2019; 22(3): 254–9. DOI: 10.4103/aca.ACA_55_18
  29. [29] Глумчер Ф.С. Возможности применения альбумина в терапии критических состояний: современное состояние проблемы. Медицина неотложных состояний. 2014; 2(57): 65–73. [Glumcher F.S. Possibilities of Using Albumin in the Therapy of Critical Conditions: Current State of the Problem. Emergency Medicine. 2014; 2(57): 65–73. (In Russ)].
  30. [30] Sun L., Wu L., Zhang K., et. al. Lung ultrasound evaluation of incremental PEEP recruitment maneuver in children undergoing cardiac surgery. Pediatr Pulmonol. 2020; 55(5): 1273–81. DOI: 10.1002/ppul.24720
  31. [31] Мороз В.В., Голубев А.М., Кузовлев А.Н. Отек легких: классификация, механизмы развития, диагностика. Общая реаниматология. 2009; 5(1): 83–8. [Moroz V.V., Golubev A.M., Kuzovlev A.N. Pulmonary edema: classification, mechanisms of development, diagnosis. General Reanimatology. 2009; 5(1): 83–8. (In Russ)].
  32. [32] Marini J.J. Acute Lobar Atelectasis. Chest. 2019; 155(5): 1049–58. DOI: 10.1016/j.chest.2018.11.014
  33. [33] Zeng X., Hu Y., Shu L., et al. Explainable machine-learning predictions for complications after pediatric congenital heart surgery. Sci Rep. 2021; 11(1): 17244. DOI: 10.1038/s41598-021-96721-w
  34. [34] Tong C., Du X., Chen Y., et al. Machine learning prediction model of major adverse outcomes after pediatric congenital heart surgery: a retrospective cohort study. Int J Surg. 2024; 110(4): 2207–16. DOI: 10.1097/JS9.0000000000001112
  35. [35] Cantinotti M., Giordano R., Scalese M., et al. Prognostic role of BNP in children undergoing surgery for congenital heart disease: analysis of prediction models incorporating standard risk factors. Clin Chem Lab Med. 2015; 53(11): 1839–46. DOI: 10.1515/cclm-2014-1084
  36. [36] Cantinotti M., Giordano R., Scalese M., et al. Diagnostic accuracy and prognostic valued of plasmatic Cystatin-C in children undergoing pediatric cardiac surgery. Clin Chim Acta. 2017; 471: 113–8. DOI: 10.1016/j.cca.2017.05.031
Лицензия Creative Commons

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-ShareAlike» («Атрибуция — Некоммерческое использование — На тех же условиях») 4.0 Всемирная.

Copyright (c) 2025 Вестник интенсивной терапии имени А.И. Салтанова