В последние годы наблюдается нарастающее число экспертиз документов различного формата, в том числе и рекомендаций. Для этого используют ряд оценочных инструментов — как документа в целом, так и его отдельных положений, — в основе которых лежит достижение консенсуса (согласия) между экспертами.

Для экспертизы гайдлайна как целостного документа обычно используют модифицированный метод AGREE II (Appraisal of Guidelines for REsearch & Evaluation), позволяющий оценить соответствие конкретного рассматриваемого документа утвержденным формальным критериям и принципам экспертизы [1–3], которая включает 23 пункта, расположенных в 6 доменах [3]. В доменах оценивается актуальность (пункты 1–3), участие всех необходимых специалистов (пункты 4–6), соответствие формату и структуре гайдлайна, наличие ключевых рекомендаций (пункты 15–17), возможность внедрения по выделенным критериям качества (пункты 18–21), конфликта интересов разработчиков (пункты 22–23). Третий домен является самым важным и трудоемким, так как включает проверку полноты поиска доказательных данных, уровней убедительности рекомендаций и достоверности доказательств, качества рецензирования и механизма пересмотра гайдлайна (пункты 7–14).

После оценки каждого домена по 7-балльной шкале подводится общий рейтинг руководства в виде рекомендации о возможности или невозможности его применения в практической медицине. Оценка ближе к 1 баллу отражает степень несогласия, а ближе к 7 баллам — согласия. Преодоление порога в 5 баллов особенно важно для третьего домена.

Количество экспертиз в области анестезиологии и интенсивной терапии в базе PubMed, проведенных с помощью AGREE II, всего 12, а в общемедицинской практике — 723. Проанализируем итог экспертизы некоторых из них.

Оценка рекомендаций по аналгоседации у критических пациентов в ОРИТ [4] подразумевала анализ 5 гайдлайнов, и 4 эксперта оценили их качество как очень высокое — более 80 %. Экспертиза руководств по лечению хронической боли [5] включала 4 руководства, из них только у двух консенсусный порог в 60 % был преодолен, а другие два оказались низкого качества. 16 гайдлайнов были сгруппированы и проанализированы под общей тематикой оценки руководств по патологии минерального обмена и костей при ХБП [6], при этом 4 гайдлайна были согласованы, но на уровне минимально допустимого порога (более 60 %), остальные 12 — не преодолели эту планку. Рекомендации по применению игл для люмбальной пункции [9] получили наивысшую экспертную оценку — 93 %.

Важный и широкий пласт вопросов поднимается при экспертизе отдельных положений (или тезис-рекомендаций) руководств. Существует четыре наиболее распространенных метода формализованной оценки положений [10–15]:

Суть метода Дельфи заключается в том, что координатор изначально формулирует обсуждаемую проблему либо для обсуждения берется готовый документ — например, гайдлайн или нормативно-правовой документ. В результате определения круга рассматриваемых проблем формулируют или выделяют положения, которые будут обсуждать эксперты. После проведения подготовительного этапа делается анонс экспертизы и приглашаются эксперты, которые знакомятся с анонсом и выражают согласие на участие. В случае согласия начинается работа с анкетами, то есть сама экспертиза. Дельфийский анализ подразумевает анонимное участие экспертов — эксперты не знают друг друга. Во время первого раунда каждый эксперт оценивает предложенные положения, при этом не только указывает степень своего согласия или несогласия с положением по балльной шкале, но и оставляет комментарий, почему он не согласен. Также эксперт может сформулировать свой, уточненный вариант положения.

После окончания первого раунда координатор суммирует сведения из анкет. Как правило, часть положений достигает порогового значения согласованности и считается принятой. Но ряд положений обычно нуждается в дальнейшей экспертизе, изменении формулировок, их переоценке, в том числе с учетом комментариев экспертов — это может потребовать проведения второго, третьего и даже большего количества раундов. При этом все больше положений, как видоизмененных, так и вновь сформулированных в соответствии с замечаниями экспертов, достигает консенсуса. В итоге дельфийской экспертизы часть положений принимается в исходном виде, часть — в модифицированном, а ряд положений может быть отвергнут как не достигший консенсуса. Количество итоговых положений может соответствовать исходному, но чаще бывает больше или меньше исходного количества. Таким образом, дельфийский анализ демонстрирует активное аргументированное влияние экспертов на принятие итогового консенсусного соглашения.

С помощью дельфийской экспертизы достигнут консенсус по выбору дефиниций и целевых точек для периоперационной медицины [16]. В итоге согласованы 167 клинических индикаторов для прогнозирования клинических исходов.

Метод номинальных групп (Nominal Group Technique — NGT), в отличие от метода Дельфи, это очная экспертиза. Она включает 4 этапа. Количество экспертов небольшое — обычно рекомендуется до 7 человек, в отличие от дельфийского анализа, где в среднем число экспертов составляет около 15. Эксперты обсуждают положения, слышат друг друга, меняют свою точку зрения — в итоге вырабатывается единое согласованное мнение. В ходе 4 этапов исследования эксперты сначала знакомятся с проблемой за короткий промежуток времени (около 20 мин; так называемая «тихая генерация»). Как правило, обсуждаются не гайдлайны, а более узкие и конкретные проблемы. После этого происходит обсуждение вопросов — раунд «круглого стола». Эксперты могут уточнить свою точку зрения, сформулировать итоговые положения. После этого происходит этап голосования, с ранжированием мнений экспертов по каждому положению.

С помощью метода NGT проведена оценка подходов к поддержанию верхних дыхательных путей на догоспитальном этапе. Были согласованы оценка факторов риска для догоспитальной интубации, чек-лист и стандартные операционные процедуры, применение преоксигенации и препаратов для облегчения интубации [17].

Интересен «смешанный» метод соответствия RAND (RAND appropriateness method — RAM), разработанный корпорацией RAND (Research ANd Development). Первой важной особенностью является то, что концепция «соответствия» подразумевает определение отношения «польза/риск» медицинских и хирургических процедур. Вторая особенность заключается в сочетании двух подходов: доказательного (на основе рандомизированных многоцентровых исследований и метаанализов) и коллективного мнения экспертов о применимости и эффективности процедур у большинства пациентов. Отсюда и название — смешанный метод соответствия.

Он включает в себя элементы двух ранее упомянутых методов — метода Дельфи и метода номинальных групп. От первого взят стартовый анонимный раунд, когда эксперты анонимно заполняют анкеты, в которых указаны рассматриваемые положения, и оценивают каждое положение в баллах, а второй раунд проходит очно, с обсуждением итогов первого раунда и составленных мнений по рассматриваемым проблемам. При необходимости достижения консенсуса по большему количеству положений можно провести дополнительный анонимный и очный раунд.

Этот метод был успешно применен при анализе рекомендаций по использованию ультразвука как у взрослых, так и у детей [16, 19]. Для взрослых из 24 рекомендаций были согласованы 12, касающихся применения ультразвука при плевральном выпоте и дренировании плевральной полости, пневмотораксе, катетеризации центральных вен и диагностике тромбоза глубоких вен. Для детей экспертиза согласовала 39 из 41 положения, касающегося применения ультразвука для оценки сердечно-сосудистой системы, легких, головного мозга, органов брюшной полости.

Собрание по выработке консенсуса Национального института здоровья США (National Institutes of Health Consensus Conference — NIH CC) подразумевает выбор для обсуждения потенциально решаемой проблемы. Вначале так называемые эксперты ядра, обычно от 10–12 человек, делают обзор литературы, формулируют положения и дают рекомендации по формированию списка «внешних» экспертов. На очной конференции собираются внешние эксперты, половина из которых обычно являются неспециалистами в рассматриваемой проблеме. Количество участников конференции, как правило, от нескольких сотен до тысячи человек, из которых каждый может высказаться по рассматриваемой проблеме. После проведения конференции эксперты ядра суммируют полученные результаты и формируют итоговый список положений.

С помощью метода NIH CC проведена оценка рекомендаций по трансфузии эритроцитов у детей в критическом состоянии [20]: было согласовано 102 положения, степень согласованности у всех была выше 80 %.

Порог консенсуса всегда устанавливается координатором до начала экспертной оценки. В основе определения порога консенсуса (обычно не менее 70 %), особенно применительно к методу Дельфи, смешанному методу соответствия RAND и технике AGREE II, лежит балльная оценка по одному из вариантов шкалы Лайкерта — от 3 до 10 баллов.

При поиске в базе данных PubMed по ключевым словам “anesthesia intensive care guidelines” обнаружено 2792 гайдлайна, из них только 88 подверглись экспертной оценке, что составляет 3,15 % от общего числа экспертиз в клинической медицине. Среди всех методов экспертиз, касающихся конкретных положений гайдлайнов, обращает на себя внимание наибольшая востребованность метода Дельфи, как максимально адекватного и ясного для объективной оценки любого формата документов. Смешанный метод соответствия RAND выгодно отличается разумным и иногда необходимым «очным этапом» взаимодействия экспертов. Предпочтительно сочетать один из этих методов с экспертизой документа как целого с помощью оценочного инструмента AGREE II (табл. 1).

 

Таблица 1. Количество гайдлайнов, подвергнутых экспертной оценке разными методами

Table 1. Number of guidelines peer reviewed using different methods

Ключевые слова Метод экспертной оценки
Delphi NGT RAND/RAM NIH CC AGREE II
“clinical practice guidelines 1159 228 441/106 486 723
“anesthesia intensive care guidelines 47 4 9/7 9 12

 

Таким образом, в настоящее время имеется ряд специализированных инструментов, позволяющих оценить адекватность и качество как рекомендаций в целом, так и их отдельных положений. Участники любой экспертизы должны понимать, что их консенсусное мнение может влиять как на восприятие ранее опубликованных документов, особенно в части положений, не достигших порога консенсуса (ретроспективный аспект экспертизы), так и на разработку, изменение и утверждение новых технологий (проспективный аспект).

Настоящая редакторская заметка является анонсом подробного обзора по методу Дельфи, который будет опубликован в журнале «Вестник интенсивной терапии имени А.И. Салтанова», в первом номере за 2021 г., и последующих публикаций итогов проведенных экспертиз российских клинических и методических рекомендаций в области анестезиологии-реаниматологии.