Методология анализа клинических исследований и определения их связей с клинической действительностью. Часть первая

Кардиология: новости, мнения, обучение. 2016. № 4. С. 69-75.

- Фламинго кусаются не хуже горчицы. А мораль отсюда такова:
это птицы одного полета!
- Только горчица совсем не птица, - заметила Алиса.
- Ты как всегда совершенно права! - сказала Герцогиня. - Какая
ясность мысли!
Льюис Кэррол. "Алиса в Стране чудес"


Роль клинических исследований в современной медицине сложно переоценить. Их результаты от­ражаются в рекомендациях научных сообществ, подавляющее большинство профессиональной инфор­мации, которую получает врач из лекций и статей, так или иначе относится к клиническим исследованиям, многочисленные графики и таблицы с их результатами постоянно демонстрируются представителями фарма­цевтических компаний. Неизбежная информационная перегрузка эры доказательной медицины. Обычно прак­тикующий врач слышит о результатах клинического ис­следования в чьем-то пересказе, к сожалению, не всег­да профессионально и/или добросовестно сделанном. Если же говорить о чтении научных статей, порой мы делаем это так, как в школе читали произведения клас­сической литературы: пропускаем скучные описания природы и длинные рассуждения героев, перелистывая нетерпеливой рукой книгу до последней страницы, что­бы узнать обрела ли счастье главная героиня и добился ли главный герой желанной цели. Однако клинические исследования (так же как и литературные произведе­ния) не стоит читать с конца (т.е. с раздела результаты и выводы). При таком подходе упускаются важные дета­ли, которые критически могли бы повлиять на результа­ты и/или достоверность выводов исследования.

Цель серии статей, которую редакция представля­ет вашему вниманию, заключается в предоставлении алгоритма анализа клинических исследований, который может использоваться практическими врачами для само­стоятельного изучения результатов заинтересовавшего их исследования. В основном речь пойдет о "золотом стандарте" доказательной медицины - рандомизирован­ных клинических исследованиях (РКИ), но в следующих статьях мы остановимся на таких распространенных мето­дах анализа, как исследования "случай-контроль" и ис­следования с историческим контролем.

НАЧАЛЬНЫЙ ЭТАП АНАЛИЗА

При анализе любых научных данных независимо от типа исследования мы, по сути, пытаемся ответить на 3 основных вопроса:

1. Является ли это исследование валидным?

2. Каковы его результаты?

3. Должны ли мы изменить нашу клиническую практи­ку на основании этих результатов?

Прежде всего рассмотрим понятие валидности.

Применительно к практике клинических исследо­ваний валидность определяется как соответствие про­цедуры проведения исследования поставленным в нем задачам и способности этих процедур обеспечить макси­мальную достоверность, полученных в исследовании ре­зультатов. Валидность - это основополагающее понятие любого эксперимента. Если исследование невалидно, нет смысла отвечать на остальные два вопроса.

Существуют внутренняя и внешняя валидность ис­следования. Наличие внутренней валидности повышает вероятность того, что именно экспериментальное воз­действие, а не какой-то другой - случайный - фактор или совокупность факторов вызвал изменения, которые были зарегистрированы исследователями. Если исследование не обладает внутренней валидностью, задавать вопрос о внешней валидности уже не имеет смысла.

Внешняя валидность отражает возможность пере­носа результатов исследования на более широкую попу­ляцию пациентов в клинической практике, причем речь идет не о целесообразности и/или необходимости изме­нения клинической практики. На этот вопрос мы отвеча­ем в процессе оценки результатов исследования и их кли­нической значимости, но только о том, в какой степени исследуемая популяция и применяемые методы близки к клинической практике [1].

Представление о том, насколько исследование валидно, мы в основном получаем из раздела "Материалы и методы", который, к сожалению, так часто пропускается или просма­тривается по диагонали нетерпеливым читателем (рис. 1).

Итак, в разделе "Материал и методы" критическим образом должна быть проанализирована следующая ин­формация о 9 основных процедурах, обеспечивающих за­щиту от ошибочных выводов исследования:

1. Выбор популяции исследования.

2. Процедура включения.

3. Выбор метода рандомизации.

4. Каким образом проводилось ослепление (маски­ровка).

5. Процедура наблюдения.

6. Выбор конечных точек.

7. Выбор группы контроля (плацебо или препарат сравнения).

8. Методы исследования.

9. Методы анализа.

Погрешности в каждом из этих важных пунктов пла­нирования и реализации исследования способны спро­воцировать ошибки, которые драматическим образом по­влияют на достоверность его результатов.

Выбор популяции исследования - один из ключе­вых вопросов при планировании исследования. Этот вы­бор всегда связан с процессом балансирования между эффективностью (в том числе экономической) исследо­вания и его внешней валидностью, т.е. степенью приме­нимости результатов исследования ко всей популяции па­циентов, которые потенциально могут применять данный препарата или воздействие.

Таким образом польза для исследования часто кон­фликтует с пользой для клинической практики. Как это происходит? Чем более однородна популяция пациентов в исследовании, тем меньше факторов, которые могут по­влиять на результаты лечения, и тем легче для исследова­теля продемонстрировать эффект метода лечения. Когда популяция исследования включает широкий спектр па-

циентов, это влечет за собой необходимость увеличения размера выборки, что увеличивает стоимость и усложня­ет организацию. Повышается риск заглушения реального эффекта лечения гетерогенностью исследуемой популя­ции. Представьте себе ситуацию: завершено исследо­вание по сердечной недостаточности (СН) с конечной точкой "выживаемость". В исследование включали па­циентов высокого риска, обозначим ее для себя группа А, и пациентов низкого риска - обозначим ее группа Б. Группа А состоит из 100 пациентов, группа Б - из 200 па­циентов. В группе А было 50 смертей, а в группе Б только 10. Соответственно, группа А предоставила в 5 раз боль­ше статистической информации, чем группа Б. Это значит, что результаты исследования в основном определялись группой высокого риска, несмотря на то что в группе низкого риска было в 2 раза больше пациентов и на них было потрачено в 2 раза больше ресурсов исследования. Включение пациентов из группы низкого риска в данном случае не является хорошим выбором с точки зрения эко­номической эффективности исследования. Хотя в случае положительных результатов такой выбор популяции ис­следования определит более широкие показания для на­значения препарата.

К выбору популяции исследования относится не толь­ко выбор характеристик пациентов, включаемых в иссле­дования (в соответствии с критериями включения и ис­ключения), но и выбор центров в случае многоцентровых исследований. Подавляющее большинство современных РКИ в кардиологии являются мультицентровыми, и про­цесс набора пациентов в них может идти практически по всему миру. Такой подход позволяет набирать большее ко­личество пациентов, исключить возможные ошибки иссле­дования, связанные с особенностями набора или ведения пациентов в единственном центре и, таким образом, гаран­тировать, что результаты исследования могут быть экстра­полированы на пациентов по всему миру, что, естествен­но, необходимо для крупных международных компаний. Однако участие большого количества центров в исследова­нии может привести к проблемам, связанным с различной квалификацией исследователей или региональными осо­бенностями организации системы здравоохранения, осо­бенностями используемых диагностических методик, как это случилось в печально известном исследовании TOPCAT (Treatment of Preserved Cardiac Fucnction Heart Failure With Aldosteron Antagonists), в котором изучался эффект при­менения альдостерона у пациентов с СН и сохраненной фракцией выброса (ФВ) [2]. Основной анализ TOPCAT не продемонстрировал достоверного снижения первичной комбинированной конечной точки (сердечно-сосудистая смертность, остановка сердца, госпитализации из-за обо­стрения сердечной недостаточности) при применении спироналактона в общей популяции исследования. Однако последующий анализ подгрупп, выделенных на основании географического распределения центров, принимавших участие в протоколе, показал, что спиронолактон досто­верно снижал первичную конечную точку у пациентов из США, Канады, Аргентины и Бразилии и не снижал у паци­ентов, набранных в России и Грузии (рис. 2).

Эти различия при последующем (вторичном) анали­зе исследования были объяснены существенной разни­цей в базовых характеристиках пациентов, что в свою очередь было связанно с особенностями клинической практики. Так, только у 11% пациентов, включенных в исследование в России и Грузии, диагноз СН с сохра­ненной систолической функцией подтверждался ис­следованием мозгового натрийуретического пептида (по сравнению с 45% пациентов в американских стра­нах) [3]. В соответствии с существующими рекоменда­циями [4, 5], диагноз СН с сохраненной систолической функции ставится на основании симптоматики СН, нор­мальной или слегка сниженной систолической функ­ции левого желудочка (ЛЖ) и эхокардиографических признаков нарушения диастолической функции ЛЖ. К сожалению, последний критерий отсутствовал в кри­териях включения исследования TOPCAT. Таким образом, в подавляющем большинстве случаев в России и Грузии пациенты включались только на основании симптомати­ки СН, ФВ >45% и наличия предшествующих госпитали­заций по причине СН, что повлекло включение большого количества пациентов с сомнительной СН или с самыми начальными стадиями СН. Базовые характеристики паци­ентов, включенных в странах Северной и Южной Амери­ки, статистически достоверно отличались от пациентов, включенных в России и Грузии практически по всем па­раметрам. В том числе и по таким важным с точки зрения прогноза пациентов, как средний возраст, количество госпитализаций в анамнезе, фибрилляция предсердий, сахарный диабет (СД), хроническая болезнь почек, уров­ни K+ и креатинина и т.п.). В том же номере журнала "Circulation" был опубликован анализ географической вариабельности частоты клинических исходов у паци­ентов, принимавших участие в исследованиях CHARM (Candesartan in Heart Failure Assessment of Reduction in Mortality and Morbidity) и I-PRESERVE (Irbesartan in Heart Failure With Preserved Systolic Function) [6-8]. Это два других важных мультицентровых исследований у паци­ентов с СН с сохранной ФВ, в которые также включались

пациенты из Северной Америки и Европы. Частота на­ступления первичной комбинированной конечной точ­ки (сердечно-сосудистая смерть и госпитализация по причине СН) у пациентов из Северной Америки в этих исследованиях CHARM-Preserved (10,9 на 100 пациенто-лет) и I-PRESERVE (10,3 на 100 пациенто-лет) была очень близка к частоте наступления первичной конечной точки в исследовании TOPCAT у пациентов из Северной и Южной Америки (12,6 на 100 пациенто-лет). В России и в Вос­точной Европе частота наступления первичной конечной точки была существенно ниже (4,4 и 6,1 на 100 пациенто-лет в исследовании CHARM-Preserved и I-PRESERVE соот­ветственно), хотя и не такая низкая, как в исследовании TOPCAT Грузия/Россия (2,3 на 100 пациенто-лет). Приве­денные примеры иллюстрируют первое правило анализа валидности клинического исследования:

■ Необходимо внимательно изучать критерии включения и исключения и сопоставлять их с базовыми характеристики пациентов, включенных в исследование.

Если при изложении результатов исследования ба­зовые характеристики, описание центров и процедура включения описаны недостаточно подробно, это дает по­вод сомневаться в результатах исследования.

ПРОЦЕДУРА ВКЛЮЧЕНИЯ ПАЦИЕНТОВ В ИССЛЕДОВАНИЕ

В большинстве РКИ в области кардиологии процедура включения пациентов в исследование выглядит следую­щим образом:

Скрининг → Рандомизация.

Однако в некоторых исследованиях, в том числе в ис­следовании PARADIGM-HF, о котором очень много говорят в последнее время, так как его результаты, возможно, за­ставят нас пересмотреть подходы к лечению СН, проце­дура включения в исследование выглядела следующим образом:

Скрининг → Период вхождения (run-in period) -Рандомизация.

Это пример использования отсроченной рандоми­зации. Рассмотрим, как применение этого метода вклю­чения может влиять на валидность исследования. Итак, в исследовании PARADIGM-HF [9] новый комбинирован­ный препарат - ингибитор ангиотензинпревращающих (ИАПФ) рецепторов/ингибитор неприлизина (ARNI) lCZ696 (Novartis) сравнивался с ИАПФ эналаприлом у па­циентов с СН с сохранной ФВ и СН функциональных классов (ФК). Пациенты в группе lCZ696 продемонстри­ровали 20-процентное снижение первичной конечной точки исследования (сердечно-сосудистая смертность и госпитализацию по причине СН) и 16-процентное сни­жение смертности по сравнению с пациентами из группы эналаприла (р<0,001 для всех конечных точек). Никогда еще в исследовании СН ни один новый класс препара­тов не демонстрировал таких результатов по сравнению с "золотым стандартом" лечения хронической СН - ИАПФ. В исследовании PARADIGM-HF между периодом скринин­га и рандомизацией существовал промежуток времени, так называемый период вхождения (run-in), во время которого пациенты получали последовательно сначала эналаприл (препарат сравнения), а затем lCZ 696 (рис. 3).

Последующую рандомизацию проходили только па­циенты, хорошо переносившие и эналаприл, и lCZ696. Критерии хорошей переносимости: отсутствие побочных эффектов, нарушений лабораторных показателей и функ­ции почек (табл. 1). Такой подход повышал вероятность хорошего ответа на терапию при сохранении равных условий для исследуемого препарата и препарата сравне­ния. Таким образом, внутренняя валидность исследова­ния сохранялась, однако снижалась внешняя валидность исследования. Результаты исследования PARADIGM HF не могут быть экстраполированы на всех пациентов с СН со сниженной ФВ, II-III ФК СН, а только на пациентов, за­ведомо хорошо переносящих ИАПФ, так как именно эта группа пациентов благодаря отсроченной рандомизации исследовалась в данном протоколе. Этот факт был в по­следующем отражен и в Специальном пересмотре реко­мендации по ведению пациентов с сердечной недоста­точностью 2015 г., посвященном новой лекарственной терапии (An Update of the 2013 ACCF/AHA Guideline for the Management of Heart Failure: A Report of the American College of Cardiology/American Heart Association Task Force on Clinical Practice Guidelines and the Heart Failure Society of America) [10], в которых место препарата lCZ699 в те­рапии СН было определено следующим образом: "...Воз­можна замена ИАПФ или АРА на (ангиотензин/неприлизин рецепторов ингибиторы) АНРИ у определенной группы пациентов, с хронической СН ФК со стабильным артериальным давлением и подтвержденной хорошей переносимостью ИАПФ или АРА (класс рекомендаций I; уровень доказанности B-R)". Вероятно, приблизительно такой подход будет применяться и в отечественных реко­мендациях по лечению СН.

Теперь перейдем к процедуре рандомизации. Смысл и важность рандомизации хорошо известны читателям. Поэтому остановимся только на разъяснении некоторых способов рандомизации, которые могут (и должны) от­личаться в зависимости от размера исследования, воз­действия, изучаемого в нем, характеристики изучаемого заболевания и т.д. (табл. 2).

Например, в исследовании Ephesus [12], в котором изучался эффект эплеренона у пациентов с дисфункцией ЛЖ после инфаркта миокарда, применялся стратифика­ционный метод рандомизации с использованием блоков. Стратификацию осуществляли по клиническим центрам, а затем использовали метод блоков для обеспечения эк­вивалентности количества пациентов в каждой группе. В исследовании, кроме США и Канады, принимали участи европейские страны (в том числе страны Восточной Евро­пы). Не секрет, что частота проведения реперфузионной терапии, сильно отличается в разных странах. Так, в своей работе P. Widimsky и соавт. [13] проанализировали ча­стоты этих процедур в 30 европейских странах у пациен­тов с острым коронарным синдромом (ОКС) с подъемом сегмента ST. Было показано, что реваскуляризация про­водилась у 5-92% пациентов, тромболизис использова­ли в 0-55% случаев. Использование любой реперфузионной терапии варьировалось от 37 до 93% в разных европейских странах. По данным российского регистра "Рекорд 3" [17], тромболитическую терапию (ТЛТ) про­водили 32% пациентов (у 51% догоспитально). У 52% после ТЛТ выполнено чрескожное коронарное вмеша­тельство (ЧКВ). Всего реперфузионное лечение при ОКС с подъемом сегмента ST получили 68%. Таким образом, хорошо продуманная процедура рандомизации в исследовании Ephesus предотвратила ошибки исследования, связанные с важным различием базовой терапии коро­нарного синдрома в разных центрах, включенных в ис­следование.

■ Верно выбранная и качественно проведенная процедура рандомизации гарантирует сбалансиро­ванность групп в исследовании, что существенно вли­яет на достоверность результатов, т.е. на внутреннюю валидность исследования.

ОСЛЕПЛЕНИЕ (МАСКИРОВКА)

Идеальным является случай, когда и пациент, и ле­чащий врач, и исследователь, фиксирующий и/или ана­лизирующий результаты, не осведомлены о том, к какой группе (активной или контрольной) относится пациент. Это исключает субъективную составляющую в фиксации и интерпретации результатов лечения. Существуют си­туации, когда маскировка метода воздействия для паци­ента и исполнителя невозможна или трудновыполнима. В основном это относится к изучению влияния различных немедикаментозных методов лечения, например, физиче­ских тренировок, физиотерапевтических методов, опера­тивных вмешательств. В этом случае хорошей практикой является разделение собственно вмешательства и оценки его результатов. Ослепление особенно важно, если в ис­следовании изучают влияние не на жесткие (смертность или госпитализации), а на мягкие конечные точки (каче­ство жизни, симптоматика заболевания или измерения, например, АД), в которых возможны субъективная оценка или сам метод измерения не является абсолютно точным, а результаты исследования могут зависеть от квалифи­кации и/или подсознательного ожидания определенных результатов. Показательным примером важности исполь­зования ослепления является исследование SYMPlICITY HTN-3 [14], в котором изучался эффект денервации по­чечной артерии у пациентов с резистентной артериаль­ной гипертензией по сравнению с медикаментозным ле­чением. Во всех предыдущих исследованиях, изучавших эффект подобного вмешательства, денервация имела пре­имущество перед медикаментозным лечением [15, 16]. И только при использовании процедуры маскировки с по­мощью фиктивной процедуры денервации в контрольной группе было показано отсутствие достоверного эффекта денервации. Процедура маскировки была чрезвычайно сложной и описывалась в отдельном приложении следу­ющим образом: "...Все пациенты проходили стандартную процедуру ангиографии. Маскировку проводили путем комбинации седативной терапии, сенсорной изоляции (музыка и повязка на глаза) и низкой осведомленности пациента о методике процедуры денервации и ее ожи­даемой продолжительности. После рандомизации паци­енты из группы фиктивного вмешательства оставались на операционном столе не менее 20 мин. Члены семьи также не были осведомлены о том, какое вмешательство полу­чает испытуемый. АД измерял исследователь, также не осведомленный о том, какая процедура была проведена пациенту.".

В идеале клиническое исследование должно иметь двойной слепой дизайн, для того чтобы предотвратить потенциальные искажения результатов во время сбора и анализа данных. В исследованиях, в которых двойное ослепление невозможно, должны быть предусмотрены другие способы, способствующие уменьшению сис­тематических ошибок исследования [1].

Таким образом, выбор популяции исследования, про­цедуры включения в исследования, выбор метода рандо­мизации и метода маскировки (ослепления) представля­ют собой критически важные компоненты организации любого клинического исследования и заслуживают тща­тельного изучения и анализа в ходе рассмотрения его ре­зультатов. В следующей статье мы обсудим выбор группы сравнения и организацию процедуры наблюдения за па­циентами.

ЛИТЕРАТУРА

1. Friedman l., Furberg C., DeMets D. Fundamentals of Clinical Trials. 4th ed. New York; Dordrecht; Heidelberg; london : Springer, 2010.

2. Boineau R., Anand I.S., Claggett B., Clausell N. et al. TOPCAT Investigators. Spironolactone for heart failure with preserved ejection fraction // N. Engl. J. Med. 2014. Vol. 370. P .1383-1392.

3. Pfeffer M.A., Claggett B., Assmann S.F., Boineau R. et al. Regional variation in patients and outcomes in the treatment of preserved cardiac function heart failure with an aldosterone antagonist (TOPCAT) trial // Circulation. 2015. Vol. 131, N 1. P. 34-42.

4. Агеев Ф.Т., Овчинников А.Г. Новые рекомендации по диа­гностике сердечной недостаточности с сохраненной фрак­цией выброса ЛЖ (диастолической сердечной недостаточ­ности) // Сердеч. недостаточность. 2013. Т. 14, № 5 (79). С. 297-299.

5. ACCF/AHA 2013 Guideline for the Management of Heart Failure / Yancy C.W., Jessup M., Bozkurt B., Butler J.et al. // J. Am. Coll. Cardiol. 2013. Vol. 62, Vol. 16. P. e147-e239.

6. Rossignol P., Zannad F. Regional differences in heart failure with preserved ejection fraction trials: when nephrology meets cardiology but east does not meet west // Circulation. 2015. Vol. 131. P. 7-10.

7. Yusuf S., Pfeffer M.A., Swedberg K., Granger C.B. et al.; CHARM Investigators and Committees. Effects of candesartan in patients with chronic heart failure and preserved left-ventricular ejection fraction: the CHARM-Preserved Trial //lancet. 2003. Vol. 362. P. 777-781.

8. Massie B.M., Carson P.E., McMurray J.J., Komajda M. et al.; I-PRESERVE Investigators. Irbesartan in patients with heart failure and preserved ejection fraction // N. Engl. J. Med. 2008. Vol. 359. P. 2456-2467.

9. McMurray J.J.V., Packer M., Desai A.S. et al.; for the PARADIGM-HF Investigators and Committees. Angiotensin-neprilysin inhibition versus enalapril in heart failure // N. Engl. J. Med. 2014. Vol. 371. P. 993-1004.

10. McMurray J.J.V., Packer M., Desai A.S. et al. Dual angiotensin receptor and neprilysin inhibition as an alternative to angiotensin-converting enzyme inhibition in patients with

chronic systolic heart failure: rationale for and design of the Prospective comparison of ARNI with ACEI to Determine Impact on Global Mortality and morbidity in Heart Failure trial (PARADIGM-HF) // Eur. J. Heart Fail. 2013. Vol. 15, N 9. P. 1062-1073.

11. Yancy C.W., Jessup M., Bozkurt B. et al. 2016 ACC/AHA/HFSA Focused Update on New Pharmacological Therapy for Heart Failure: An Update of the 2013 ACCF/AHA Guideline for the Management of Heart Failure: A Report of the American College of Cardiology/American Heart Association Task Force on Clinical Practice Guidelines and the Heart Failure Society of America // J. Am. Coll. Cardiol. 2016. May 20. doi:10.1016/j.jacc.2016.05.011.

12. Pitt B., Remme W., Zannad F. et al.; for the Eplerenone Post-Acute Myocardial Infarction Heart Failure Efficacy and Survival Study Investigators. Eplerenone, a selective aldosterone blocker, in patients with left ventricular dysfunction after myocardial infarction // N. Engl. J. Med. 2003. Vol. 348. P. 1309-1321.

13. Widimsky P., Wijns W., Fajadet J. et al. Reperfusion therapy for ST elevation acute myocardial infarction in Europe: description of the current situation in 30 countries. European Association for Percutaneous Cardiovascular Interventions // Eur. Heart J. 2010 Apr. Vol. 31, N 8. P. 943-957.

14. Bhatt D.l., Kandzari D.E., O'Neill W.W et al. A controlled trial of renal denervation for resistant hypertension // N. Engl. J. Med. 2014. Vol. 370. P. 1393-1401.

15. Krum H., Schlaich M., Whitbourn R. et al. Catheter-based renal sympathetic denervation for resistant hypertension: a multicentre safety and proof-of-principle cohort study // lancet. 2009. Vol. 373. P. 1275-1281.

16. Esler M.D., Krum H., Sobotka P.A., Schlaich M.P. et al. Renal sympathetic denervation in patients with treatment-resistant hypertension (the SYMPlICITY HTN-2 Trial): a randomised controlled trial // lancet. 2010. Vol. 376. P. 1903-1909.

17. Эрлих А.Д., Грацианский Н.А. от имени участников реги­стра РЕКОРД-3. Российский регистр острого коронарного синдрома "РЕКОРД-3". Характеристика пациентов и лече­ние до выписки из стационара // Кардиология. 2016. № 4. С. 16-24.

Материалы данного сайта распространяются на условиях лицензии Creative Commons Attribution 4.0 International License («Атрибуция - Всемирная»)

ГЛАВНЫЙ РЕДАКТОР
ГЛАВНЫЙ РЕДАКТОР
Обрезан Андрей Григорьевич
Доктор медицинских наук, профессор, заведующий кафедрой госпитальной терапии медицинского факультета Санкт-Петербургского государственного университета, главный врач группы клиник «СОГАЗ МЕДИЦИНА», Санкт-Петербург, Российская Федерация

Журналы «ГЭОТАР-Медиа»