Часто оригинальные статьи о выполненных исследованиях могут быть более реальным источником ответа на узкие вопросы чем обзорные статьи и лекции. Считается что чтение журналов и статей необходимо ограничить теми которые действительно имеют отношение к повседневной практике или текущим научным исследованиям. Значительная часть публикаций представляющих результаты исследования нового вмешательства содержит непригодную для использования информацию. Встреча со знакомой и известной фамилией и уважаемым учреждением позволяют заранее...


Поделитесь работой в социальных сетях

Если эта работа Вам не подошла внизу страницы есть список похожих работ. Так же Вы можете воспользоваться кнопкой поиск


Другие похожие работы, которые могут вас заинтересовать.вшм>

20915. Анализ рынка медицинских услуг 3.1 MB
Анализ теоретической информации о практике создания и применения ГЧП, характеристике и пользе данной модели для общества; анализ теоретического материала концепции бизнес-моделирования; определение экономических характеристик медицинской услуги; проведение анализа отрасли;
4601. АНАЛИЗ ДЕЯТЕЛЬНОСТИ ПОСТОВЫХ МЕДИЦИНСКИХ СЕСТЕР ТЕРАПЕВТИЧЕСКОГО ОТДЕЛЕНИЯ 60.63 KB
Практическая актуальность связана с тем, что дипломная работа может послужить автоматизации работы постовой сестры по ведению документации по учету медикаментов и движения больных; выдаче медицинских препаратов больному; формированию и распечатыванию направлений на исследования каждому пациенту; ведению температурного листа и т.д.
11969. Анализ экономической эффективности использования медицинских информационных систем 16.93 KB
Разработана модель и описаны алгоритмы анализа экономической эффективности медицинских информационных систем МИС. Разработан макет программного средства ПС анализа экономической эффективности применения МИС в лечебнопрофилактическом учреждении Программное средство анализа экономической эффективности использования медицинских информационных систем. Эксплуатационным назначением ПС является его использование экономистомэкспертом и руководителем ЛПУ при анализе экономической составляющей деятельности лечебнопрофилактического учреждения а...
18273. Анализ правового статуса Президента Республике Казахстан с позиций общепринятых критериев правового государства и принципа разделения властей 73.64 KB
Суть подхода Президента состояла в том что страна должна развиваться естественным образом эволюционно. Президентское правление - предусмотренное Конституцией государства это прекращение деятельности институтов самоуправления определенного регионального административного образования и осуществление управления последним посредством уполномоченных назначаемых главой государства - президентом и подотчетными ему лицами; предусмотренное Конституцией наделение главы государства - президента чрезвычайными полномочиями в масштабе всего...
13186. Проектирование информационной системы учета научных публикаций в среде Adobe Dreamweaver 2.29 MB
Автоматизация для любых организаций производится при помощи проектирования и последующего создания и развертывания единой корпоративной информационной системы – системы обработки информации также включающей в себя и соответствующие организационные ресурсы человеческие технические финансовые и т. Такая ситуация получила название лоскутной автоматизации и является довольно типичной для многих предприятий. Так как информационные системы предназначены для сбора хранения и обработки информации в основе любой из них лежит среда хранения и...
15989. Применение нанотехнологий в отраслях медицины 80.04 KB
Из истории следует что человечество всегда стремилось к прогрессу и с древних времён искало способы лечить болезни и продлевать жизнь. Можно сказать что развитие нанотехнологий в XXI веке изменит жизнь человечества больше чем освоение письменности паровой машины или электричества. Швейцарский физик Альберт Эйнштейн опубликовал работу в которой доказывал что размер молекулы сахара составляет примерно 1 нанометр. Американский футуролог Эрк Дрекслер пионер молекулярной нанотехнологии опубликовал...
6178. ГИГИЕНА – ОСНОВНАЯ ПРОФИЛАКТИЧЕСКАЯ ДИСЦИПЛИНА МЕДИЦИНЫ 409.78 KB
Термин «гигиена» происходит от греческого слова хигиейнос, что означает «приносящий здоровье» (Слайд №1). Согласно древнегреческой мифологии, у бога врачевания Асклепия (в древнеримских мифах – Эскулап) была дочь Гигиейя, помогавшая отцу в его делах.
5069. Роль правовых идей Авиценны в развитии медицины 31.86 KB
Ибн-Сина выступал за идеальное государство население которого должно состоять из правителей производителей и войска и каждый должен заниматься полезной работой. Особенно велики заслуги...
17864. Тенденции и Проблемы развития системы и рынка страховой медицины в США 75.24 KB
Понятие и классификация медицинского страхования: обязательное и добровольное медицинское страхование. Системы страхования здоровья в зарубежных странах. Анализ рынка медицинского страхования в США. Характеристика и особенности рынка медицинского страхования в США.
20590. Собственный капитал коммерческого банка с позиций его формирования 326.53 KB
Особую актуальность в проблеме управления собственным капиталом банка и вопросам его регулирования придает Базельский комитет по надзору который предпринял попытку коренного изменения системы оценки достаточности собственного капитала банка. Несмотря на незначительный удельный вес в совокупных пассивах банков собственный капитал остается основой надежности и устойчивости банка фундаментом деятельности банка и подушкой его безопасности. В последнее время вопросы банковского дела связанные с собственным капиталом банка привлекают особо...

Оценка уровня доказательности является основным рабочим инструментом в доказательной медицине (рис. 3.1). Поэтому важнейшим механизмом, позволяющим врачу ориентироваться в огромном количестве публикуемых медицинских данных, является рейтинговая система оценки научных исследований. Однако до настоящего времени отсутствует общепринятая шкала по оценке степени доказательности.

Категорий доказательности исследования может быть несколько - от 3 до 7. Меньшей цифре соответствует меньшая доказательность. Также выделяют три категории доказательности исследования.

Рис. 3.1. Пирамида медицинских публикаций

Практические рекомендации по диагностике и лечению могут опираться как на данные исследований, так и на их экстраполяцию. С учетом этого обстоятельства рекомендации подразделяют на 3-5 уровней, которые принято обозначать латинскими буквами - A, B, C, D, E.

А - доказательства убедительны: есть веские доказательства в пользу применения данного метода;

В - относительная убедительность доказательств: есть достаточно доказательств в пользу того, чтобы рекомендовать данное предложение;

С - достаточных доказательств нет: имеющихся доказательств недостаточно для вынесения рекомендации, но рекомендации могут быть даны с учетом иных обстоятельств;

D - достаточно отрицательных доказательств: имеется достаточно доказательств, чтобы рекомендовать отказаться от применения данного метода в определенной ситуации;

Е - веские отрицательные доказательства: имеются достаточно убедительные доказательства, чтобы исключить данный метод из рекомендаций.

В большинстве стран Западной Европы и Канаде выделяют три уровня доказательности - A, B, C. Рекомендации уровня А базируются на результатах исследований, относимых к I категории доказательности и, следовательно, отличаются наиболее высоким уровнем достоверности. Достоверность рекомендаций уровня В также достаточно высока, так как при их формулировании используются материалы исследований II категории или экстраполяции исследований I категории доказательности. Рекомендации уровня С строятся на основании неконтролируемых исследований и консенсусов специалистов (III категории доказательности) или содержат экстраполяции рекомендаций I и II категории.

Одной из наиболее всеобъемлющих является Oxford Centre for Evidence-based Medicine Levels of Evidence, опубликованная в мае 2001 г. (оригинал приведен в приложении 1). В ней использованы следующие критерии достоверности медицинской информации:

Высокая достоверность - информация базируется на результатах нескольких независимых клинических исследований с совпадением результатов, обобщенных в систематических обзорах;

Умеренная достоверность - информация основана на результатах нескольких близких по целям клинических независимых исследований;

Ограниченная достоверность - информация основана на результатах одного клинического исследования;

Строгие научные доказательства отсутствуют (клинические испытания не проводились) - утверждение основано на мнении экспертов.

Совершенно очевидно, что использовать данные рекомендации в повседневной практике затруднительно не только практическому врачу, но и научному сотруднику.

Американское Агентство по политике здравоохранения и научным исследованиям предложило более простую шкалу с выделением следующих уровней доказательств в порядке убывания их достоверности:

I а - мета-анализ РКИ;

I b - как минимум одно РКИ;

II а - хорошо организованное контролируемое исследование без рандомизации;

II b - как минимум одно хорошо организованное квази-экспериментальное исследование;

III - не экспериментальные исследования;

IV - отчет экспертного комитета или мнение и/или клинический опыт авторитетных специалистов.

В последнем случае главную роль играет субъективный фактор, в частности личный опыт врача и мнение экспертов, выбор которых может иметь тенденциозный характер. Шотландской Межколлегиальной медицинской сетью также разработана система оценки уровня доказательств, опирающаяся на элементы, рассмотренные выше:

А - при уровне I а, I b;

В - при уровне II а, II b, III;

С - при уровне IV (только если нет А и В).

Движением «Доказательная медицина» предложена шкала для оценки уровня достоверности знаний, учитывающая в первую очередь схему получения соответствующего знания (табл. 3.1).

Таблица 3.1. Уровни достоверности знаний для терапии (по журналу Critical Care Medicine (1995), 23, N l, 395 с.). Используются три градации достоверности (А, В, С) и пять уровней со знаками I, I-, II, II-, III, IV, V)

Градация

Доступен высококачественный обзор

высококачественного обзора

Случай, когда нижняя граница доверительного интервала для эффекта лечения превышает клинически значимый выигрыш:

Результаты исследований однородны

Результаты исследований неоднородны (I-)

Рандомизированные испытания с низким уровнем ошибок первого и второго рода (I)

Случай, когда нижняя граница доверительного интервала для эффекта лечения ниже клинически значимого выигрыша, но точечная оценка выше:

Результаты исследований однородны (11+);

Результаты исследований неоднородны (II-)

Рандомизированные испытания с высоким уровнем ошибок первого и второго рода (II)

Нерандомизированные одновременные когортные исследования (III)

Нерандомизированные исторические когортные исследования (IV)

Серии отдельных случаев (V)

Несмотря на то что, по мнению авторов, данная шкала наиболее понятна рядовому практикующему врачу, она требует от пользователя достаточно хорошего знания дизайна исследований. Авторы шкалы призывают считать ее компромиссной, выстраданной, но вместе с тем ставящей заслон перед неподкрепленными опытом «физиологическими принципами» и «клиническими рассуждениями». Ею, считают авторы, следует пользоваться до тех пор, пока в медицине не возникнут условия для использования более объективной шкалы.

Для практических врачей, имеющих самые элементарные представления о клинической эпидемиологии и статистике, вполне приемлемой может быть оценка достоверности доказательств из различных источников по рекомендациям Шведского совета по методологии оценки в здравоохранении, Согласно им достоверность убывает в следующем порядке:

Рандомизированное контролируемое клиническое исследование;

Нерандомизированное клиническое исследование с одновременным контролем;

Нерандомизированное клиническое исследование с историческим контролем;

Когортное исследование;

. «случай-контроль»;

Перекрестное клиническое исследование;

Результаты наблюдений.

Систематизированные обзоры

Рост количества и повышение качества результатов клинических исследований в последние 10 лет играют важную роль в принятии практических решений в повседневной клинической деятельности. Практикующему врачу разобраться в беспрерывном и нарастающем информационном потоке достаточно сложно, существенную помощь в этом ему оказывают систематизированные обзоры по разным проблемам профилактики, диагностики и лечения широкого круга заболеваний. Главное достоинство обзора - объединение информации о нескольких исследованиях, что позволяет получить объективное представление о клиническом эффекте анализируемого вмешательства по сравнению с отдельно взятым клиническим исследованием. Систематизированные обзоры являются одной из наиболее важных составляющих доказательной медицины.

Результаты отдельных исследований, пусть даже с большим количеством пациентов, в значительной мере отражают эффективность вмешательства на ограниченной выборке больных, которая определяется критериями включения и исключения, а также ее клинико-демографическими показателями. Поэтому надо весьма осторожно экстраполировать сделанные по результатам конкретного исследования выводы на всю популяцию пациентов. В исследованиях с участием небольшого количества больных возрастает роль случайного фактора, что может привести к получению неверных результатов.

Атрибутивные признаки систематизированного обзора (четкое описание принципов и критериев отбора исследований для включения в него методов анализа и стандартов качества исследований) позволяют существенно снизить риск систематической ошибки, а также получить более широкую выборку пациентов.

Прежде всего для систематизированного обзора отбираются исследования в соответствии с конкретным клиническим вопросом. Главной целью систематизированного обзора является получение ответа на следующие вопросы в доступной для понимания практического врача форме.

1. Действительно ли эффективно анализируемое вмешательство?

2. Насколько эффективнее анализируемое вмешательство по сравнению с плацебо, «традиционной» терапией или по сравнению с другими схожими вмешательствами, применяемыми при конкретной патологии в настоящее время?

3. Насколько безопасно анализируемое вмешательство, в том числе и при сравнении с уже применяющимися вмешательствами?

4. Оправдано ли применение анализируемого вмешательства у конкретного больного с учетом соотношения польза (эффективность)/ риск (безопасность)?

5. Возможна ли замена анализируемого вмешательства на уже применяющееся вмешательство и какие последствия будет иметь такая замена?

Результаты систематизированных обзоров, как правило, изобилуют не только цифрами, но специальной терминологией и сокращениями, которые трудно понять и правильно интерпретировать практикующему врачу. Наиболее употребительные в доказательной медицине термины и сокращения приведены в приложении, в настоящее время большинство из них используется уже не только в специальной медицинской литературе, но и во время презентаций на национальных конгрессах и симпозиумах.

Одним из наиболее важных понятий является показатель NNT (the number needed to treat; русская аббревиатура ЧБНЛБИ или ЧБНЛ - число больных, которых необходимо лечить определенным методом в течение определенного времени, чтобы достичь определенного эффекта или предотвратить неблагоприятный исход у одного больного). Достоинством этого показателя является возможность его применения в условиях реальной клинической практики обычного врача. Кроме этого, при различных вмешательствах, приводящих к

одинаковому результату при одном заболевании, знание величины ЧБНЛ позволяет выбрать оптимальную тактику лечения конкретного пациента (табл. 3.2).

Таблица 3.2. Влияние ИАПФ на смертность в РКИ по профилактике и лечению ХСН

Примечание. Э - эналаприл; К - каптоприл; Р - рамиприл; Т - трандалоприл; З - зофеноприл

Показатель ЧБНЛ всегда предполагает существование группы сравнения (референтной группы), в которой больные получают плацебо или какое-то другое лечение или вообще не получают его. Показатель ЧБНЛ может быть различным в рамках одного исследования в зависимости от выбранного критерия оценки эффективности вмешательства (чаще всего это «суррогатные» конечные точки, принятые для конкретного заболевания).

Противоположным по смыслу является показатель «число больных, которых необходимо лечить определенным методом в течение определенного времени, чтобы вмешательство могло нанести вред одному больному». Особую важность этот показатель приобретает при оценке целесообразности профилактического вмешательства. Знание этого показателя и ЧБНЛБИ позволяет оценить степень риска вмешательства у конкретного пациента.

ЧБНЛ для определенного вида вмешательства (чаще всего лечения) является величиной, обратной снижению абсолютного риска при этом

вмешательстве. Рассмотрим это на конкретном примере. В результате проведенного исследования было показано, что в результате лечения препаратом Х риск развития одного из характерных осложнений для анализируемого заболевания снизился с 0,5 до 0,3, относительный риск составил 0,20, снижение относительного риска - 0,80, а снижение абсолютного риска - 0,20. Следовательно ЧБНЛ равно 1: 0,20 = 5. С практической точки зрения это означает, что врачу надо лечить препаратом Х 5 больных, чтобы предотвратить развитие одного осложнения у одного больного.

На величину показателя ЧБНЛ существенное влияние оказывает степень снижения абсолютного риска. Простота расчета показателя ЧБНЛ позволяет широко использовать его в качестве основного цифрового показателя эффективности (или потенциального вреда) анализируемого вида вмешательства. Главное преимущество ЧБНЛ состоит в том, что его может использовать любой врач применительно к условиям своей практики.

В этой связи становится очень важным понять возможности и пределы использования показателя ЧБНЛ в условиях реальной клинической практики.

Особенности показателя:

Строго специфичен для определенного вида вмешательства и у конкретной категории пациентов;

Описывает различие по клинически важным исходам между группой вмешательства и контрольной группой;

Низкий показатель (около 1) означает, что благоприятный исход наблюдается почти у каждого больного, получающего лечение, и лишь у небольшой части больных в группе сравнения;

На практике показатель, равный единице, встречается крайне редко даже при исследовании антибиотиков;

Абсолютное значение показателя не является критерием для принятия решения о целесообразности вмешательства, а отражает вероятность достижения положительного эффекта. Так, при сердечной недостаточности эффективность различных, в том числе и официально рекомендованных лечебных вмешательств, колеблется от 20 до более чем 100, но при этом все они используются у этой категории пациентов, потому что считаются эффективными, причем часто одновременно (например, комбинация ИАПФ с β-адреноблокаторами и спиронолактоном).

Ограничения для использования показателя:

Может корректно использоваться только в пределах 95% доверительного интервала (означает, что в 9 из 10 случаев истинное значение ЧБНЛ находится в пределах данного диапазона) для исследуемой выборки;

При отсутствии значений доверительного интервала даже при наличии низких значений показателя не исключено отсутствие благоприятного эффекта вмешательства ввиду дискретного значения ЧБНЛ;

Можно сравнивать значения ЧБНЛ только для одинаковых заболеваний, так как их клинические исходы могут быть различны. Так, последствия профилактики тромбообразования при инсульте и геморрое различны;

Прямое сравнение значений показателей ЧБНЛ допустимо только в том случае, если они рассчитаны для различных вмешательств при одном заболевании, одинаковой степени тяжести и в отношении одного и того же исхода;

Значения показателя могут изменяться для одного вида вмешательства у конкретной группы пациентов в зависимости от исходного уровня риска (низкий, промежуточный или высокий) в ней. Причем закономерности между степенью риска и эффективностью вмешательства не существует. Так, тяжелое заболевание может легче поддаваться лечению, чем то же заболевание легкой или умеренной степени тяжести и наоборот. В конечном счете все определяется самим заболеванием и его прогнозом для жизни и инвалидизации;

Определение показателя ЧБНЛ предполагает оценку влияния вмешательства на исход в течение определенного периода времени (чаще всего это средняя длительность РКИ). Поэтому сравнение показателей ЧБНЛ при различных вмешательствах, но одной патологии, правомерно только в том случае, когда оценивается эффективность вмешательств в течение одинакового периода времени. Нельзя сравнивать эффективность лечения с использованием одного вида вмешательства на протяжении 1 года, другого - на протяжении 3 лет, а третьего - на протяжении 5 лет.

Различия в показателе ЧБНЛ при лечебном и профилактическом вмешательстве:

При лечебном вмешательстве во всех группах сравнения проводится лечение, поэтому ключевым вопросом является определение и сравнение эффективности различных вмешательств;

При профилактике важно выяснить, будет ли профилактическое вмешательство предотвращать неблагоприятный исход более эффективно, чем отсутствие всякого вмешательства;

При лечебных и профилактических вмешательствах необходимо взвесить соотношение риска и пользы для каждого из возможных вмешательств;

При профилактических вмешательствах существует возможность получить нежелательные явления у части лиц без достижения какого-либо благоприятного эффекта;

Показатель ЧБНЛ позволяет расположить сравниваемые виды вмешательств в порядке их убывания или возрастания, что упрощает выбор варианта лечения. Однако при окончательном решении необходимо учитывать и такие факторы, как стоимость лечения, сопутствующую клинически значимую патологию и особенности больного, так как они существенно влияют на приверженность пациента к терапии. Оценивая эффективность вмешательства со стороны врачей и пациентов, необходимо отдавать предпочтение последним, поскольку оценка врача всегда менее чувствительна, чем оценка больных;

Профилактическое вмешательство чаще всего не влияет на большую часть популяции за исключением лиц из группы риска. Величина ЧБНЛ при профилактических вмешательствах свидетельствует об их эффективности в популяции, однако в меньшей степени применима к каждому конкретному случаю;

Показатель ЧБНЛ при профилактике должен всегда использоваться одновременно с показателем ЧБНЛНИ (количество больных в экспериментальной группе по сравнению с контрольной, необходимое для выявления дополнительного неблагоприятного исхода). Также необходима оценка индивидуального исходного риска. поскольку при его исходно низком уровне целесообразность профилактического вмешательства отсутствует.

Принцип расчета показателя ЧБНЛ позволяет оценивать и безопасность вмешательств. Число больных, у которых при вмешательстве возникает нежелательное явление, у одного пациента рассчитывается так же, как ЧБНЛ. Однако в тех случаях, когда частота нежелательных явлений низка, статистически достоверную величину доверительного интервала определить невозможно, он становится неопределенным. В этом случае вред от вмешательства имеет только точечную оценку. Выраженные неблагоприятные явления в

РКИ выявляются по количеству случаев выбывания из него в связи с проводимым вмешательством. Отсутствие в систематизированных обзорах и результатах РКИ информации о побочных эффектах и частоте выбывания пациентов вследствие нежелательных явлений существенно снижает их ценность.

В систематизированных обзорах могут также рассматриваться и другие последствия лечения, которые не укладываются в обычные представления о желательных и нежелательных эффектах вмешательства. Например. снижение риска развития новообразований кишечника при длительном применении ацетилсалициловой кислоты для первичной и вторичной профилактики сердечно-сосудистых осложнений.

Принцип расчета показателя ЧБНЛ при его отсутствии в публикации

Риск развития исхода (вероятность) выражается по отношению к общей выборке определенного размера, например когда 15 случаев одного исхода наблюдаются в выборке из 100 человек, риск этого исхода равен 0,15. В этом случае шанс такого исхода в выборке рассчитывается как число развившихся исходов по отношению к числу неразвившихся (например, 15 к 85 или 0,17). Тогда отношение шансов рассчитывается просто как шанс исхода в группе лечения, деленный на шанс этого исхода в группе сравнения. Поэтому если в систематизированном обзоре приводится только отношение шансов, но нет значений ЧБНЛ, последний показатель можно рассчитать по табл. 3.3. Для этого необходимо выбрать колонку с наиболее близким к опубликованному значением отношения шансов и строку с самым близким к ожидаемому значением частоты исхода, а затем на их пересечении найти соответствующее значение ЧБНЛ. В левой ее части приведены значения отношения шансов меньше 1,0. Это означает, что при профилактических вмешательствах, когда исход - это возникновение заболевания, рецидив, осложнения или ухудшение течения болезни, интересующий исход в группе лечения встречается реже, чем в группе сравнения. В правой части рисунка значения отношения шансов больше 1,0 - значит, интересующий исход чаще встречается в группе лечения, что типично для исследований по изучению эффективности лечебных вмешательств (где исход - это полное выздоровление, ремиссия, отсутствие осложнений или стабилизация течения заболевания).

Таблица позволяет определить, как различная частота исхода влияет на величину ЧБНЛ при определенном значении отношения шансов.

Таблица 3.3. Расчет ЧБНЛ по величине отношения шансов

При экстраполяции данных систематизированного обзора врач прежде всего должен оценить степень его соответствия той группе пациентов, для которой был выявлен положительный эффект вмешательства. Несомненно, что личный опыт врача и существующие стандарты лечения должны быть учтены при принятии окончательного решения. Представление об эффективности препаратов может изменяться по мере появления дополнительных данных после завершения крупных рандомизированных контролируемых испытаний. Появляются новые данные и меняются результаты систематизированных обзоров. Поэтому в практической работе необходимо использовать наиболее свежие из них. Главное состоит в том, что систематизированные обзоры могут предоставлять объективную информацию, позволяющую пациенту и врачу прогнозировать эффективность и возможные последствия от конкретного вмешательства еще до начала лечения.

Для профилактических вмешательств ЧБНЛ рассчитывается по формуле:

Для лечебных вмешательств ЧБНЛ рассчитывается по формуле:

Систематические обзоры подразделяются на качественные и количественные. Последние отличаются использованием специальных статистических методов для обобщения результатов (мета-анализ)

Рис. 3.2. Взаимодействие систематических обзоров и мета-анализа

различных исследований с целью получения вывода об эффективности вмешательства или диагностического метода. Часто систематический обзор, выполненный с использованием статистических методов, также называют мета-анализом, однако это не совсем корректно. Их соотншение представлено на рис. 3.2.

Мета-анализ

Одной из разновидностей систематизированных обзоров является мета-анализ. Часто мета-анализ рассматривается как высшая ступень доказательности и становится основой для выбора наиболее эффективных лечебно-профилактических и диагностических вмешательств. Мета-анализ, появившийся в конце 1980-х годов, сегодня относится к одной из самых популярных и быстро развивающихся методик системной интеграции результатов отдельных научных исследований. Например, в Великобритании до 50% всех используемых сегодня методов лечения заболеваний внутренних органов основаны на результатах рандомизированных контролируемых испытаний (РКИ), а также соответствующих мета-анализов. Сегодня мета-анализ - это «объединение результатов различных исследований, складывающееся из качественного компонента (например, использование таких заранее определенных критериев включения в анализ, как полнота данных, отсутствие явных недостатков в организации исследования и

т.д.) и количественного компонента (статистическая обработка имеющихся данных)». В то же время I. Chalmers и D.G. Altman в монографии «Систематические обзоры» характеризуют мета-анализ как «количественный систематический обзор литературы или количественный синтез первичных данных с целью получения суммарных статистических показателей».

Целью мета-анализа является оценка эффективности изучаемого вмешательства, а также выявление, изучение и объяснение неоднородности или гетерогенности в результатах исследований и подгруппах пациентов. Он должен представить точечные и интервальные (95% доверительный интервал) оценки обобщенного эффекта вмешательства.

Как указывалось выше, в мире ежегодно публикуется более 2,5 миллиона медицинских статей, не считая материалов многочисленных национальных и международных конференций, книг. Естественно, в этой ситуации велика потребность в анализе и синтезе имеющейся информации. Ее анализ по типу литературного обзора для журнала или диссертации носит чисто описательный и субъективный характер, хотя и является предпосылкой для проведения мета-анализа после актуализации некой проблемы. Главный недостаток такого подхода состоит в том, что он не использует строго научные и математические методики. Все это приводит к появлению так называемой β-ошибки (ошибка второго рода - ложное утверждение об отсутствии различий между эффективностью сравниваемых методов лечения, когда на самом деле они различны) из-за противоречивых результатов исследований и недостаточного числа пациентов в них. Примеров расхождения результатов описательного обзора литературы и ее метаанализа очень много (публикация вывода лауреата Нобелевской премии профессора Л. Полинга о снижении заболеваемости простудой в результате применения аскорбиновой кислоты, эффективность антиоксидантов в профилактике сердечно-сосудистой патологии, целесообразность профилактики нарушений ритма с использованием лидокаина в остром периоде инфаркта миокарда, возможность снижения риска сердечно-сосудистой патологии у женщин на фоне заместительной гормональной терапии). Ни один из этих выводов впоследствии не был подтвержден результатами соответствующих мета-анализов. В то же время кумулятивный мета-анализ 33 клинических исследований мог еще в 1973 г. (почти за 20 лет до широкого внедрения в практику внутривенного тромболизиса) сделать рутинной практику введения

стрептокиназы при остром инфаркте миокарда.

Однако существуют и противоположные примеры. В качестве одного из них можно привести дискуссию середины 1990-х годов прошлого века о целесообразности и безопасности применения антагонистов кальция при артериальной гипертензии. По данным двух мета-анализов было показано их негативное влияние на риск развития инфаркта миокарда, но последующие крупные исследования ALLHAT и ASCOT полностью опровергли эти опасения, также как и новый мета-анализ BPTLC.

В целом мета-анализ позволяет более точно, чем результаты отдельно взятого клинического исследования, определить категории больных, у которых применимы полученные результаты.

На основании результатов мета-анализа часто принимаются не только лечебно-диагностические, но и управленческие решения (например, развертывание специализированных инсультных отделений, снижающих риск смертности и тяжелой инвалидизации более чем на треть). Интересно, что ни в одном из более чем 10 рандомизированных клинических исследований преимущества специализированных отделений не были доказаны.

Постоянно обновляемые мета-анализы позволяют существенно сократить время между научным открытием и широким внедрением его результатов в практику здравоохранения. В качестве примера можно привести результаты мета-анализа по применению β-адреноблокаторов при артериальной гипертензии, которые существенно сузили показания для их назначения у этой категории пациентов.

Существует два основных подхода к выполнению мета-анализа: статистический ре-анализ отдельных исследований на основании первичных данных о включенных в них пациентах и альтернативный ему, базирующийся на обобщении результатов опубликованных исследований по конкретной теме.

Главными преимуществом мета-анализа является возможность увеличения статистической мощности исследования и достоверности оценки эффекта анализируемого вмешательства, относительно низкая стоимость и оперативность его проведения.

В соответствии с рекомендациями «The Cochrane Collaboration. Preparing, maintaining and disseminating systematic reviews of the effects of health care» (The Cochrane Collaboration, UK, 1995) для анализа качества выполненного мета-анализа необходимо проанализировать следующее.

Насколько специфична и четко определена его цель (см. во введении).

Цель проведения мета-анализа должна быть конкретной и оформлена в виде правильно сформулированного клинического вопроса. Это позволяет четко определить контингент и клинико-демографические характеристики популяции пациентов, к которым могут быть применены его результаты. Формулирование цели мета-анализа предопределяет стратегию отбора оригинальных исследований и выработки критериев включения соответствующих данных. Наиболее типичной целью мета-анализа является ответ на вопрос, приносит ли анализируемое вмешательства больше пользы, чем вреда по сравнению с другими методами, включая плацебо.

Насколько всеобъемлюща и четко описана тактика поиска соответствующих публикаций, не является ли она тенденциозной (см. в материалах и методах).

Прежде всего необходимо максимально снизить риск возникновения систематической ошибки из-за включения исследований только с положительным результатом.

Методология поиска публикаций по теме мета-анализа достаточно сложна и включает четыре основные этапа:

Поиск в максимально большем количестве электронных базах данных (типа MЕDLINE, Medscape. EMBASE, Science Citation Index), названиях и текстах публикаций по ключевыми словам;

Анализ библиографических ссылок в статьях и книгах по интересующей теме, которые могут содержать ссылки на публикации, пропущенные на первом этапе;

Запросы в фармацевтические компании, производящие препараты, эффективность которых оценивается в мета-анализе. Особое внимание нужно уделить получению неопубликованных результатов их собственных исследований так называемых Data on file;

Личные контакты с экспертами и ведущими специалистами в области предмета мета-анализа, которые позволят выявить ранее неизвестные исследования, получить разъяснения по достоинствам и недостаткам дизайна исследований, включаемых в мета-анализ.

Еще одно правило отбора исследований для включения в метаанализ: если с участием одной группы выполнено несколько исследо-

ваний на одной популяции больных, то в мета-анализе используются данные последнего.

Поиск и выявление всех относящихся к теме мета-анализа публикаций является синтезом трудоемкого и медленного ручного просмотра всех журналов и сборников, которые могут содержать относящиеся к мета-анализу публикации с более производительным компьютерным просмотром электронных библиографических баз данных. Однако даже такое сочетание выявляет около 65% от всех публикаций по проблеме мета-анализа. Существуют специальные способы оценки полноты выявления и включения в мета-анализ исследований, чтобы снизить вероятность публикационного смещения результатов из-за преимущественного опубликования неотрицательных результатов исследований. Для качественной оценки наличия этой систематической ошибки выполняют построение воронкообразной диаграммы рассеяния результатов отдельных исследований в координатах (величина эффекта, размер выборки). При полном выявлении исследований эта диаграмма имеет симметричный характер.

Описание и обоснованность критериев включения и исключения отдельных исследований для мета-анализа (см. в материалах и методах).

Определение критериев включения и исключения исследований из мета-анализа зависит от первоначального определения прогностически значимых исходов, типичных для исследуемой патологии.

Считается, что качество мета-анализа зависит от характеристик отобранных исследований:

Принципа отбора его участников (общая популяция или конкретная нозология);

Места проведения (университетская клиника, стационар общего типа или специализированная клиника, поликлиника);

Продолжительности (должна быть сопоставимой и достаточной для анализа влияния вмешательства на исходы);

Характеристики больных, включенных в исследование (сопоставимость клинико-демографических характеристик);

Диагностических критериев заболевания, являющегося предметом исследования в мета-анализе;

Дозы, частоты использования, путей введения, времени начала и продолжительности использования лекарственного препарата (или метода лечения);

Дополнительного лечения и наличия сопутствующих заболеваний у больных, включенных в исследование;

Отклонений от протокола исследования, изучавшихся клинических исходов и критериев их оценки (сопоставимость использованных диагностических методов);

Наличия в материалах исследования абсолютных величин, характеризующих включенных в него больных и адекватных для исследуемой патологии клинических исходов.

Количество включенных в исследование больных играет важную, но не решающую роль при их отборе для мета-анализа. Необходимое число пациентов зависит от распространенности исследуемой патологии и выбранных конечных точек.

В мета-анализ не включают исследования и публикации:

Не удовлетворяющие критериям включения;

В которых отсутствуют данные об изучаемых клинических исходах у всех больных;

Где вмешательство, эффективность которого планируется оценить в мета-анализе, не было определено заранее и детально описано в разделе «Методы»;

В которых приведены несопоставимые виды вмешательств (дозировка лекарственного препарата, частота и путь введения, сроки начала и продолжительности лечения);

Которые не дают четкого определения терминов «благоприятный» и «неблагоприятный» исход.

Наличие оценки качества отдельных исследований, включенных в метаанализ (см. в материалах и методах).

Оценка качества исследований проводится всеми авторами метаанализа. Объективизировать ее может оценка независимого эксперта и балльная система оценки качества.

Максимальные баллы получают исследования с четко определенными критериями исходов и участием большого числа пациентов. Большее количество баллов следует присваивать исследованиям, которые соответствуют рекомендациям «The Cochrane Collaboration. Preparing, maintaining and disseminating systematic reviews of the effects of health care», анализируемых в данной главе. Баллы по всем параметрам суммируют, делят на общий максимально возможный и умножают на 100%. Суммарная оценка методологического качества каждого ана-

лизируемого исследования может колебаться от 0 до 100%. Авторам любого мета-анализа необходимо заранее определить минимальное количество баллов, ниже которого методологическое качество исследования признается неудовлетворительным и недостаточным для его включения в мета-анализ.

Наличие описания методики извлечения данных из оригинальных исследований (публикаций).

Какие методы (Mantel-Haenszel для модели постоянных эффектов; DerSimonian и Laird для модели случайных эффектов или логистического регрессионного анализа, проводимого с учетом прогностических факторов для анализа данных обсервационных исследований) и программы статистической обработки полученных данных использованы, насколько они валидны и приемлемы для данного исследования (см. в материалах и методах).

Результаты мета-анализа могут быть представлены как в относительных (соотношение шансов, относительный риск, снижение относительного риска и других), так и в абсолютных (снижение абсолютного риска, число больных, которых нужно лечить определенным методом в течение определенного времени, чтобы достичь определенного благоприятного эффекта или предотвратить определенный неблагоприятный исход у одного больного и других) показателях. Как показывает опыт, абсолютные показатели более понятны практическим врачам.

Описание применяемых методов статистической обработки должно быть достаточным для воспроизведения данного мета-анализа или выполнения другого.

Наиболее достоверными считаются результаты мета-анализа, основанного на первичных данных о каждом включенном в оригинальное исследование больном, однако эта задача трудновыполнима из-за «закрытости» информации, а также материальных и временных затрат. Последние сопоставимы с проведением оригинального исследования. Но именно такой подход снижает вероятность ошибок, связанных с возможной неточностью совокупных данных оригинальных исследований, позволяет определить время до развития того или клинического исхода в зависимости от проводимого лечения, в том числе и отдельных подгруппах.

Существуют различные прикладные статистические программы для проведения мета-анализа. Одной из наиболее популярных явля-

ется программа ReviewManager (Cochrane Collaboration). Пакет содержит набор программных средств для проведения любого варианта мета-анализа. Выбор конкретного метода диктуется типом данных (дихотомические, непрерывные) и модели (с фиксированными, случайными эффектами).

Дихотомические данные - это результат оригинальных исследований (соотношение шансов, относительный риск, разница рисков в выборках), характеризующий эффективность вмешательства. Непрерывными данными обычно является диапазон (минимальная и максимальная величина) изучаемых параметров или нестандартизованная разница взвешенных средних в группах сравнения (при этом исходы должны оцениваться одинаковым способом). Если же они оценивались по-разному, необходима стандартизация разницы средних в сравниваемых группах, что негативно отразится на качестве анализа.

Для анализа дихотомических данных используются модели с фиксированными или случайными эффектами (метод DerSimonian and Laird).

В случае нулевой дисперсии между исследованиями используются методики Mantel-Haenszel, Peto и модель с фиксированными эффектами (предполагает, что изучаемое вмешательство во всех исследованиях имеет одну эффективность, а выявляемые различия между различными исследованиями обусловлены только дисперсией внутри исследований). Модель случайных эффектов, напротив, предполагает, что эффективность изучаемого вмешательства в разных исследованиях может быть различной, учитывает дисперсию не только внутри одного исследования, но и между ними, использует методику DerSimonian и Laird.

К вариантам мета-анализа относятся многомерный мета-анализ, байесовский мета-анализ, кумулятивный мета-анализ, мета-анализ выживаемости.

Байесовский мета-анализ (c onfidence profile method) применяется при малом числе анализируемых исследований и позволяет рассчитать априорные вероятности эффективности вмешательства с учетом косвенных данных.

Регрессионный мета-анализ (логистическая регрессия, метод наименьших квадратов, модель Кокса) используется при существенной гетерогенности результатов исследований. Он позволяет построить модель изменения анализируемого показателя в зависимости

от нескольких характеристик исследования (размера выборки, дозы препарата, способа его введения, клинико-демографических характеристик пациентов). Результаты регрессионного мета-анализа обычно представляют в виде регрессии и линии регрессии с коэффициентом наклона и указанием доверительного интервала.

В некоторых случаях мета-анализ может использоваться не только для обобщения результатов контролируемых, но и когортных исследований. Однако при этом вероятность появления систематической ошибки существенно возрастает.

Особый вид мета-анализа - обобщение оценок информативности диагностических методов, полученных в разных исследованиях. Цель такого мета-анализа - построение характеристической ROC-кривой взаимной зависимости чувствительности и специфичности с использованием взвешенной линейной регрессии.

Для мета-анализа обязательным является проведение теста на статистическую гетерогенность (Хи-квадрат) включенных в анализ исследований. При обнаружении существенных различий между исследованиями выводы мета-анализа можно поставить под сомнение. Для оценки гетерогенности используют критерий Хи-квадрат с нулевой гипотезой о равном эффекте во всех исследованиях и с уровнем значимости 0,1 для повышения чувствительности теста.

Источником гетерогенности результатов разных исследований считается дисперсия внутри (случайные отклонения результатов разных исследований от единого истинного фиксированного значения эффекта) и между исследованиями (различия изучаемых выборок по клинико-демографическим показателям или характеру вмешательств, приводящая к различию в эффективности вмешательства).

Если дисперсия между исследованиями полагается близкой к нулю, то каждому из исследований приписывается вес, величина которого обратно пропорциональна дисперсии результата данного исследования. На величину дисперсии прямое влияние оказывает величина выборки.

Как суммировались данные отдельных исследований, и применялся ли кумулятивной подход с представлением промежуточных результатов (см. в материалах и методах).

Исследования, включенные в мета-анализ, должны быть максимально однородными по виду вмешательства, клинико-демографическим характеристикам популяции пациентов, изучаемым исходам,

дизайну (например, недопустимо объединение результатов открытых и слепых исследований).

Использование кумулятивного подхода с промежуточными результатами позволяет оценить вклад каждого исследования. При выполнении кумулятивного мета-анализа исследования добавляют по одному в заранее оговоренном определенном порядке (например, в соответствии с датой публикации или фамилией первого автора и т.д.). Кумулятивный мета-анализ является вариантом байесовского мета-анализа с пошаговым включением результатов исследований и позволяет рассчитывать априорные и апостериорные вероятности по мере включения исследований в анализ.

Каково общее число исследований и пациентов, включенных в мета-анализ, наличие анализа в подгруппах (см. в результатах).

Анализ эффективности вмешательства в подгруппах является признаком качественного мета-анализа. Регламентированных нормативов о необходимом числе исследований для мета-анализа нет. Важно, чтобы исследований оказалось достаточно для получения статистически достоверной информации, и они отражали всю палитру эффективности вмешательства.

Приведены ли доверительные интервалы показателей эффективности вмешательства и как проводилась стандартизация факторов, влияющих на конечный результат (см. в результатах).

Отсутствие доверительных интервалов позволяет скептически относится к результатам мета-анализа в целом.

Вытекают ли приведенные заключения из представленных в мета-анализе данных и указаны ли ограничения для применения его результатов (см. в обсуждении результатов).

Результаты мета-анализа обычно представляются графически (точечные и интервальные оценки величин эффектов каждого из включенных исследований и обобщенного результата мета-анализа) и в виде таблиц.

Надежность выводов мета-анализа проверяется анализом чувствительности, который может проводиться с использованием различных методик:

Включение и исключение из мета-анализа исследований, выполненных на низком методологическом уровне;

Изменение параметров данных, отбираемых из каждого включенного исследования;

Исключение из мета-анализа наиболее крупных исследований и пересчет результатов с последующей оценкой гетерогенности результатов по критерию Хи-квадрат.

Одним из способов проведения последнего является сопоставление результатов, получаемых в двух моделях:- с фиксированными и случайными эффектами. Во второй модели результаты обычно становятся менее статистически значимыми. Если величина эффекта того или иного анализируемого вмешательства при анализе чувствительности существенно не изменяется, то выводы первичного метаанализа обоснованы.

Отсутствие данных о первоисточниках ставит под сомнение качество мета-анализа.

Приведен ли структурированный реферат мета-анализа.

Структурированный реферат позволяет существенно экономить время практического врача.

Немаловажно, в каком журнале (индекс цитируемости) были опубликованы результаты анализа, есть ли опыт в его проведении у авторов (наличие публикации с мета-анализом).

Проведение мета-анализа - это коллективное творчество. Уже на этапе отбора исследований необходимо участие как минимум двух исследователей, чтобы максимально расширить и объективизировать поиск.

Результаты мета-анализа имеют важное научное и практическое значение:

Являются источником объективной информации о современных методах диагностики, профилактики и лечения;

Служат основой при разработке формулярной системы, стандартов диагностики и лечения и научно-обоснованных рекомендаций;

Стимулируют проведение конкретных клинических исследований, так как формируют научную гипотезу и позволяют более точно определить объем планируемой выборки пациентов;

Позволяют оценить не только эффективность, но и безопасность вмешательств.

Мета-анализ является достаточно новым подходом к обобщению данных клинических исследований, однако не может заменить их. При наличии противоречий между данными мета-анализа и результатами клинических исследований принятие решения должно быть отложено до появления данных новых исследований и мета-анализа, поскольку его некорректное проведение ведет к ошибочным результатам. До настоящего времени нет однозначного ответа на вопрос о том, что важнее для клинической практики результаты мета-анализа или мега-трайлов.

Клинические исследования

Некоторые клинические исследования являются не только основой для систематизированных обзоров и мета-анализа, но и сами являются важным источником данных для доказательной медицины.

Главным отличием научных исследований является стремление получить максимально объективную информацию, для чего необходимо устранить влияние случайных (посторонних) факторов, учесть особенности обследуемых и сформировать исследуемые группы пациентов с минимальными различиями по клинико-демографическим показателям между ними. Для решения конкретной клинической задачи используют совершенно определенный тип исследований, который переопределяет особенности его подготовки и проведения. Именно правильно выбранная структура исследования определяет, насколько доказательными и убедительными будут его выводы.

Для решения этих задач существуют различные по дизайну и структуре исследования.

Поперечные (одномоментные) исследования:

Описания симптомов и проявлений болезни, диагноза/стадии болезни, вариаций, тяжести болезни;

Аналитические (эксплораторные);

Наблюдательные;

Описания случаев.

Продольные исследования:

Проспективные (наблюдательные, естественного развития, прогноза, причинных факторов и заболеваемости, неконтролируемого вмешательства, с преднамеренным вмешательством, нормальных вариаций, тяжести болезни, параллельные, последовательные, перекрестные, с самоконтролем, с внешним контролем);

Ретроспективные исследования типа «случай-контроль» (с преднамеренным вмешательством, наблюдательные, псевдопроспективные).

В поперечных, или одномоментных (cross-sectional), исследованиях интересующие параметры оцениваются однократно. Они позволяют оценить связь признаков, но не динамику развития анализируемого состояния. Это самые ненадежные с точки зрения их доказательности исследования, так как простое наблюдение за совокупностью данных может легко привести к ошибке.

В продольных (longitudinal, лонгитудинальными) исследованиях выделяют группы лиц, за которыми наблюдают в течение некого промежутка времени и обязательно хотя бы раз повторно оценивают у них интересующие (мониторируемые) показатели. Длительность наблюдения может быть любой и определяется здравым смыслом и реальной возможностью изменения показателя (например, при хронической сердечной недостаточности изменение фракции выброса возможно уже через несколько дней лечения, а уменьшение гипертрофии левого желудочка не ранее чем через три месяца).

Отслеживание изменения показателей в специально сформированной группе осуществляется в проспективных (prospective) исследованиях. В популяционных проспективных (когортных) исследованиях наблюдение ведется за большой по численности выборкой пациентов из популяции. В них отслеживается появление новых заболеваний, осложнения при уже имеющейся патологии (исследования естественного развития заболеваний.

Проспективные исследования являются наиболее доказательными, (но дорогостоящими), так как в них имеется четкое определение наблюдаемой группы, патологии, критериев диагностики, методов обследования и мониторируемых показателей до начала исследования, что существенно уменьшает риск систематической ошибки.

Преднамеренное вмешательство в естественное течение заболевания в проспективных исследованиях применяется для оценки

эффективности и безопасности при изучении средств диагностики, профилактики и лечения.

При ретроспективном продольном исследовании проводится анализ имеющихся данных в первичной медицинской документации. Недостатком таких исследований является необходимость обнаружения практически всех пациентов с интересующей патологией или вмешательством за большой промежуток времени, невозможность формирования однородных групп, разная полнота обследования и использование различных диагностических приборов. Однако в этих исследованиях подкупает доступность первичного материала, отсутствие биоэтических проблем, оперативность и низкая стоимость.

Вариантом ретроспективного продольного исследования являются исследования типа «случай-контроль» (ИСК, case-control studies) в котором сопоставляют частоту встречаемости некого анализируемого фактора в исследуемой и контрольной группах. Если этот встречается реже или чаще, то можно предположить, что он связан с патологией. Считается, что этот вариант исследований является более современной формой научного осмысления обычной медицинской практики, его методология постоянно совершенствуется. Помимо простоты, малозатратности и несмотря на достаточно низкую степень доказательности, этот метод исследований является единственно приемлемым для редких заболеваний.

Литература

1. Antman E.M., Lau J., Kupelnick B., Mosteller F., Chalmers I. A comparison of results of meta-analysis of randomised control trials and recommendations of clinical experts. Treatment for myocardial infarction. JAMA 1992; 268: 240-8.

2. Bobbio M., Demichelis B., Giustetto G. Completeness of reporting trial results: effect on physicians" willingness to presciibe. Lancet 1994; 343:

3. Chalmers I., Altman D.G. Systematic reviews. London: BMJ Publishing Group; 1995: 1.

4. Chatellier G., Zapletal E., Lemaitre D., Menard J., Degoulet P. The number needed to treat: a clinically useful nomogram in its proper context. BMJ 1996;

5. Cook R.J., Sackett D.L. The number needed to treat: a clinically useful measure of treatment effect. BMJ 1995; 310: 452-4.

6. DerSimonian R., Laird N. Meta-analysis in clinical trials. Control Clin Trials 1986; 7: 177-88.

7. Dickersin K., Hewitt P., Mutch L., Chalmers I., Chalmers T.C. Perusing the literature: comparison of MEDLINE searching with a perinatal trials

database. Controlled Clinical Trials 1985; 6: 306-17.

8. Ellis J., Mulligan I., and Sacket D.L. Inpatient general medicine is

evidence based. Lancet 1995; 346: 407-10.

9. Fahey T., GriffithsS., Peters T.J. Evidence based purchasing; understanding results of clinical trials and systematic reviews. BMJ 1995; 311: 1056-60.

10. Last J..M. A dictionary of epidemiology. New York: Oxford University

Press; 1988: 81.

11. Lau J., Ioannidis J.P.A., Schmid C.H. Quantitative synthesis in systematic

reviews. Ann Intern Med 1997; 127:820-826.

12. Laupacis A., Sackett D.L., Roberts R.S. An assessment of clinically useful measures of the consequences of treatment. N Engl J Med 1988; 318:

13. Lubsen J. Mega-trials: is meta-analysis an alternative? Eur J Clin

Pharm 1996; 49: 29-33.

14. Mantel N., Haenszel W. Statistical aspects of the analysis of data from retrospective studies of disease. J Natl Cancer Inst 1959; 22: 719-48.

15. McQuay J., Moore R. A. Using numerical results from systematic reviews in clinical practice. Ann Intern Med 1997; 126: 712-20.

16. Mohiuddin A.A., Bath F.J, Bath P.M.W. Theophylline, aminophylline, caffeine and analogues, in acute ischaemic stroke. (Cochrane Review). In: The Cochrane Library. Oxford, Updated Software; 1998 Issue 2: Updated quarterly.

17. Naylor C.D., Chen E., Strauss B. Measured enthusiasm; does the method of reporting trial results alter perceptions of therapeutic effectiveness? Ann

Intern Med 1992; 117: 916-21.

18. Sackett D., Richardson W.S., Rosenberg W., Haynes B. Evidence Based Medicine. London: Churchill Livingstone; 1996.

19. Sackett D.L., Decks J.J., Altman D.G. Down with odds ratios! Evidence-

Based Medicine 1996; 1: 164-6.

20. Sinclair J.C., Bracken M.B. Clinically useful measures of effect in binary analyses of randomized trials. J Clin Epidemiol 1994; 47: 881-9.

21. The Cochrane Collaboration Handbook Version 3.0.2, 1997.

ПРИЛОЖЕНИЕ 1

Oxford Centre for Evidence-based Medicine Levels of Evidence

Одним из важнейших инструментов доказательной медицины является статистика .

Медицинская общественность долго не желала признавать этих достижений, отчасти потому, что статистика приуменьшала значение клинического мышления. Подобный подход ставил под сомнение компетентность врачей, опирающихся на постулаты неповторимости каждого больного, и, следовательно, неповторимости выбранной терапии. Особенно это было заметно во Франции - стране, которая подарила миру множество исследователей, изучавших проблемы вероятности: Пьера де Ферма, Пьера-Симона Лапласа, Авраама де Муавра, Блеза Паскаля и Симеона Дениса Пуассона. В 1835 г. уролог Ж. Сивиаль опубликовал статью, из которой следовало, что после бескровного удаления камней мочевого пузыря выживают 97% больных, а после 5175 традиционных операций выжили только 78% больных. Французская академия наук назначила комиссию врачей, для того, чтобы проверить данные статьи Ж. Сивиаля. В отчёте этой комиссии было высказано и обосновано мнение о нецелесообразности применения статистических методов в медицине: «Статистика, прежде всего, отрешается от конкретного человека и рассматривает его в качестве единицы наблюдения. Она лишает его всякой индивидуальности для того, чтобы исключить случайные влияния этой индивидуальности на изучаемый процесс или явление. В медицине такой подход неприемлим». Однако, дальнейшее развитие медицины и биологии показало, что в действительности статистика является мощнейшим инструментом этих наук.

Отрицательное отношение к использованию статистики в медицине культивировалось и в СССР в период лысенковшины. После августовской сессии ВАСХНИЛ 1948г. гонению подверглась не только генетика, но и статистика, как один из основных инструментов генетики. В 50-е годы 20 века ВАК СССР даже отказывала в присуждении учёных степеней кандидата и доктора медицинских наук под предлогом использования в диссертациях «буржуазной» статистики.

К середине 19 века «… уже были разработаны основные принципы статистики и известно понятие вероятности событий. В книге «Общие принципы медицинской статистики» Жюль Гавар применил их к медицине. Эта книга замечательна тем, что в ней впервые подчеркивалось, что вывод о преимуществе одного метода лечения перед другим должен основываться не только на умозрительном заключении, но вытекать из результатов, полученных в процессе непосредственного наблюдения достаточного количества больных, получавших лечение по сравниваемым методикам. Можно сказать, что Гавар фактически разработал статистический подход, на котором в наши дни основывается доказательная медицина.

Появлению доказательной медицины, как направления медицинской науки и практики, способствовали две основные причины. Во-первых, это резкий рост объёма доступной информации, которая перед использованием на практике нуждается в критическом анализе и обобщении. Вторая причина носит чисто экономический характер. Рациональность расходования финансовых ресурсов в медицинской науке и практике напрямую зависит от результатов исследований, которые должны проверять эффективность и безопасность методик диагностики, профилактики и лечения в клинических исследованиях. Врачу приходится иметь дело с конкретным больным и всякий раз задавать себе вопрос: можно ли, и если да, то в какой степени распространить результаты, полученные в клиническом испытании, на данного пациента? Допустимо ли считать данного конкретного больного «средним»? Дело врача определить, подходят ли результаты, полученные в том или ином контролируемом исследовании, к клинической ситуации, с которой он столкнулся».

В здравоохранении, как в системе организации медицинской помощи населению, а также в профилактической и клинической медицине повсеместно используются различные численные методы. Они применяются в клинической практике, когда врач имеет дело с отдельным больным, в организации медико-социальной помощи населению при прогнозировании и оценке результатов тех или иных медико-социальных программ. Знание этих методов необходимо при планировании и проведении научных исследований, для правильного понимания их результатов, критической оценки публикуемых данных. Понимает врач это или нет, но в основе решения любого вопроса о применении способа, тактики лечения или профилактики патологии лежат численные методы. Исторически сложилось так, что большой набор численных методов, применяемых в медицине, получил общее название -статистика.

По своей природе термин статистика имеет несколько толкований. Наиболее примитивное из них подразумевает под статистикой всякий упорядоченный набор числовых характеристик какого-либо явления. Считается, что корни терминастатистика происходят от латинского слова «статус»(status) - Состояние. Несомненна связь и с итальянским «государство». Собирание данных о материальном состоянии населения, случаях рождений и смерти, по свидетельству древнегреческого историка Геродота, существовало в Персии уже за 400 лет до Рождества Христова. В Ветхом Завете Библии есть целая глава (Книга чисел), посвященная таким статистическим выкладкам.

В эпоху возрождения в Италии появились люди, которых называли «Statisto» - знаток государства. Как синоним терминовполитическая арифметика и государствоведние термин статистик, стал впервые употребляться с середины ХVIIвека.

В медицинской статистике, как отрасли знаний, нередко выделяют: статистику клиническую, онкологическую статистику инфекционной заболеваемости, заболеваемости особо опасными инфекциями и т. д. Многообразие этих разделов медицинской статистики определяется многообразием разделов медицины как науки и разнообразием видов конкретной практической деятельности медиков. Все разделы медицинской статистики тесно между собой взаимосвязаны, имеют единую методическую основу, и их деление во многих случаях является весьма условным.

Математическая статистика , как отрасль знаний, представляет собой специальную научную дисциплину и соответствующую ей учебную дисциплину. Предмет этой дисциплины - явления оценка которых может производиться только в массе наблюдений. Эта ключевая особенность обусловлена тем, что изучаемые статистикой явления не имеют постоянных, всегда одних и тех же исходов.Например: масса тела даже у одного и того же человека постоянно меняется, состав клеточных элементов крови при каждом заборе анализа у одного и того же пациента будет несколько различаться, последствия применения одного и того же препарата у разных людей могут иметь свои индивидуальные особенности, и т. п. Однако многие хаотичные на первый взгляд явления имеют на самом деле вполне упорядоченную структуру и, соответственно, могут, иметь вполне конкретные численные оценки. Главное условие для этого - статистическая регулярность, статистическая устойчивость этих явлений, то есть существование строго определенных закономерностей, пусть даже скрытых на первый взгляд, которые можно описать математическими методами статистики.

Фактором, оказавшим значительное влияние на развитие математических методов статистики, стало открытие закона больших чисел Яковом Бернулли (1654-1705) и появление теории вероятности, основы которой разработал французский математик и астроном Пьер Симон Лаплас (1749-1827). Заметным этапом в ряду этих событий для медицинской статистики стала публикация работ бельгийского ученого А. Кетле (1796-1874), впервые применившего на практике математико-статистические методы исследования. В своей работе «О человеке и развитии его способностей» А. Кетле вывел тип среднего человека, наделенного, наряду со средними показателями физического развития (рост, вес), средними умственными способностями и средними моральными качествами. В этот же период времени в России выходит работа врача Бернулли «О прививках против оспы: о смерти и теории вероятности».

Медицинская статистика как точка приложения методов математической статистики занимает особое место. Это особое место обусловлено большой ролью медицины в возникновении статистики как самостоятельной науки и существенным влиянием научно-исследовательских разработок медико-биологических проблем на появление многих методов статистического анализа. В настоящее время, с целью подчеркнуть особый статус медико-биологической математической статистики, для ее обозначения все чаще используют терминбиометрия.

Большинство методов статистического анализа являются универсальными и могут применяться не только в разных отраслях медицинской статистики, но и в самых разнообразных отраслях человеческой деятельности. Например, с точки зрения формальной логики статистический прогноз инфекционной заболеваемости и прогноз курса доллара - одна и та же задача.

Методы медицинской статистики можно разделить на следующие группы:

    Сбор данных, который может быть пассивным (наблюдение) или активным (эксперимент).

    Описательная статистика, которая занимается описанием и представлением данных.

    Сравнительная статистика, которая позволяет проводить анализ данных в исследуемых группах и сравнение групп между собой с целью получения определенных выводов. Эти выводы могут быть сформулированы в виде гипотез или прогнозов.

Проблемы здоровья и экологии

12. American Society of Echocardiography minimum standards for the cardiac sonographer: a position paper / S. M. Bierig // J Am Soc Echocardiogr. - 2006. - Vol. 19. - P. 471-474.

13. Antihypertensive drug therapy for mild to moderate hypertension during pregnancy / E. Abalos // The Cochrane Library Syst. Rev. - 2001. - Issue 4.

14. Antihypertensive drugs in pregnancy and fetal growth: evidence for «pharmacological programming» in the first trimester? / H. Bayliss // Hypertens Pregnancy. - 2002. - Vol. 21. - P. 161-174.

15. Antihypertensive therapy in the management of hypertension in pregnancy - a clinical double-blind study of pindolot / G. Bott-Kanner G. // Clin Exp Hypertension Pregnancy. - 1992. - Vol. 11. - P. 207-220.

16. Atenolol and fetal growth in pregnancies complicated by hypertension / C. Lydakis // Am. J. Hypertens. - 1999. - № 12. - P. 541-547.

17. Australasian Society for the Study of Hypertension in Pregnancy: The detection, investigation and management of hypertension in pregnancy: full consensus statement / M. A. Brown // Am. J. Gynecol. - 2000. - Vol. 40. - P. 139-155.

18. Butters, L. Atenolol in essential hypertension during pregnancy / L. Butters, S. Kennedy, P. C. Rubin // Br. Med. J. - 1990. - Vol. 301. - P. 587-589.

19. Collins, R. Pharmacological prevention and treatment of hypertensive disorders in pregnancy / R. Collins, H.C. S. Wallenburg // Effective Care in Pregnancy and Childbirth / eds. I. Chalmers, M Enkin, M.J.N.C. Keirse. - Oxford: Oxford University Press, 1989. - P. 512-533.

20. Effect of atenolol on birthweight / G. Y. Lip // Am. J. Cardiol. - 1997. - Vol. 79. - P. 1436-1438.

21. Effects of methyldopa on uteroplacental and fetal hemodynamics in pregnancy-induced hypertension / S. Montan // Am. J. Obstet. Gynecol. - 1993. - Vol. 168. - P. 152-156.

22. Fall in mean arterial pressure and fetal growth restriction in pregnancy hypertension: a meta-analysis / P. von Dadelszen // Lancet. - 2000. - Vol. 355. - P. 87-92.

23. Gallery, E.D.M. Antihypertensive treatment in pregnancy: analysis of different responses to oxprenolol and methyldopa /

E.D.M. Gallery, M. Ross, A. Z. Gyory // Br. Med. J. - 1985. - Vol. 291. - P. 563-566.

24. Gluckman, P. D. Maternal constraint of fetal growth and its consequences / P. D. Gluckman, M. A. Hanson // Semin Fetal Neonatal Med. - 2004. - Vol. 9, № 5. - P. 419-425.

25. Guidelines Committee. 2003 European Society of Hypertension - European Society of Cardiology guidelines for the management of arterial hypertension // J. Hypertens. - 2003. - Vol. 21, № 6. - P. 1011-1053.

26. Magee, L. A. Fortnightly review: management of hypertension in pregnancy / L. A. Magee, M. P. Ornstein, P. von Dadelszen // BMJ. - 1999. - Vol. 318, Issue 7194. - P. 1332-1336.

27. Magee, L. A. Oral beta-blockers for mild to moderate hypertension during pregnancy (Cochrane Review) / L. A. Magee, L. Duley // Cochrane Database Syst. Rev. - 2002. - Issue 1.

28. Preeclampsia - a state of sympathetic overactivity / H. P. Schobel // N. Engl. J. Med. - 1996. - Vol. 335. - P. 1480-1485.

29. Prevention of preeclampsia: a randomized trial of atenolol in hyperdynamic patients before onset of hypertension / T. R. Easterling // Obstet. Gynecol. - 1999. - Vol. 93. - P. 725-733.

30. Report of the National High Blood Pressure Education Program Working Group on High Blood Pressure in Pregnancy / R. W. Gifford // Am. J. Obstet. Gynecol. - 2000. - Vol. 183, № 1. - P. 1-22.

31. The Task Force for the Management of Arterial Hypertension of the European Society of Hypertension and of the European Society of Cardiology / G. Mancia // Eur. Heart J. - 2007. - Vol. 28. - P. 1462-1536.

32. The Task Force on the Management of Cardiovascular Diseases During Pregnancy on the European Society of Cardiology. Expert consensus document on management of cardiovascular diseases during pregnancy // Eur. Heart. J. - 2003. - Vol. 24. - P. 761-781.

33. Use of antihypertensive medications in pregnancy and the risk of adverse perinatal outcomes: McMaster outcome study of hypertension in pregnancy 2 (MOS HIP 2) / J.G. Ray // BMC Pregnancy Childbirth. - 2001. - № 1. - P.6.

34. World Health Organization - International Society of Hypertension 1999 Guidelines for the Management of Hypertension // High Blood Press. - 1999. - Vol. 8. - P. 1^3.

Поступила 29.10.2008

ИСПОЛЬЗОВАНИЕ ДАННЫХ ДОКАЗАТЕЛЬНОЙ МЕДИЦИНЫ В КЛИНИЧЕСКОЙ ПРАКТИКЕ (сообщение 3 - ДИАГНОСТИЧЕСКИЕ ИССЛЕДОВАНИЯ)

А. А. Литвин2, А. Л. Калинин1, Н. М. Тризна3

1Гомельский государственный медицинский университет 2Гомельская областная клиническая больница 3Белорусский государственный медицинский университет, г. Минск

Важным аспектом доказательной медицины является полнота и точность представления данных. Целью статьи является краткий обзор принципов доказательной медицины в исследованиях, посвященных точности диагностических тестов.

Диагностические тесты используются в медицине, чтобы установить диагноз, степень тяжести и особенности течения заболевания. Диагностическая информация получается из множества источников, включая субъективные, объективные, специальные методы исследования. Эта статья основывается на описании данных об измерении качества исследований, преимуществ различных способов итоговой статистики c помощью метода логистической регрессии и ROC-анализа.

Ключевые слова: доказательная медицина, диагностические тесты, логистическая регрессия, ROC-анализ.

USE OF DATA OF EVIDENCE BASED MEDICINE IN CLINICAL PRACTICE (report 3 - DIAGNOSTIC TESTS)

A. A. Litvin2, A. L. Kalinin1, N. M. Trizna3

1Gomel State Medical University 2Gomel Regional Clinical Hospital 3Belarus State Medical University, Minsk

A prominent aspect of evidence based medicine is completeness and accuracy of data presentation. Article purpose is the short review of principles of evidence based medicine in the researches devoted to accuracy of diagnostic tests.

Проблемы здоровья и экологии

Diagnostic tests are used in medicine to screen for diagnose, grade, and monitor the progression of disease. Diagnostic information is obtained from a multitude of sources, including sings, symptoms and special investigations. This article concentrates on the dimensions of study quality and the advantages of different summary statistics with logistic regression and ROC-analysis.

Key words: evidence based medicine, diagnostic tests, logistic regression, ROC-analysis.

Когда врач на основании данных анамнеза и обследования пациента выносит суждение о диагнозе, он редко бывает в нем полностью уверен. В связи с этим более целесообразно говорить о диагнозе с точки зрения его вероятности. Все еще очень часто эта вероятность выражается не в форме процентов, а с помощью таких выражений, как «почти всегда», «обычно», «иногда», «редко». Поскольку разные люди вкладывают различную степень вероятности в одни и те же термины, это ведет к возникновению недопонимания между врачами или между врачом и пациентом . Врачам следует как можно более точно давать свои заключения и, если это осуществимо, использовать для выражения вероятности количественные методы .

Хотя наличие таких количественных показателей было бы очень желательно, они обычно отсутствуют в клинической практике. Даже опытные клиницисты часто не в состоянии точно определить вероятность развития тех или иных изменений. Имеется тенденция к гипердиагностике относительно редких заболеваний. Особенно трудно бывает количественно оценить вероятность, которая может быть очень высокой или очень низкой .

Поскольку установление достоверных диагностических критериев является краеугольным камнем клинического мышления, для разработки статистических подходов к улучшению диагностического предвидения используется накопленный клинический опыт, который в идеале должен быть представлен в форме компьютерных банков данных . В подобных исследованиях обычно идентифицируют фак-

торы, находящиеся в корреляции с тем или иным диагнозом. Затем эти данные могут быть включены в многофакторный анализ, что позволяет определить, какие из них являются достоверными независимыми предикторами диагноза. Некоторые виды анализа позволяют идентифицировать важные факторы предсказания диагноза и затем определить их «вес», который может быть при дальнейшем математическом расчете трансформирован в вероятность. С другой стороны, анализ позволяет выделить ограниченное число категорий пациентов, каждая из которых имеет собственную вероятность наличия того или иного диагноза .

Эти количественные подходы к постановке диагноза, которые часто называют «правилами предсказания», особенно полезны, если они представлены в удобном для использования виде и если их ценность была широко изучена на достаточном числе и спектре пациентов. Чтобы такие правила предсказания могли оказать реальную помощь клиницистам, они должны быть разработаны на представительных группах больных с использованием доступных воспроизводимых тестов для того, чтобы полученные результаты могли быть применены в медицинской практике повсеместно .

В связи с этим чрезвычайно важно знать несколько наиболее часто используемых при анализе результатов исследований и в эпидемиологии терминов, включая распространенность, чувствительность, специфичность, положительную предсказательную ценность и отрицательную предсказательную ценность (таблица 1) .

Таблица 1 - Систематические термины, наиболее часто используемые в диагностических исследованиях

имеется отсутствует

Положительные а (истинноположительные) б (ложноположительные)

Отрицательные в (ложноотрицательные) г (истинноотрицательные)

Распространение (априорная вероятность) = (а+в) / (а+б+в+г) = число больных / общее число обследованных

Чувствительность (sensitivity) = а / (а+в) = число истинноположительных результатов / общее число больных

Специфичность (specificity) = г / (б+г) = число истинноотрицательных результатов / число пациентов без данного заболевания

Частота ложноотрицательных результатов = в / (а+в) = число ложноотрицательных результатов / общее число больных

Частота ложноположительных результатов = б / (б+г) = число ложноположительных результатов / число пациентов без данного заболевания

Проблемы здоровья и экологии

Окончание таблицы 1

Результаты теста Патологическое состояние

имеется отсутствует

Положительная предсказательная ценность (positive predictive value) = а / (а+б) = число истинноположительных результатов / число всех положительных результатов

Отрицательная предсказательная ценность (negative predictive value) = г / (в+г) = число истинноотрицательных результатов / число всех отрицательных результатов

Общая точность (accuracy) = (а+г) / (а+б+в+г) = число истинноположительных и истинноотрицательных результатов / число всех результатов

Отношение правдоподобия положительного результата (likelihood ratio of a positive test) - = чувствительность / (1 - специфичность)

Отношение правдоподобия отрицательного результата теста (likelihood ratio of a negative test) - = 1 - чувствительность / специфичность

Вопросы, на которые отвечают данные характеристики диагностического теста :

1) чувствительность - насколько хорош тест для выявления пациентов, имеющих данное состояние?

2) специфичность - насколько хорош тест для правильного исключения пациентов, не имеющих данного состояния?

3) прогностическая ценность положительного результата теста - если у человека тест положительный, какова вероятность того, что у него действительно есть данное заболевание?

4) прогностическая ценность отрицательного результата теста - если у человека тест отрицательный, какова вероятность того, что у него действительно нет данного заболевания?

5) индекс точности - какая часть всех тестов дала правильные результаты (т. е. истинноположительные и истинноотрицательные результаты по отношению ко всем)?

6) отношение правдоподобия положительного результата (likelihood ratio of a positive test) - насколько более вероятно то, что тест будет положительным у человека с заболеванием по сравнению со здоровым?

Поскольку только меньшая часть из правил предсказания соответствует строгим критериям, таким как число и спектр обследованных, а также проспективное подтверждение результатов, большинство из них непригодно для повседневного клинического использования. Более того, многие правила предсказания не могут оценить вероятность каждого диагноза или исхода, с которыми сталкивается клиницист. Тест, обладающий определенной чувствительностью и специфичностью, имеет различную положительную и отрицательную предсказательную ценность, если применяется в группах с различной распространенностью заболевания. Чувствительность и специфичность какого-либо теста не зависят от распростра-

ненности заболевания (или процента больных, у которых имеется заболевание, от всех обследованных пациентов), они зависят от состава группы пациентов, среди которых этот тест был использован .

В некоторых ситуациях неточное знание чувствительности и специфичности теста в изучаемой группе пациентов может ограничить его клиническую ценность. Поскольку врач редко знает (или может знать) популяцию пациентов, на которой назначаемый им тест был стандартизован, получаемые результаты обладают информацией намного менее достоверной, чем принято думать. Более того, для любого диагностического теста увеличение чувствительности будет сопровождаться снижением специфичности .

Модель с высокой чувствительностью часто дает истинный результат при наличии положительного исхода (обнаруживает положительные примеры). Наоборот, модель с высокой специфичностью чаще дает истинный результат при наличии отрицательного исхода (обнаруживает отрицательные примеры). Если рассуждать в терминах медицины - задачи диагностики заболевания, где модель классификации пациентов на больных и здоровых называется диагностическим тестом, то получится следующее: 1) чувствительный диагностический тест проявляется в гипердиагностике - максимальном предотвращении пропуска больных; 2) специфичный диагностический тест диагностирует только доподлинно больных . Поскольку нельзя ожидать, что какая-либо величина или производный показатель в отдельности могли бы обладать одновременно превосходной чувствительностью и специфичностью, часто бывает необходимо определить, какой показатель является наиболее ценным и необходимым для принятия решения. Графическое изображение, получившее название ROC-кривой

Проблемы здоровья и экологии

(рисунок 1), связывающей обсуждаемые характеристики теста, показывает неизбежность выбора между стремлением к высокой чувствительности и специфичности. Подобное графическое изображение свидетельствует о том, что результаты тестов могут быть определены как нормальные или патологические в зависимости от того, учитыва-

ется заболевание, если тест обладает высокой специфичностью, или исключается, если тест обладает высокой чувствительностью. Разные тесты могут обладать различной чувствительностью и специфичностью. Чувствительность и специфичность более достоверных тестов выше, чем недостоверных тестов .

Рисунок 1 - Графическое изображение внутреннего несоответствия чувствительности и специфичности

ROC-кривая (Receiver Operator Characteristic) - кривая, которая наиболее часто используется для представления результатов бинарной классификации в машинном обучении . Название пришло из систем обработки сигналов. Поскольку классов два, один из них называется классом с положительными исходами, второй - с отрицательными исходами. ROC-кривая показывает зависимость количества верно классифицированных положительных примеров от количества неверно классифицированных отрицательных примеров. В терминологии ROC-анализа первые называются истинноположительным, вторые - ложноотрицательным множеством. При этом предполагается, что у классификатора имеется некоторый параметр, варьируя который мы будем получать ту или иную разбивку на два класса. Этот параметр часто называют порогом, или точкой отсечения (cut-off value) .

ROC-кривая получается следующим образом. Для каждого значения порога отсечения, которое меняется от 0 до 1 с шагом, например, 0,01, рассчитываются значения чувствительности Se и специфичности Sp. В качестве альтернативы порогом может являться каждое последующее значение примера в выборке. Строится график зависимости: по оси Y откладывается чувствительность Se, по оси X - 100% - Sp (сто процентов минус специфичность) . В результате вырисовывается некая кривая (рисунок 1). График часто дополняют прямой y = х.

Для идеального классификатора график ROC-кривой проходит через верхний левый

угол, где доля истинноположительных случаев составляет 100 %, или 1,0 (идеальная чувствительность), а доля ложноположительных примеров равна нулю. Поэтому чем ближе кривая к верхнему левому углу, тем выше предсказательная способность модели. Наоборот, чем меньше изгиб кривой и чем ближе она расположена к диагональной прямой, тем менее эффективна модель. Диагональная линия соответствует «бесполезному» классификатору, т. е. полной неразличимости двух классов .

При визуальной оценке ROC-кривых расположение их относительно друг друга указывает на их сравнительную эффективность. Кривая, расположенная выше и левее, свидетельствует о большей предсказательной способности модели. Так, на рисунке 2 две ROC-кривые совмещены на одном графике. Видно, что модель A лучше.

Визуальное сравнение кривых ROC не всегда позволяет выявить наиболее эффективную модель. Своеобразным методом сравнения ROC-кривых является оценка площади под кривыми. Теоретически она изменяется от 0 до 1,0, но поскольку модель всегда характеризуются кривой, расположенной выше положительной диагонали, то обычно говорят об изменениях от 0,5 («бесполезный» классификатор) до 1,0 («идеальная» модель). Эта оценка может быть получена непосредственно вычислением площади под многогранником, ограниченным справа и снизу осями координат и слева вверху - экспериментально полученными точками (рисунок 3). Численный показатель площади под кривой называется AUC (Area Under Curve).

Проблемы здоровья и экологии

Рисунок 2 - Сравнение ROC-кривых

Рисунок 3 - Площадь под ROC-кривой

С большими допущениями можно считать, что чем больше показатель AUC, тем лучшей прогностической силой обладает модель. Однако следует знать, что показатель AUC предназначен скорее для сравнительного анализа нескольких моделей; AUC не содержит ника-

кой информации о чувствительности и специфичности модели .

В литературе иногда приводится следующая экспертная шкала для значений AUC, по которой можно судить о качестве модели (таблица 2) .

Таблица 2 -Экспертная шкала значений AUC

Интервал AUC Качество модели

0,9-1,0 Отличное

0,8-0,9 Очень хорошее

0,7-0,8 Хорошее

0,6-0,7 Среднее

0,5-0,6 Неудовлетворительное

Идеальная модель обладает 100% чувствительностью и специфичностью. Однако на практике добиться этого невозможно, более того, невозможно одновременно повысить и чувствительность, и специфичность модели.

Компромисс находится с помощью порога отсечения, т.к. пороговое значение влияет на соотношение Se и Sp. Можно говорить о задаче нахождения оптимального порога отсечения (optimal cut-off value) (рисунок 4) .

Рисунок 4 - «Точка баланса» между чувствительностью и специфичностью

Проблемы здоровья и экологии

Порог отсечения нужен для того, чтобы применять модель на практике: относить новые примеры к одному из двух классов. Для определения оптимального порога нужно задать критерий его определения, т.к. в разных задачах присутствует своя оптимальная стратегия. Критериями выбора порога отсечения могут выступать: 1) требование минимальной величины чувствительности (специфичности) модели. Например, нужно обеспечить чувствительность теста не менее 80 %. В этом случае оптимальным порогом будет максимальная специфичность (чувствительность), которая достигается при 80 % (или значение, близкое к

нему «справа» из-за дискретности ряда) чувствительности (специфичности) .

Приведенные теоретические данные лучше воспринимаются на примерах из клинической практики. Первый пример, на котором мы остановимся, будет диагностика инфицированного панкреонекроза (набор данных взят из базы данных ). Обучающая выборка содержит 391 запись с выделением 12 независимых переменных в следующем формате (таблица 3). Зависимая переменная (1 - наличие заболевания, 0 - отсутствие). Распределение зависимой переменной следующее: 205 случаев - отсутствие заболевания, 186 - его наличие.

Таблица 3 - Независимые переменные для диагностики инфицированного панкреонекроза, коэффициенты логистической регрессии (пример)

Независимые переменные Формат данных Коэффициент, %

Число дней от начала заболевания > 14 < 14 2,54

Число дней, проведенных больным на лечении в ОАРИТ > 7 < 7 2,87

Частота сердечных сокращений числовое значение 1,76

Частота дыхания числовое значение 1,42

Температура тела числовое значение 1,47

Лейкоциты крови числовое значение 1,33

Лейкоцитарный индекс интоксикации числовое значение 1,76

Мочевина крови числовое значение 1,23

Общий белок плазмы крови числовое значение 1,43

Адекватная антибиотикопрофилактика при установлении диагноза тяжелого острого панкреатита да/нет -1,20

Выполнение миниинвазивных лечебно-профилактических операций да/нет -1,38

Наличие отрицательной динамики да/нет 2,37

На рисунке 4 изображена полученная ROC- можно охарактеризовать как очень хорошую, кривая. Предсказательную способность модели AUC = 0,839.

Рисунок 4 - ROC-кривая диагностической модели инфицированного панкреонекроза

Проблемы здоровья и экологии

Рассмотрим фрагмент массива точек «чув- ня внутрибрюшного давления у больных тяже-

ствительшсть-специфичшсть» на примере уров- лым острым панкреатитом .

Таблица 4 - Чувствительность и специфичность различных уровней ВБД для прогнозирования развития ИПН (пример)

ВБД, мм рт. ст. Чувствительность, % Специфичность, % Se + Sp Se - Sp

13,5 25 100 125 75

14,5 30 95 125 65

15,5 40 95 135 55

16,5 65 95 160 30

17,5 80 90 170 10

18,5 80 80 160 0

19,5 80 70 150 10

20,5 85 65 150 20

21,5 95 55 150 40

23,0 100 45 145 55

24,5 100 40 140 60

25,5 100 25 125 75

Как видно из таблицы, оптимальным пороговым уровнем ВБД у больных острым деструктивным панкреатитом, обеспечивающим максимум чувствительности и специфичности теста (или минимум ошибок I и II рода), является 17,5 ± 2,3 (M ± SD) мм рт.ст., при котором отмечается 80 % чувствительность и 90 % специфичность метода для определения вероятности развития инфекционных осложнений пан-креонекроза. Чувствительность равна 80 % - это означает, что у 80 % пациентов с инфицированным панкреонекрозом диагностический тест положителен. Специфичность равна 90 %, следовательно, у 90 % пациентов, у которых нет инфицированного панкреонекроза, результаты теста являются отрицательными. Точкой баланса, в которой чувствительность и специфичность примерно совпадают - 80 %, является 18,5. В целом положительная прогностическая ценность измерения ВБД составила 86 %, отрицательная прогностическая ценность - 88 %.

Проведение логистической регрессии и ROC-анализа возможно с использованием статистических пакетов . Однако «Statistica» 6 и 7 (http://www.statistica.com) проводят данный анализ только с использованием блока «Искусственные нейронные сети» . В SPSS (http://www. spss.com) (начиная с 13 версии) ROC-анализ дан только в графическом модуле и анализируется одна ROC-кривая. В SPSS выводится значение площади под кривой (AUC), уровень значимости и значение чувствительности и специфичности в каждой точке измерения. Оптимальную точку (optimal cut-off) необходимо находить самим из таблицы чувствительности и 1-специфичность . Программа MedCalc проведет сравнение нескольких ROC-кривых, в таблице пометит значение переменной, при

которой соотношение чувствительности и специфичности оптимально (optimal cut-off). В SAS (http://www.sas.com) также, как и R-Commander есть модуль сравнения кривых и нахождения точек, AUC. Логистическая регрессия и ROC-анализ есть в бесплатной программе WINPEPI (PEPI-for-Windows) (http://www.brixtonhealth. com/ winpepi.zip) .

Заключение

Искусство диагностики постоянно совершенствуется. Ежедневно появляются новые диагностические тесты, а технология существующих методов изменяется. Переоценка точности соответствующих исследований, в частности, в результате возникновения систематической ошибки, связанной с недобросовестной практикой исследований и публикаций, может привести к преждевременному внедрению диагностических тестов и принятию неправильных клинических решений. Тщательная оценка диагностических тестов до их широкого применения не только снижает риск развития неблагоприятных исходов, обусловленных ошибочными представлениями об информативности метода, но также может ограничить расходование ресурсов здравоохранения за счет отказа от ненужных обследований. Неотъемлемой частью оценки диагностических тестов являются исследования, посвященные точности диагностических тестов, самыми информативными из которых являются метод логистической регрессии и ROC-анализ.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Гринхальх, Т. Основы доказательной медицины / Т. Грин-хальх; пер. с англ. - М.: ГЭОТАР-Медиа, 2006. - 240 с.

Проблемы здоровья и экологии

3. Власов, В. В. Введение в доказательную медицину / В. В. Власов. - М. МедиаСфера, 2001. - 392 с.

4. Флетчер, Р. Клиническая эпидемиология. Основы доказательной медицины / Р. Флетчер, С. Флетчер, Э. Вагнер; пер. с англ. - М.: МедиаСфера, 1998. - 352 с.

5. Банержи, А. Медицинская статистика понятным языком: вводный курс / А. Бенержи; пер с англ. - М.: Практическая медицина, 2007. - 287 с.

6. Жижин, К. С. Медицинская статистика: учеб. пособие. - Ростов н/Д.: Феникс, 2007. - 160 с.

7. Deeks, J. J. Systematic reviews of evaluations of diagnostic and screening tests / J. J. Deeks // BMJ. - 2001. - Vol. 323. - P. 157-162.

8. Guidelines for meta-analyses evaluating diagnostic tests / L. Irwig // Ann. Intern. Med. - 1994. - Vol. 120. - P. 667-676.

9. Systematic reviews and meta-analysis for the surgeon scientist /

S. S. Mahid // Br. J. Surg. - 2006. - Vol. 93. - P. 1315-1324.

10. Meta-analytical methods for diagnostic test accuracy / L. Irwig // J. Clin. Epidemiol. - 1995. - Vol. 48. - P. 119-130.

11. Users" guides to the medical literature. How to use an article about a diagnostic test. A. Are the results of the study valid? / R. Jaeschke // JAMA. - 1994. - Vol. 271. - P. 389-391.

12. Use of methodological standards in diagnostic test research: getting better but still not good / M. C. Read // JAMA. - 1995. - Vol. 274. - P. 645-651.

13. StAR: a simple tool for the statistical comparison of ROC curves / I. E. Vergara // BMC Bioinformatics. - 2008. - Vol. 9. - P. 265-270.

14. A comparison of parametric and nonparametric approaches to ROC-analysis of quantitative diagnostic tests / K. O. Hajian-Tilaki // Medical Decision Making. - 1997. - Vol. 17, N. 1. - P. 94-102.

15. Receiver operator characteristic (ROC) curves and nonnormal data: An empirical study / M.J. Goddard // Statistics in Medicine. - 1989. - Vol. 9, N. 3. - P. 325-337.

16. Возможности прогнозирования инфицированного пан-креонекроза / А. А. Литвин [и др.] // Проблемы здоровья и экологии. - 2007. - Т. 12, № 2. - С. 7-14.

17. Метод мониторинга внутрибрюшного давления у больных тяжелым острым панкреатитом / А. А. Литвин [и др.] // Проблемы здоровья и экологии. - 2008. - Т. 16, № 2. - С. 80-85.

18. Comparison of eight computer programs for receiver-operating characteristic analysis / C. Stephan // Clin. Chem. - 2003. - Vol. 49, N. 3. - P. 433-439.

19. Zhu, X. A short preview of free statistical software packages for teaching statistics to industrial technology majors / X. Zxu // J. Ind. Technology. - 2005. - Vol. 21, N. 2. - P. 10-20.

20. Боровиков, В. STATISTICA: искусство анализа данных на компьютере. Для профессионалов / В. Боровиков. - СПб.: Питер, 2001. - 656 с.

21. Бююлъ, А. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей / А. Бююль. - СПб.: ДиаСофтЮП, 2002. - 608 с.

22. Abramson, J. H. WINPEPI (PEPI-for-Windows): computer programs for epidemiologists / J. H. Abramson, // Epidemiologic Perspectives & Innovations. - 2004. - Vol. 1, N. 6. - P. 1-10.

Поступила 24.10.2008

УДК 616.1:616-009.12:616-005.8:616.831-005.1

НЕКОТОРЫЕ ПОКАЗАТЕЛИ МИКРОЦИРКУЛЯЦИИ И ПОВРЕЖДЕНИЯ ЭНДОТЕЛИЯ В ОЦЕНКЕ РИСКА РАЗВИТИЯ ИНСУЛЬТОВ, ИНФАРКТОВ МИОКАРДА, ЛЕТАЛЬНЫХ ИСХОДОВ У БОЛЬНЫХ АРТЕРИАЛЬНОЙ ГИПЕРТЕНЗИЕЙ

В. И. Козловский, А. В. Акулёнок Витебский государственный медицинский университет

Цель исследования: выделение факторов, ассоциированных с повышением риска развития инфарктов миокарда, мозговых инсультов, летальных исходов у больных артериальной гипертензией (АГ) II степени.

Материал и методы: в исследование были включены 220 больных АГ II степени (средний возраст 57 ± 8,4 лет), которые госпитализировались в связи с гипертоническим кризом, и 30 человек без АГ (средний возраст

53,7 ± 9 лет).

Результаты: за 3,3 ± 1 лет наблюдения в группе больных АГ II степени зафиксировано 29 инсультов, 18 инфарктов миокарда, 26 летальных исходов. Повышение числа циркулирующих эндотелиальных клеток (ЦЭК), агрегации лейкоцитов, тромбоцитов, адгезии лейкоцитов у больных АГ было ассоциировано с повышением риска развития инфарктов миокарда, инсультов и летальных исходов.

Заключение: показатели числа ЦЭК, агрегации тромбоцитов и лейкоцитов, адгезии лейкоцитов можно использовать для выделения групп гипертензивных больных повышенного риска развития инфарктов миокарда, инсультов и летальных исходов, а также в создании комплексных моделей прогноза.

Ключевые слова: артериальная гипертензия, риск, инфаркт миокарда, инсульт, летальный исход, циркулирующие эндотелиоциты.

SOME FINDINGS OF MICROCIRCULATION AND ENDOTHELIAL DAMAGE IN ESTIMATION OF RISK FOR STROKES, MYOCARDIAL INFARCTIONS, LETHAL OUTCOMES IN HYPERTENSIVE PATIENTS

V. I. ^zlovsky, A. V. Akulionak Vitebsk Statel Medical University

Objective: to determine factors, associated with increased risk for development of strokes, myocardial infarctions, lethal outcomes in patients with arterial hypertension (AH) II degree.

Methods: 220 patients with AH II degree (mean age 57 ± 8,4 years), complicated by hypertensive crisis, and 30 persons without AH (mean age 53,7 ± 9 years) were followed-up for 3,3±1 years.

Results: elevation of number of circulating endothelial cells (CEC), aggregation of platelets and leukocytes, adhesion of leukocytes in hypertensive patients were associated with increased risk for development of strokes, myocardial infarctions, lethal outcomes.

Проблемы здоровья и экологии

диобиологии, проф. Е. Б. Бурлаковой. Эти данные формируют новые представления о биологической эффективности хронического воздействия излучений на человека и однозначно свидетельствуют о неправомочности экстраполяции эффектов больших доз ионизирующей радиации на область малых доз.

Развитие новых концепций важно для формирования взвешенных планов развития атомной энергетики и справедливой социальной политики по отношению к ликвидаторам Чернобыльской катастрофы и жителям загрязненных радионуклидами районов.

При оценке действия излучений на здоровье человека следует иметь в виду, что ионизирующая радиация - космогенный фактор среды обитания. Хорошо известно, что природный радиационный фон необходим для, роста, развития и существования разнообразных живых существ, в том числе млекопитающих. Понимание радиобиологических закономерностей связано с проникновением в суть феномена жизни, связи живого и космоса. Есть немало загадок в эффектах ионизирующей радиации, в том числе положительное или отрицательное воздействие облученных биологических объектов на необлученные. Представляет безусловный интерес мысль, высказанная А. М. Кузиным в его последней записке к сотрудникам: «Жизнь, живое тело - это метаболизирующая система структур на молекулярном уровне, составляющих единое целое благодаря информации, непрерывно доставляемой вторичным, биогенным излучением, возникающим под влиянием атомной радиации природного радиоактивного фона космического и земного происхождения».

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Кудряшов, Ю. Б. Радиационная биофизика. Ионизирующие излучения / Ю. Б. Кудряшов.- М.: изд. Моск. ун-та, 2004. - 580 с.

2. Ярмоненко, С. П. Радиобиология человека и животных / С. П. Ярмоленко, А. А. Вайнсон. - М.: Высш. шк., 2004. - 550 с.

3. Mothersill, C. Low-dose radiation effects: Experimental hematology and the changing paradigm / C. Mothersill, C. Seymour // Experimental Hematology. - 2003. - № 31. - С. 437-445.

4. Ли, Д.Е. Действие радиации на живые клетки / Д. Е. Ли. - М.: Госатомиздат, 1966. - 288 с.

5. Тимофеев-Ресовский, Н. В. Применение принципа попадания в радиобиологии / Н. В. Тимофеев-Ресовский, В. И. Иванов, В. И. Корогодин. - М.: Атомиздат, 1968. - 228 с.

6. Гончаренко, Е. Н. Химическая защита от лучевого поражения / Е. Н. Гончаренко. - М.: изд. Моск. ун-та, 1985. - 248 с.

7. Национальный доклад «20 лет после Чернобыльской катастрофы: последствия в Республике Беларусь и их преодоление» / Комитет по проблемам последствий катастрофы на Чернобыльской АЭС при Совете Министров Республики Беларусь; под ред. В. Е. Шевчука, В. Л. Гуравского. - 2006. - 112 с.

8. Vozianov, A. Health erects of Chornobyl accident, Eds / А Vozianov, V. Bebeshko, D. Bayka. - Kyiv.: «DIA», 2003. - 508 с.

9. Кузин, А. М. Структурно-метаболическая гипотеза в радиобиологии / А. М. Кузин. - М.: Наука, 1970. - 170 с.

10. Кузин, А. М. Структурно-метаболическая теория в радиобиологии / А. М. Кузин. - М.: Наука, 1986. - 20 с.

11. Князева, Е. Н. Основания синергетики / Е. Н. Князева, С. П. Курдимов. - СПб.: Изд-во Алетейя, 2002. - 31 с.

12. Степанова, С. И. Биоритмологические аспекты проблемы адаптации / С. И. Степанова. - М.: Наука,1986. - 244 с.

13. Немонотонность метаболического ответа клеток и тканей млекопитающих на воздействие ионизирующей радиации / И. К. Коломийцев [и др.] // Биофизика. - 2002. - Т. 47, Вып. 6. - С. 1106-1115.

14. Kolomiytseva, I. K. Nonmonotonous changes in metabolic parameters of tissues and cells under action ionizing radiation on animals / I. K. Kolomiytseva, Т. Р. Markevich, L. N. Potekhina // J. Biol. Physics. - 1999. - № 25. - С. 325-338.

15. Бурлакова, Е. Б. Новые аспекты закономерностей действия низкоинтенсивного облучения в малых дозах/ Е. Б. Бурлакова, А. Н. Голощапов, Г. П. Жижина, А. А. Конрадов // Радиац. биология. Радиоэкология. - 1999. - Т. 39. - С. 26-34.

Поступила 18.04.2008

ИСПОЛЬЗОВАНИЕ ДАННЫХ ДОКАЗАТЕЛЬНОЙ МЕДИЦИНЫ В КЛИНИЧЕСКОЙ ПРАКТИКЕ (обзор литературы)

А. Л. Калинин1, А. А. Литвин2, Н. М. Тризна1

1Гомельский государственный медицинский университет 2Гомельская областная клиническая больница

Приведен краткий обзор принципов доказательной медицины и мета-анализа. Важным аспектом доказательной медицины является определение степени достоверности информации.

Количественное объединение данных различных клинических исследований с помощью мета-анализа позволяет получить результаты, которые невозможно получить из отдельных клинических исследований. Чтение и изучение систематических обзоров и результатов мета-анализа позволяет более эффективно ориентироваться в большом количестве публикуемых статей.

Ключевые слова: доказательная медицина, мета-анализ.

Проблемы здоровья и экологии

USE OF DATA OF EVIDENCE BASED MEDICINE IN CLINICAL PRACTICE

(literature review)

A. L. Kalinin1, A. A. Litvin2, N. M. Trizna1

1Gomel State Medical University 2Gomel Regional Clinical Hospital

The purpose of article is the review of principles of evidence based medicine and the meta-analysis. A prominent aspect of evidence based medicine is definition of degree of reliability of the information.

Quantitative association of the given various clinical researches by means of the meta-analysis allows to receive results which cannot be received from separate clinical researches. Reading and studying of systematic reviews and results of the meta-analysis allows to be guided more effectively in a considerable quantity of published articles.

Key words: evidence based medicine, meta-analysis.

Ни один практический врач не обладает достаточным опытом, позволяющим свободно ориентироваться во всем многообразии клинических ситуаций. Можно полагаться на мнения экспертов, авторитетные руководства и справочники, однако это не всегда надежно из-за так называемого эффекта запаздывания: перспективные медицинские методы внедряются в практику спустя значительное время после получения доказательств их эффективности . С другой стороны, информация в учебниках, руководствах и справочниках зачастую устаревает еще до их публикации, а возраст проводящего лечение опытного врача отрицательно коррелирует с эффективностью лечения .

Время полужизни литературы отражает интенсивность прогресса. Для медицинской литературы этот период равен 3,5 лет . Только 1015% информации, публикуемой сегодня в медицинской печати, в дальнейшем будут иметь научную ценность. Ведь если предположить, что хотя бы 1% из публикуемых ежегодно 4 миллионов статей имеют какое-то отношение к лечебной практике врача, ему пришлось бы прочитывать каждый день около 100 статей. Известно, что только 10-20% всех медицинских вмешательств, использующихся в настоящее время, были основаны на надежных научных доказательствах .

Возникает вопрос: почему хорошие доказательные данные врачи не применяют на практике? Оказывается, что 75% врачей не понимают статистики, 70% не умеет критически оценивать опубликованные статьи и исследования . В настоящее время, чтобы практиковать доказательными данными, врач должен обладать знаниями, необходимыми для оценки достоверности результатов клинических испытаний, иметь оперативный доступ к различным источникам информации (прежде всего международным журналам), иметь доступ к электронным базам данных (Medline), владеть английским языком .

Целью этой статьи является краткий обзор принципов доказательной медицины и ее составляющей - мета-анализа, позволяющего более быстро ориентироваться в потоке медицинской информации.

Термин «Evidence Based Medicine» впервые был предложен в 1990 г. группой канадских ученых из Университета Мак Мастера в Торонто. Термин быстро прижился в англоязычной научной литературе, однако тогда еще не существовало четкого его определения. В настоящее время наиболее распространенным является следующее определение: «Доказательная медицина (evidence based medicine) - это раздел медицины, основанный на доказательствах, предполагающий поиск, сравнение, обобщение и широкое распространение полученных доказательств для использования в интересах больных» .

На сегодняшний день доказательная медицина (ДМ) - это новый подход, направление или технология сбора, анализа, обобщения и интерпретации научной информации. Доказательная медицина предусматривает добросовестное, объяснимое и основанное на здравом смысле использование наилучших современных достижений для лечения каждого пациента . Основная цель внедрения принципов доказательной медицины в практику здравоохранения - оптимизация качества оказания медицинской помощи с точки зрения безопасности, эффективности, стоимости и других значимых факторов.

Важным аспектом доказательной медицины является определение степени достоверности информации: результатов исследований, которые берут за основу при составлении систематических обзоров. Центр доказательной медицины в Оксфорде разработал следующие определения степени достоверности представляемой информации :

A. Высокая достоверность - информация основана на результатах нескольких независимых клинических испытаний (КИ) с совпадением результатов, обобщенных в систематических обзорах.

Проблемы здоровья и экологии

B. Умеренная достоверность - информация основана на результатах, по меньшей мере, нескольких независимых, близких по целям КИ.

C. Ограниченная достоверность - информация основана на результатах одного КИ.

D. Строгие научные доказательства отсутствуют (КИ не проводились) - некое утверждение основано на мнении экспертов.

Согласно современным оценкам, достоверность доказательств из разных источников не одинакова и убывает в следующем порядке :

1) рандомизированное контролируемое КИ;

2) нерандомизированное КИ с одновременным контролем;

3) нерандомизированное КИ с историческим контролем;

4) когортное исследование;

5) исследование типа «случай - контроль»;

6) перекрестное КИ;

7) результаты наблюдений;

8) описание отдельных случаев.

Тремя «китами» достоверности в клинической медицине являются: случайная слепая выборка испытуемых в группы сравнения (слепая рандомизация); достаточная величина выборки; слепой контроль (в идеале - тройной). Нужно специально подчеркнуть, что неправильный, но повсеместно употребляемый термин «статистическая достоверность» с его пресловутым р <... не имеет к вышеизложенному определению достоверности никакого отношения . Достоверные исследования свободны от так называемых систематических ошибок (возникающих от неправильной организации исследования), тогда как статистика (р <...) позволяет учесть лишь случайные ошибки .

В клинической медицине «золотым стандартом» процедуры проверки эффективности вмешательств и процедур стали рандомизированные контролируемые испытания (РКИ). Процесс «ослепления» участников испытания призван устранить систематическую ошибку субъективной оценки результата, ибо человеку свойственно видеть то, что он хочет, и не видеть того, чего он видеть не желает. Рандомизация должна решать проблему разнообразия испытуемых, обеспечивая генетическую полноту «абстрактного представителя генеральной совокупности», на которого потом можно переносить полученный результат. Специально проведенные исследования показали, что отсутствие рандомизации или ее неверное проведение приводят к переоценке эффекта до 150%, либо к его недооценке на 90% .

Чрезвычайно важно подчеркнуть, что технология РКИ позволяет получить четыре варианта ответов о действии вмешательства вообще без

знания его механизма. Оно позволяет обоснованно с позиций доказательной медицины утверждать, что вмешательство 1) действенно; 2) бесполезно; 3) вредно; или, в худшем случае, что 4) на сегодняшний день ничего об эффективности данного вида вмешательства сказать нельзя. Последнее происходит тогда, когда интересующее нас вмешательство, в силу малочисленности участников эксперимента, не позволило получить в РКИ статистически значимый результат .

Таким образом, ДМ отвечает на уже упомянутые вопросы: действует (вредно или полезно) / не действует (бесполезно) / неизвестно; но не отвечает на вопросы «каким образом и почему действует». На них может ответить только фундаментальное исследование. Иными словами, ДМ для своих целей может обойтись без фундаментальных исследований, тогда как фундаментальные исследования для внедрения своих результатов в повседневную медицинскую практику не могут обойтись без процедуры проверки эффекта по стандартам ДМ.

Для оптимизации анализа доказательной информации используют такие специальные методы работы с информацией, как систематический обзор и мета-анализ . Мета-анализ (metaanalysis) - применение статистических методов при создании систематического обзора в целях обобщения результатов, включенных в обзор исследований. Систематические обзоры иногда называют мета-анализом, если этот метод применялся в обзоре . Мета-анализ проводят для того, чтобы обобщить имеющуюся информацию и распространить ее в понятном для читателей виде. Он включает определение основной цели анализа, выбор способов оценки результатов, систематизированный поиск информации, обобщение количественной информации, анализ ее с помощью статистических методов, интерпретацию результатов .

Существует несколько разновидностей мета-анализа . Кумулятивный мета-анализ позволяет построить кумулятивную кривую накопления оценок при появлении новых данных. Проспективный мета-анализ - попытка разработки метаанализа планируемых испытаний. Такой подход может оказаться приемлемым в областях медицины, где уже существует сложившаяся сеть обмена информацией и совместных программ, например, разработанная ВОЗ электронная информационная система мониторинга качества стоматологической помощи населению «Oratel». На практике вместо проспективного мета-анализа часто применяют проспективно-ретроспективный мета-анализ, объединяя новые результаты с ранее опубликованными. Мета-анализ индивидуальных данных основан на изучении результатов лечения отдельных больных,

Проблемы здоровья и экологии

для его проведения необходимо сотрудничество многих исследователей и жесткое соблюдение протокола. В ближайшем будущем мета-анализ индивидуальных данных, вероятнее всего, будет ограничиваться изучением основных заболеваний, лечение которых требует крупномасштабных централизованных капиталовложений .

Главным требованием к информативному мета-анализу является наличие адекватного систематического обзора, в котором в котором изучаются результаты многочисленных исследований по определенной проблеме по алгоритму:

Выбор критериев для включения оригинальных исследований в мета-анализ;

Оценка гетерогенности (статистической неоднородности) оригинальных исследований;

Собственно мета-анализ (обобщенная оценка величины эффекта);

Анализ чувствительности выводов.

Результаты мета-анализа обычно представляют как график в виде точечных оценок с указанием доверительного интервала и отношения шансов ^dds ratio), суммарного показателя, отражающего выраженность эффекта (рисунок 1). Это позволяет показать вклад результатов отдельных исследований, степень неоднородности этих результатов и обобщенную оценку величины эффекта. Результаты мета-регрессионного анализа можно представить в виде графика, по оси абсцисс которого отложены значения анализируемого показателя, а по оси ординат - величина лечебного эффекта . Кроме того, следует указать результаты анализа чувствительности по ключевым параметрам (в том числе сравнение результатов применения моделей постоянных и случайных эффектов, если эти результаты не совпадают).

Рисунок 1 - Воронкообразный график, позволяющий выявить систематическую ошибку, связанную с преимущественным опубликованием положительных результатов исследования

На графике представлены данные метаанализа, посвященного оценке эффективности одного из методов лечения . Относительный риск (ОР) в каждом исследовании сопоставлен с размером выборки (весом исследования). Точки на графике группируются вокруг средневзвешенного значения ОР (показано стрелкой) в виде симметричного треугольника (воронки), внутри которого размещаются данные большинства исследований. В опубликованных материалах небольших исследований эффект лечения оказывается завышенным по сравнению с более крупными исследованиями. Асимметричное распределение точек означает, что некоторые небольшие исследования с отрицательными результатами и значи-

тельной дисперсией не были опубликованы, т. е. возможна систематическая ошибка, связанная с преимущественным опубликованием положительных результатов. График показывает, что небольших (10-100 участников) исследований, в которых ОР превышал 0,8, значительно меньше, чем аналогичных исследований, в которых этот показатель был ниже 0,8, а данные средних и крупных исследований расположены практически симметрично. Таким образом, некоторые небольшие исследования с отрицательными результатами, вероятно, не были опубликованы. Кроме того, график позволяет легко выявить исследования, результаты которых существенно отличаются от общей тенденции .

Проблемы здоровья и экологии

В большинстве случаев при проведении мета-анализа используют обобщенные данные о сравниваемых группах больных в том виде, в каком они приводятся в статьях. Но иногда исследователи стремятся более детально оценить исходы и факторы риска у отдельных больных. Эти данные могут быть полезны при анализе

выживаемости и многофакторном анализе. Мета-анализ данных о конкретных больных стоит дороже и требует больше времени, чем мета-анализ групповых данных; для его проведения необходимо сотрудничество многих исследователей и жесткое соблюдение протокола (рисунок 2).

А. Графическое представление результатов стандартного мета-анализа. Относительный риск прогрессирования в каждом исследовании и его обобщенная оценка представлены в виде точек, а доверительные интервалы (ДИ; обычно 95% ДИ) изображены горизонтальными линиями. Исследования представлены в соответствии с датой публикации. Относительный риск <1 означает снижение числа исходов в группе лечения по сравнению с группой контроля. Тонкие линии представляют совокупные индивидуальные результаты, нижняя линия - объединенные результаты.

Б. Результаты кумулятивного мета-анализа данных, полученных в тех же исследованиях. Точки и линии обозначают, соответственно, значения относительного риска и 95% ДИ обобщенных данных после включения в анализ каждого дополнительного исследования. Если доверительный интервал пересекает линию OR = 1, то наблюдаемый эффект статистически недостоверен при выбранном уровне значимости 0,05 (95%). Если нет существенной неоднородности данных, при добавлении последующего исследования ДИ сужается.

N - число больных в исследовании; N - суммарное число больных.

Рисунок 2 - Результаты стандартного и кумулятивного мета-анализа данных, полученных в одних и тех же исследованиях

В большинстве сводных таблиц мета-анализа обобщенные данные по всем испытаниям приводятся в виде ромба (нижняя горизонтальная линия с точкой). Расположение ромба по отношению к вертикальной линии отсутствия эффекта является основным в понимании эффективности испытаний. Если ромб перекрывает линию отсутствия эффекта, можно сказать, что между двумя видами лечения нет разницы в воздействии на частоту первичного исхода.

Важным понятием для правильной трактовки результатов мета-анализа является определение гомогенности испытаний. На языке мета-анализа гомогенность означает, что результаты каждого отдельного испытания сочетаются с результатами других. Гомогенность можно

оценить одним взглядом по расположению горизонтальных линий (рисунок 2). Если горизонтальные линии перекрывают друг друга можно сказать, что эти исследования гомогенны.

Для оценки гетерогенности испытаний используется числовое значение критерия %2 (в большинстве форматов мета-анализа обозначается как «Chi-squared for homogeneity»). Статистика %2 для гетерогенности групп объясняется следующим практическим правилом: критерий х2 в среднем имеет значение, равное числу степеней свободы (число испытаний в мета-анализе минус один). Поэтому значение X2, равное 9,0, для набора из 10 испытаний показывает отсутствие доказательств статистической гетерогенности .

Проблемы здоровья и экологии

При существенной гетерогенности результатов исследований целесообразно использовать регрессионный мета-анализ, который позволяет учитывать несколько характеристик, влияющих на результаты изучаемых исследований. Например, детальная оценка исходов и факторов риска у отдельных больных необходима при анализе выживаемости и многофакторном анализе. Результаты регрессионного мета-анализа представляются в виде коэффициента наклона с указанием доверительного интервала.

Для проведения компьютерного мета-анализа в Интернете представлено программное обеспечение.

Бесплатные программы:

RevMan (Review Manager) находится по адресу: http://www.cc-ims.net/RevMan;

Meta-Analysis version 5.3: http://www.statistics. com/content/freesoft/mno/metaana53.htm/;

EPIMETA: http://ftp.cdc.gov/pub/Software/ epimeta/.

Платные программы:

Comprehensive Meta-Analysis: http://www. meta-analysis.com/;

MetaWin: http://www.metawinsoft.com/;

WEasyma: http://www.weasyma.com/.

Статистические пакеты программ, в которых предоставлена возможность проведения мета-анализа:

SAS: http://www.sas.com/;

STATA: http://www.stata. com/;

SPSS: http://www.spss.com/ .

Таким образом, количественное объединение данных различных клинических исследований с помощью мета-анализа позволяет получить результаты, которые невозможно извлечь из отдельных клинических исследований. Чтение и изучение систематических обзоров и результатов мета-анализа позволяет более быстро ориентироваться в лавине публикуемых статей и с точки зрения доказательной медицины выбирать из них те немногие, которые действительно заслуживают нашего времени и внимания. Вместе с тем необходимо осознавать, что метаанализ - не «палочка-выручалочка», решающая проблему научной доказательности, и не стоит заменять им клинические рассуждения.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Systematic reviews and meta-analysis for the surgeon scientist / S. S.Mahidl // Br. J. Surg. - 2006. - Vol. 93. - P. 1315-1324.

2. A comparison of results of meta-analyses of randomized control trials and recommendations of clinical experts / E. T.Antman // JAMA. - 1992. - Vol. 268, N 2. - P. 240-248.

3. Evidence based medicine: what it is and what it isn’t / D. L. Sack-ett // BMJ. - 1996. - Vol. 312. - P. 71-72.

4. Egger, M. Meta-analysis: potentials and promise / M. Egger,

S. G. Davey // BMJ. - 1997. - Vol. 315. - P. 1371-1374.

5. Юрьев, К. Л. Доказательная медицина. Кокрановское сотрудничество / К. Л. Юрьев, К. Н. Логановский // Укр. мед. ча-сопис. - 2000. - № 6. - С. 20-25.

6. The Cochrane database of systematic reviews. - London: BMJ Publishing Group and Update Software, 1995. - 260 p.

7. Davies, H. Что такое мета-анализ? / H. Davies, I. Crombie // Клиническая фармакология и фармакотерапия. - 1999. - № 8. - C. 10-16.

8. Egger, M. Meta-analysis: principles and procedures / M. Egger, S. G. Davey, A. N. Phillips // BMJ. - 1997. - Vol. 315. - P. 1533-1537.

9. Lewis, S. Forest plots: trying to see the wood and the trees / S. Lewis, M. Clarke // BMJ. - 2001. - Vol. 322. - P. 1479-1480.

10. Bero, L. The Cochrane Collaboration. Preparing, maintaining, and disseminating systematic reviews of the effects of health care / L. Bero, D. Rennie // JAMA. - 1995. - Vol. 274. - P. 1935-1938.

11. Does the inclusion of grey literature influence estimates of intervention effectiveness reported in meta-analyses? / L. Mc. Auley // Lancet. - 2000. - Vol. 356. - P. 1228-1231.

12. Fleiss, J. L. The statistical basis of meta-analysis / J. L. Fleiss // Stat. Methods Med. Res. - 1993. - Vol. 2. - P. 121-145.

13. Greenland, S. Invited commentary: a critical look at some popular meta-analytic methods / S. Greenland // Am. J. Epidemiol. -

1994. - Vol. 140. - P. 290-296.

14. Guidelines for meta-analyses evaluating diagnostic tests / L. Irwig // Ann. Intern. Med. - 1994. - Vol. 120. - P. 667-676.

15. Stewart, L. A. Practical methodology of meta-analyses (overviews) using updated individual patient data. Cochrane Working Group / L. A. Stewart, M. J. Clarke // Stat. Med. - 1995. - Vol. 14. - P. 2057-2579.

16. Гринхальх Т. Основы доказательной медицины / Т. Грин-хальх; пер. с англ. - М.: ГЭОТАР - Медиа, 2006. - 240 с.

17. Olkin, I. Statistical and theoretical considerations in meta-analysis / I. Olkin // J. Clin. Epidemiol. - 1995. - Vol. 48. - P. 133-146.

18. Villar, J. Predictive ability of meta-analyses of randomised controlled trials / J. Villar, G. Carroli, J. M. Belizan // Lancet. -

1995. - Vol. 345. - P. 772-776.

19. Deeks, J .J. Systematic reviews in health care: Systematic reviews of evaluations of diagnostic and screening tests / J. J. Deeks // BMJ. - 2001. - Vol. 323. - P.157-162.

Поступила 01.02.2008

УДК 616.12-005.8-0.53.8-08

СТРУКТУРА ОСТРОГО ИНФАРКТА МИОКАРДА, ВОЗРАСТНЫЕ И ПОЛОВЫЕ ОСОБЕННОСТИ ТЕЧЕНИЯ И СМЕРТНОСТИ НА ГОСПИТАЛЬНОМ ЭТАПЕ ЛЕЧЕНИЯ

Н. В. Василевич

Гомельский государственный медицинский университет

Прослежена структура, динамика развития острого инфаркта миокарда в зависимости от пола, возраста, сроков поступления в стационар, тяжести повреждения миокарда на госпитальном этапе лечения.

Ключевые слова: острый инфаркт миокарда, пол, возраст, летальность.