38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48. Ark. judge fines Johnson & Johnson more than $1.1B in Risperdal case. CBS/AP. 2012 April 11.
49.
50.
51.
52. Reuters. The largest pharma fraud whistleblower case in U.S. history totaling $14 billion. 2009 Jan 15.
53. Anonymous. Abbott Labs to pay $15. billion more for Medicaid fraud. 2012 May 8. Available online at: http://somd.com/news/headlines/2012/15451.shtml (accessed 19 June 2012).
54.
55.
56.
57.
58. Ketek Official FDA information, side effects and uses. Available online at: www.drugs.com/pro/ketek.html (accessed 18 Nov 2012).
59.
60.
61.
62.
63.
64.
65.
66.
67. Company news; drug maker agrees to pay $175 million in lawsuit. New York Times. 2004 Feb 7.
68. Prescription generics & patent management. Strategies in the Pharmaceutical Industry 2004. 2004 Nov 29.
69.
70.
71.
72.
73.
74. European Commission. Antitrust: Commission fines Lundbeck and other pharma companies for delaying market entry of generic medicines. Press release. 2013 June 19.
75.
76.
77.
78.
79.
80.
81. OxyContin’s deception costs firm $634M. CBS News. 2007 May 10.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91. Free Online Law Dictionary. Organized crime. Available online at: http://legal-dictionary.thefreedictionary.com/Organized+Crime (accessed 2 December 2012).
92.
93.
94.
3. Очень немногим пациентам лекарства идут на пользу
Я уверен, что это заявление удивит многих пациентов, которые пьют лекарства каждый день, и поэтому объясню более подробно на примере лечения депрессии.
Если мы лечим пациентов с депрессией антидепрессантом в течение 6 недель, то примерно у 60% из них будут заметные улучшения1. Кажется, что это хороший эффект. Однако если мы слепым образом лечим пациентов с помощью плацебо, которое выглядит точно так же, как таблетки, у 50% из них будут наблюдаться улучшения. Большинство врачей интерпретируют этот результат как эффект плацебо, но интерпретировать его таким образом невозможно. Если мы вовсе не будем лечить пациентов, а просто увидимся с ними через 6 недель, многим из них также станет лучше. Мы называем это спонтанной ремиссией заболевания, или его естественным течением.
Важно быть в курсе этих вопросов. В моем центре мы занимаемся исследованиями антидепрессантов, и я часто объясняю СМИ, что большинство пациентов не получают от них никакой пользы. Ведущие психиатры оспаривают это, заявляя, что хотя эффект скромный, пациенты получают пользу от того, что они ошибочно называют «эффектом плацебо», который, по их словам, составляет около 70% (как видим, результаты преувеличены).
Есть три основные причины, почему пациент может чувствовать себя лучше после лекарств: эффект от лекарства, эффект плацебо и естественное течение заболевания. Если мы хотим изучить влияние плацебо, нам нужно будет найти испытания, в которых некоторые из пациентов по случайной выборке получат плацебо, а другие – не получат вообще никакое лечение.
Один из моих коллег, Асбьерн Хробьяртссон, в 2001 году нашел 130 таких испытаний, большинство из которых включали третью группу пациентов, получавших некое лекарство, часто похожее по виду на плацебо. Вопреки распространенному убеждению, что плацебо оказывает большой эффект, мы обнаружили – к нашему удивлению, – что плацебо не имеет большого влияния на боль, но нельзя было также исключать, что результат был вызван смещением, а не плацебо2.
Смещение, о котором мы упоминали, происходит потому, что невозможно скрыть от пациентов, что они не получают никакого лечения (так называемое ослепление). Пациенты, разочарованные этим фактом, имеют склонность сообщать о меньшем улучшении, чем есть на самом деле, например в отношении их депрессии или боли. Наоборот, пациенты из группы плацебо могут преувеличивать улучшения, особенно в испытаниях, имеющих три группы сравнения, когда они не знают, что получают, но надеются, что это активное лечение, а не плацебо.
Мы обновили результаты, включив в них последние испытания, и теперь в Кокрейновском обзоре – 234 испытания, исследующих 60 различных клинических состояний3. Мы подтвердили первоначальные результаты, что плацебо-вмешательства в целом не оказывают важного клинического эффекта и что трудно отличить истинный эффект плацебо от предвзятого сообщения о нем.
Вы, наверное, удивлены, почему я так много говорю об эффектах плацебо, а не лекарств. Это потому, что эффекты лекарств определяют по сравнению с плацебо в плацебо-контролируемых исследованиях. И если ослепление не безупречно, мы ожидаем, что сообщенный эффект от лекарства преувеличен, особенно когда результаты субъективны, как в случае с общим настроением или болью.
Как часто ослепление не работает? Довольно часто, по двум причинам. Во-первых, в испытаниях, называемых двойными слепыми, возможно, не было проведено эффективного ослепления в самом начале. Например, исследователи, которые провели шесть двойных слепых исследований антидепрессантов или транквилизаторов, отметили, что во всех случаях плацебо отличалось от активного препарата по физическим характеристикам, таким как текстура, цвет и толщина4. Во-вторых, даже когда препарат и плацебо неотличимы по своим физическим характеристикам, обычно трудно поддерживать ослепление во время испытания, потому что лекарства имеют побочные эффекты, например, антидепрессанты вызывают сухость во рту.
Из-за всех этих проблем истинная разница в улучшении состояния в 60% и 50% при использовании, соответственно, антидепрессантов и плацебо, вероятно, значительно меньше, чем 10%. Но давайте сначала предположим, интереса ради, что эти показатели верны, и разработаем испытание со следующими показателями улучшения (
Таблица 3.1. Результаты рандомизированного исследования, сравнивавшего антидепрессант с плацебо
Это тот случай, когда статистика очень полезна. Статистический тест вычисляет значение P, которое показывает вероятность того, что мы будем наблюдать разницу в 21 пациента или больше, если лекарство не работает. В этом случае Р = 0,04. Медицинская литература полна значениями P, и традиция такова, что если значение P меньше 0,05, то мы говорим, что разница статистически достоверна, и верим, что разница, которую мы нашли, реальна. Р=0,04 означает, что мы наблюдали бы разницу в 21 пациента и более четыре раза из ста, если лекарство не работает, и мы повторили наше испытание много раз.
Если бы на два пациента меньшего чувствовали себя лучше на активном лекарстве, то есть 119, а не 121, то разница все равно была бы почти такой же, но при этом она не была бы статистически достоверной (Р = 0,07).
Этот пример иллюстрирует то, что весьма часто «доказательство» эффективности лечения зависит всего от нескольких пациентов. Это верно даже для случая, когда, как в этом примере, в исследование были рандомизированы 400 пациентов, а это довольно крупное исследование депрессии.
Как правило, не требуется предпринимать больших усилий, чтобы превратить недостоверный результат в достоверный. Иногда исследователи или компании переосмысливают или повторно анализируют данные, после того как получают значение P выше 0,05, до тех пор, пока не придут к значению Р ниже 0,05. Это они делают путем, например, вранья о том, что еще у нескольких пациентов на активном лекарстве было улучшение или еще у нескольких пациентов на плацебо не было улучшения или за счет исключения некоторых рандомизированных пациентов из анализа5.
Это нечестный подход к науке, но, как мы увидим в главах 4 и 8, нарушения в научной практике очень широко распространены.
Помимо такого мошенничества, недостаточное «ослепление» в исследованиях может также подвести нас к представлению, что неэффективные препараты эффективны. «Ослепление» важно не только когда пациенты оценивают свое состояние, но и когда их оценивают врачи. Депрессия имеет сложную шкалу, включающую множество субъективных элементов, и совершенно очевидно, что знание того, какое лечение получает пациент, может положительно влиять на оценку врачом эффективности этого лечения.
Это было убедительно продемонстрировано Хробьяртссоном и коллегами в 2012 году с помощью серии клинических испытаний при различных заболеваниях, в которых участвовали как «ослепленные», так и «не ослепленные» подопытные. Обзор 21 такого испытания, в которых в основном использовались субъективные результаты, показал, что эффект вмешательства был преувеличен в среднем на 36% при оценке его «не ослепленными» исследователями по сравнению с «ослепленными»6. Это очень большое смещение, учитывая, что заявленный эффект большинства лечебных вмешательств гораздо ниже, чем 36%.
Таким образом, двойное слепое исследование, в котором «ослепление» недостаточно эффективно, может преувеличивать эффект весьма существенно. Можем проверить это на нашем примере с антидепрессантами, допуская для простоты, что «ослепление» нарушается у всех пациентов. Для расчета соотношения шансов мы переставим числа так, чтобы низкое значение символизировало полезный положительный эффект, что вполне соответствует принятой договоренности (
Таблица 3.2. Те же результаты, что в таблице 3.1, но переставленные
Этот пример был слишком упрощенным, поскольку «ослепление» редко нарушается для всех пациентов, но упражнение тем не менее отрезвляет. Даже если «ослепление» нарушается только по отношению к нескольким пациентам, этого может быть достаточно, чтобы сделать недостоверный результат достоверным. Хробьяртссон c коллегами отметили в своем обзоре, что 36-процентное преувеличение эффекта лечения, связанное с отсутствием «ослепления» оценщиков, было вызвано неправильным распределением результатов по медиане у 3% оцененных пациентов на каждое клиническое испытание (что соответствует 12 пациентам из общего числа, в данном случае – 400).
Невозможно переоценить важность этого открытия. Большинство лекарств имеют выраженные побочные эффекты, поэтому не может быть никаких сомнений, что «ослепление» нарушается у многих пациентов в большинстве плацебо-контролируемых исследований. Когда мы используем лекарства, чтобы спасти людей от смерти, нарушения «ослепления» не имеют значения, так как мы можем с уверенностью сказать, жив пациент или нет. Однако такие ситуации редки. В большинстве случаев лекарства используются для снижения симптомов или уменьшения риска осложнений при болезни, и результаты очень часто субъективны, например уровень депрессии или шизофрении, тревоги, слабоумия, боли, качества жизни, функциональных способностей (часто называемых повседневной активностью), тошноты, бессонницы, кашля и одышки. Даже решение о том, перенес ли пациент сердечный приступ, может быть довольно субъективным (
Рандомизированное клиническое испытание – наиболее надежный метод оценки эффектов лечения. Но мы слишком легко верим результатам этих экспериментов, если клиническое испытание было «слепым» и основной результат сопровождается достоверной величиной значения P.
Тревожнее всего, что все лекарства приносят вред, при этом многие из них вообще неэффективны. Поэтому мы добросовестно вредим огромному числу пациентов, поскольку рандомизированные исследования не всегда дают понять, какие из лекарств не работают.
На этом фоне легко понять, почему компании, которые показали, что их лекарство действует на определенную болезнь, в дальнейшем могут тестировать его при совершенно не связанных с этим заболеваниях и находить, что оно также работает и при них. Нарушение «ослепления» является основной причиной, почему гораздо легче изобретать новые заболевания, чем новые лекарства7, 8. Легко показать определенный эффект на простой или чуть более сложной шкале, которая, в довершение всего, может иметь малое клиническое значение, а дальше пусть маркетинговая машина делает остальное.
Однажды один из членов моего гольф-клуба, старше меня по возрасту, признался, что не уверен в эффективности своих таблеток от деменции. Он хотел знать, прекратить ли их принимать, и просил моего совета. Я редко даю советы пациентам, не являясь их врачом и специалистом в конкретной области и не имея представления об их анамнезе. Однако он также сказал, что его беспокоят побочные эффекты лекарства и высокая цена. Учитывая, что эффект лекарств от деменции совсем не впечатляет, а клинические испытания, спонсированные фармой, имели весьма субъективные результаты, а также помня о многих других смещениях в подобных испытаниях, я сделал исключение из правила. Сказал, что не советую больше принимать это лекарство. Правда, он был довольно дементным и вряд ли последовал моему совету, скорее всего, он скоро забыл об этом разговоре.
Невозможность стопроцентного «ослепления» должна сделать врачей гораздо более осторожными; они должны внимательно наблюдать, думать дважды, прежде чем назначать лекарства, четко прописывать в дневниках, какой именно результат хотят получить и когда, и, конечно, не забывать отменить препарат, если эффект не достигнут.
Осознать, что совсем немногим лекарства приносят пользу, поможет ЧБНЛ (число больных, которых необходимо лечить, NNT – number needed to treat). Это величина, обратная разности рисков. Так, если мы считаем, что 60 процентам пациентов, получающих антидепрессант, и 50 процентам, получающим плацебо, станет лучше, – ЧБНЛ составит 1/(60% – 50%) = 10.
Это означает, что только одному из 10 пациентов, которых мы лечим антидепрессантом, он принесет пользу. Если принять, что любой возможный эффект плацебо настолько мал, что мы можем им пренебречь3, то более того, это означает, что для остальных девяти пациентов не имело никакого значения, получили они препарат или нет, кроме его побочных эффектов и стоимости. Даже если мы не примем результаты, которые показали, что плацебо в целом довольно неэффективны, все равно доказано, что очень немногие пациенты получают пользу от антидепрессанта. На самом деле все гораздо хуже, не только из-за отсутствия эффективного «ослепления», но и потому, что разница в 10% взята из клинических испытаний, проводимых промышленностью, которые были тщательно просчитаны и тестировали только тех пациентов, которые с наибольшей вероятностью реагировали на лекарства (
Если же идет речь о профилактике, то ЧБНЛ становится значительно больше. Статины – очень популярный тип лекарств, так как они снижают уровень холестерина. Клиническое испытание 1994 года показало, что из 30 пациентов с очень высоким риском коронарного приступа, получавших симвастатин в течение 5 лет, помогал он только одному10. При этом в 1990-х, когда он был еще патентованным препаратом, симвастатин очень дорого стоил. Я проанализировал таблицу 1 в статье, которая описывала пациентов, включенных в исследование. Хотя 80% испытуемых уже перенесли сердечный приступ, только одна треть получала аспирин, хотя доказано, что аспирин буквально спасает жизни. Более того, четверть из них были курильщиками! Выходит, мы могли бы спасти много жизней очень дешево, напоминая врачам, что пациенты должны получать аспирин, а также что их нужно уговорить бросить курить. Доказано, что даже краткие беседы с врачом влияют на курильщиков11.
Когда данные восьми клинических испытаний были объединены в Кокрейновском обзоре, исследователи обнаружили, что статины уменьшали общую смертность на 16%12. Звучит эффектно, и это хороший пример того, как промышленность рекламирует хорошие результаты. Однако это ровным счетом ничего не говорит о пользе профилактики, так как мы не знаем уровень смертности среди тех, кто не принимал статины. Авторы сообщили, что 2,8% участников клинических испытаний умерли (обратите внимание, что я не называю здоровых людей пациентами, так как они ими не являются). Чего в этом обзоре не хватало, так это ЧБНЛ. Снижение на 16% от частоты 2,8% дает частоту 2,35%, и ЧБНЛ составляет 1/(2,8%–2,35%) = 222.
Чтобы понять, что означает этот результат, нужно тщательно прочитать весь обзор. Получается, что средний возраст участников составил 57 лет и, для начала, они были не совсем здоровы. Некоторые исследования включали только пациентов с диабетом, гипертонией или повышенным уровнем липидов, а некоторые в дополнение к этому – пациентов с сердечно-сосудистыми заболеваниями. Более того, доля курильщиков колебалась от 10% до 44% в клинических испытаниях, которые приводили такие данные. Также необходимо знать, как долго принимать статины, чтобы они принесли пользу, поэтому большинство исследований длились несколько лет. Наконец, то, на что я всегда обращаю внимание: финансировались ли испытания фармацевтической промышленностью или шли за счет государственных средств? Ведь многие испытания фармы так никогда и не публикуются, если результаты неутешительны. Только одно из испытаний, представивших данные о смертности от всех причин, финансировалось государством. Мне представляется, и авторы обзора подтвердили это в обсуждениях, что снижение общей смертности на 16% сильно преувеличено. Например, проводилось большое финансированное государством клиническое испытание ALLHAT-LLT, которое не было включено в обзор, потому что более 10% пациентов имели сердечно-сосудистые заболевания. Это исследование не обнаружило никакого снижения смертности, а отношение риска составляло 0,99 (95%, доверительный интервал от 0,89 до 1,11, что означает, что мы на 95% уверены, что истинный эффект лежит где-то между 11-процентным снижением общей смертности и ее 11-процентным увеличением).
Авторы призвали с осторожностью примененять статины для первичной профилактики, аргументируя это тем, что некоторые клинические испытания были остановлены слишком рано, когда показанная польза была большой, и что во многих случаях налицо было выборочное представление результатов. Они также отметили, что многие испытания не сообщили о каких-либо побочных эффектах, хотя их не могло не быть. К сожалению, резюме этого обзора, которое и читают большинство людей, дает другое впечатление. В нем отмечено, что произошло снижение общей смертности и при этом не было четких доказательств какого-либо вреда, причиненного статинами, воздействия на качество жизни или повышения мышечной боли.