Ви можете покращити свої навички у практичній діяльності заснованій на доказах за допомогою цих навчальних матеріалів PEDro:
- Як задати клінічне питання
- Чи є дослідження валідним?
- Чи є терапія клінічно корисною?
- Відеоматеріали
1. Як задати клінічне питання
Перш ніж перейти до пошуку клінічних досліджень, краще провести деякий час обмірковуючи питання, на яке ви хочете знайти відповідь. Це пояснюється тим, що формування та уточнення вашого питання полегшить пошук досліджень, які знайдуть відповідь на нього. У цьому відеоуроці пояснюється, як задавати клінічні питання у форматі PICO (Patient-Intervention-Comparison-Outcome).
2. Чи є дослідження валідним?
Чи є низько-енергетичний лазер ефективним при лікуванні латерального епікондиліту? Чи запобігають програми з розтягу розвитку контрактурам після інсульту? Чи зможе використання «flutter valve» (вібраційно-клапанний пристрій для тренування видиху) зменшити післяопераційні респіраторні ускладнення? Точні відповіді на ці запитання можуть бути надані тільки тоді, коли є правильно сплановані, та належним чином виконані клінічні дослідження. На жаль, публікації містять як добре проведені дослідження, які формують валідні висновки, так і погано проведені дослідження, які декларують недостовірні висновки. Читач повинен уміти їх розрізняти. Цей навчальний матеріал описує ключові характеристики клінічних досліджень (або «методологічні фільтри») якими володіють валідні дослідження.
Деякі дослідження які, ставлять за мету визначення ефективності процедур фізичної терапії, просто збирають групу суб’єктів із схожим станом та роблять вимірювання ступеню тяжкості стану до та після лікування. Якщо суб’єкти покращили свої показники під час періоду лікування, то це свідчить про те, що даний вид лікування є ефективним. Дослідження, які використовують ці методи, зрідка можуть забезпечити достовірність доказів ефективності лікування, оскільки нечасто можна стверджувати, що поліпшення відбулось саме завдяки цьому лікуванню, а не завдяки зовнішнім чинникам, таких як природне відновлення, статистична регресія (статистичні явища, яким притаманно те, що з часом вираженість «тяжкості стану» пацієнтів зменшується внаслідок мінливості їхнього стану), ефект плацебо або «Готорнський» ефект (коли суб’єкти повідомляють про поліпшення, лише тому, що вони думають, що це те, що дослідник хоче почути). Єдиним належним способом боротьби з цими небезпеками для валідності дослідження є наявність контрольної групи. Згодом проводиться порівняння між результатами суб’єктів, які отримали лікування, та суб’єктів, які його не отримували.
Суть контрольованих досліджень полягає у тому, що у цілому, зовнішні чинники повинні однаково впливати як на дослідницьку групу де здійснювалось втручання, так і на контрольну групу, для того щоб будь-яка різниця між групами у кінці дослідження була обумовлена лікуванням. Наприклад, широко відомо, що більшість випадків гострого болю нижньої частини спини минають спонтанно і швидко, навіть за відсутності будь-якого лікування. Таким чином, просто демонструючи, що суб’єкти у яких відбулося поліпшення під час курсу лікування, не є доказом ефективності лікування. Контрольоване дослідження, яке продемонструвало, що пацієнти, які отримували лікування, показали кращі результати, ніж пацієнти з контрольної групи, було б більш вагомим доказом того, що поліпшення відбулося внаслідок лікування, оскільки природне відновлення повинно було відбутися як у дослідницький групі де відбулось лікування, так і у контрольній групі. Спостереження за тим, що суб’єкти, які отримували лікування демонструють кращі результати, ніж представники контрольної групи, свідчить про те, що щось більше, ніж природне відновлення, покращило їх стан. Зауважимо, що у контрольованому дослідженні «контрольна» група не повинна отримувати ніякого лікування. Часто у контрольованих дослідженнях, порівняння відбувається між контрольною групою, яка отримує традиційну терапію, і дослідницькою групою, яка отримує традиційну терапію плюс лікування. Як варіант, деякі дослідження порівнюють контрольну групу, яка отримує традиційне лікування з дослідницькою групою, яка отримує новий вид терапії.
Важливо, що лише контрольні групи забезпечують захист від спотворюючого ефекту зовнішніх чинників, оскільки дослідницькі та контрольні групи схожі. Тільки тоді, коли і дослідницька і контрольна групи є однаковими за усіма параметрами, що можуть вплинути на результат (за винятком того, чи отримують вони лікування чи ні), дослідник може бути упевнений, що відмінності між групами наприкінці дослідження обумовлені саме лікуванням. На практиці це досягається випадковим розподілом усіх наявних суб’єктів на дослідницьку та контрольну групи. Це гарантує, що зовнішні чинники, такі як ступінь природного відновлення, мають приблизно однаково виражений ефект у дослідницький та контрольній групах. Насправді, коли суб’єкти випадково розподіляються по групах, відмінності між дослідницькою та контрольною групами можуть бути обумовлені лише або лікуванням, або випадковістю, і можна виключити випадковість, якщо відмінності є достатньо великими – це робиться за допомогою статистичних тестів. Слід зазначити, що це єдиний спосіб забезпечити порівняння дослідницької та контрольної груп. Насправді, не існує дійсно задовільної альтернативи рандомізованому розподілу.
Навіть якщо суб’єкти рандомізовано розподілені на групи, необхідно забезпечити, щоб ефект (або відсутність ефекту) лікування не спотворювався «упередженням спостерігача». Це стосується ймовірності того, що віра дослідника у ефективність лікування може підсвідомо спотворювати вимірювання результатів лікування. Найкращий захист створюється «засліпленням» спостерігача – переконавшись, що людина, яка вимірює результати, не знає, чи суб’єкт отримував або не отримував лікування. Взагалі, бажано, щоб пацієнт і терапевт також були засліплені. Коли пацієнти засліплені, ви можете розуміти, що явний ефект терапії не був викликаний ефектом плацебо або Готорнським ефектом. Засліплення терапевтів, які проводять терапію, часто буває складним або неможливим, але у таких дослідженнях, де терапевти є засліплені щодо терапії (наприклад, під час досліджень з використанням низько-енергетичного лазера, терапевт не поінформований, що безпосередньо випромінює пристрій лазер чи кольорове світло), дослідник можете знати, що терапевтичний ефект не був викликаний ентузіазмом терапевта, а безпосередньо самою терапією.
Важливе значення також має те, що декілька суб’єктів можуть припинити участь («вибути») впродовж здійснення дослідження. Справа у тому, що такі дострокові вибування можуть серйозно спотворити результати дослідження. Істинний ефект лікування може бути замаскований, якщо суб’єкти контрольної групи, стан яких погіршився протягом періоду дослідження, залишили дослідження, для щоб пройти інше лікування. Це може призвести до того, що середній результат контрольної групи буде виглядати краще, ніж це було би насправді. І навпаки, якщо лікування призвело б до погіршення стану деяких суб’єктів, і якщо ці суб’єкти залишили б дослідження, то лікування виглядало б більш ефективним, ніж воно є насправді. З цієї причини дострокові вибування завжди вносять похибку у валідність клінічного дослідження. Звичайно, чим більше вибуло суб’єктів, тим більшою є похибка – згідно практичного правила, похибка полягає у тому, що якщо більше 15% суб’єктів вибули з дослідження, це дослідження має потенційно небезпечні недоліки. Деякі автори просто не повідомляють кількість тих хто вибув. У відповідності до встановленого наукового принципу винності, доки не доведена невинність, ці дослідження повинні розглядатися, як потенційно не валідні.
Підсумовуючи, валідні клінічні випробування:
- рандомізовано розподіляють суб’єктів у групу дослідження та у контрольну групу
- засліплюють оцінювачів, і бажано також пацієнтів та терапевтів
- мають відносно малу кількість тих, хто вибув з дослідження.
Наступного разу, читаючи клінічне дослідження з фізичної терапії щодо певного лікування, спитайте себе чи відповідає дане дослідження цим критеріям. Як правило, дослідження, які не відповідають цим критеріям, можуть бути не валідними і не повинні розглядатися як вагомі докази ефективності лікування (або неефективності). Ті дослідження, які відповідають цим критеріям, повинні бути уважно прочитані, а їхні висновки треба запам’ятати!
Якщо ви хочете прочитати докладніше про оцінювання валідності досліджень, почитайте наступне:
Guyatt GH, Sackett DL, Cook DJ, та ін. User’s guide to the medical literature: II. How to use an article about therapy or prevention: A. Are the results of this study valid? JAMA 1993;270:2598-601.
3. Чи є терапія клінічно корисною?
Попередній навчальний матеріал надав список критеріїв, які читачі можуть використовувати щоб розмежовувати дослідження, які можуть бути валідними, від тих, які такими не можуть бути. Дослідження, які не відповідають більшості методологічним фільтрам, зазвичай краще ігнорувати. Цей розділ розглядає як терапевти повинні інтерпретувати ті дослідження, які відповідають більшості методологічним фільтрам. Ідея полягає у тому, що не достатньо просто дивитись на докази статистично значущого ефекту терапії. Ви повинні бути впевнені, що дослідження вимірюють результати, які є значущими, і що позитивні ефекти терапії є достатньо великими, щоб зробити терапію корисною. Шкідливі наслідки терапії повинні бути нечасті та рідкісні, щоб терапія зробила більше користі, ніж шкоди. І нарешті, терапія повинна бути ефективною з точки зору витрат.
Звичайно, для того щоб дослідження мало корисний практичний результат, воно повинно дослідити значущість ефекту від лікування. Мається на увазі, що результати повинні вимірюватись валідним способом. Загалом, оскільки ми зазвичай оцінюємо основну цінність лікування за тим, чи задовольняє вона потреби пацієнтів, результати вимірювань мають бути значущими для пацієнтів. Таким чином, дослідження яке демонструє, що низько-енергетичний лазер зменшує рівень серотоніну, буде менш корисне ніж те, яке свідчить про те, що він зменшує біль, або дослідження, яке демонструє, що моторне тренування зменшує спастичність, буде менш корисне ніж те, результати якого показують, що вони покращують функціональну незалежність.
Величина терапевтичного ефекту безумовно важлива, але часто не береться до уваги. Можливо це відбувається через те, що велика кількість читачів клінічних досліджень не можуть усвідомити різницю між «статистичною значущістю» та «клінічною значущістю». Або, можливо, це є відображенням підвищеної уваги багатьох авторів клінічних випробувань, на тому чи «p < 0,05» чи ні. Статистична значущість («p < 0,05») стосується лише того, чи є ефект від терапії дійсно є великим, щоб його можна було пояснити випадковістю. Це є важливий показник (ми повинні знати, що ефекти, які спостерігаються від терапії були не лише випадковими результатами), але він сам по собі нічого не говорить про те, наскільки насправді був великий ефект. Більш точна оцінка розміру ефекту терапії є середня різниця між групами. Таким чином, якщо гіпотетичне дослідження про вплив мобілізації інформує, що біль плеча, який був виміряний за 10 бальною аналоговою візуальною шкалою, зменшився на 4 бали у дослідницький групі і на 1 бал у контрольній групі, більш точна оцінка середнього ефекту лікування становить 3 бали зменшення по VAS (4 бали мінус 1 бал відповідно є 3 бали). Інше гіпотетичне дослідження виконання розтягу м’язів перед заняттям спортом може інформувати про те, що 2% пацієнтів були згодом травмовані у групі яка здійснювала розтяг, у порівнянні з 4% у контрольній групі. У цьому випадку найкращим доказом є те, що виконання розтягу зменшило ризик травмування на 2% (4% мінус 2% відповідно є 2%). Читачі клінічних досліджень повинні дивитися на розмір ефекту який декларується, щоб вирішити, чи ефект є достатньо великим, щоб бути клінічно корисним. Пам’ятайте, що пацієнти часто приходять на терапію, шукаючи зцілення (звичайно, це узагальнення не може стосуватись усіх сфер клінічної діяльності) – більшість з них не зацікавлені у методах лікування, які мають лише незначний ефект.
Існують важливі тонкощі, у представлені розмірів ефекту від терапії. Це стосується досліджень, результати яких вимірюються за допомогою дихотомічних результатів (дихотомічні результати можуть мати одне з двох значень, таких як мертві або живі, поранені або не поранені, визнані такими, що потребують скерування до будинку тривалої опіки або не визнані такими; це контрастує з такими показниками вимірювань, як оцінка болю за шкалою VAS, яка може мати будь-яке значення між показниками від 0 до 10 включно). Багато досліджень, які вимірюють дихотомічні результати, повідомлять про вплив терапії як співвідношення, а не на відмінності. (Коефіцієнт іноді називають «відносним ризиком» або «коефіцієнтом шансів» або «коефіцієнтом ризику», але він також може мати іншу назву). Висловлюючись у такий спосіб, результати нашого гіпотетичного дослідження щодо виконання розтягу будуть представлені як 50% зниження ризику травматизму (оскільки 2% становить половину від 4%). Зазвичай вираження лікувального ефекту, як співвідношення, спрямоване на те, щоб зробити ефект від терапії більш вагомим. Кращим представленням результатів є міжгрупове порівняння. (Насправді найбільш корисним шляхом представлення може бути інверсна різниця. Її іноді називають «число пацієнтів яких необхідно пролікувати» («number needed to treat – NNT»), оскільки воно говорить нам, скільки у середньому пацієнтів нам потрібно пролікувати, для того щоб запобігти одному негативному наслідку – на прикладі виконання розтягу, NNT становить 1/ 0,02 = 50, таким чином одна травма попереджається на кожних 50 суб’єктів, які виконують розтяг).
Багато досліджень не повідомляють про шкідливий вплив терапії (тобто на «побічні ефекти» або «ускладнення» від терапії). Це прикро, оскільки, відсутність повідомлень про шкідливі наслідки часто трактується як свідчення того, що терапія не завдає шкоди, але очевидно, що так не повинно бути. Glaziou та Irwig (BMJ 1995;311:1356-9) стверджували, що ефект від терапії, як правило, найбільш виражений, коли вона надається пацієнтам з найбільш важкими станами (наприклад, очікується, що бронхіальна аспірація призведе до значного зниження ризику зупинки дихання у пацієнта з травмою голови, які мають суттєву затримку виведення мокротиння, ніж у пацієнта з травмою голови з незначною затримкою виведення мокротиння). І навпаки, ризики від терапії (у даному випадку від підвищеного внутрішньочерепного тиску) мають тенденцію бути відносно незмінними, незалежно від тяжкості стану. Таким чином, терапія з більшою ймовірністю робить більше користі, ніж шкоди, коли вона застосована до пацієнтів з важкими станами, і терапевти повинні відносно неохоче надавати терапію, яка має потенційно серйозні побічні ефекти, коли пацієнт має менш важкий стан.
На практиці, для клінічних досліджень часто дуже складно виявити шкідливі наслідки, оскільки шкідливі наслідки мають тенденцію до нерегулярності, і більшість досліджень не володіють достатнім розміром вибірки для виявлення шкідливого впливу при його появі. Таким чином, навіть після того, як були проведені якісні рандомізовані контрольовані дослідження терапії, важливу роль відіграють великомасштабні «моніторингові» дослідження, які слідкують за великими когортами пацієнтів, що проходять лікування, для того щоб переконатися, що шкідливі наслідки надмірно не виникають. До тих пір, поки такі дослідження не будуть проведені, терапевти повинні бути обережними при застосуванні потенційно шкідливої терапії, особливо для пацієнтів, які отримують відносно малі результати від терапії.
Додатковий рівень складності під час критичного аналізу передбачає врахування ступеня неточності оцінки розміру ефекту, який запропонований у клінічному дослідженні. Дослідження проводяться на вибірці суб’єктів, які повинні представляти певний контингент. Це означає, що найкраще дослідження може представити (не зовсім точну) оцінку розміру ефекту від лікування. Клінічні дослідження із залученням великої кількості суб’єктів підвищують (більш точно) оцінку розміру лікувального ефекту, ніж ті, які залучають невелику кількість суб’єктів. В ідеалі читачі повинні враховувати ступінь неточності оцінки при вирішенні питання про те, що означають результати клінічного дослідження, оскільки це часто впливає на ступінь достовірності, що є частиною висновків зроблених у конкретному дослідженні. Найкращий спосіб це зробити – вирахувати довірчі інтервали оцінки розміру ефекту від лікування, якщо вони не вказані у звіті дослідження. Навчальний матеріал про те, як вирахувати та інтерпретувати довірчі інтервали загальних показників розміру ефекту наведено у:
- Herbert RD. How to estimate treatment effects from reports of clinical trials. I: Continuous outcomes. Aust J Physiother 2000;46:229-35
- Herbert RD. How to estimate treatment effects from reports of clinical trials. II: Dichotomous outcomes. Aust J Physiother 2000;46:309-13.
Читачам, які відчувають впевненість (вибачте) з довірчими інтервалами, може бути корисним завантажити калькулятор довірчих інтервалів PEDro. Калькулятор має форму електронної таблиці Excel.
Останньою частиною у прийнятті рішення про корисність терапії є вирішення питання, чи терапія є економічно ефективною. Це особливо важливо, коли охорона здоров’я оплачується або субсидується з громадських грошей. Ніколи не буде достатньо ресурсів для фінансування усіх нововведень у галузі охорони здоров’я (можливо навіть не усіх корисних інновацій). При цьому витрати на будь-яку терапію призводять до того, що витрачені кошти не можуть бути скеровані на інші форми забезпечення охорони здоров’я. Розумний розподіл обмежених ресурсів передбачає таку витрату грошей, яка дає найбільший економічний прибуток на один затрачений долар. Звичайно, терапія не може бути економічно ефективною, якщо вона є неефективна. Але ефективна терапія може бути економічно невигідною. Методи, які визначають економічну вигоду знаходяться поза межами досвіду авторів, і, мабуть, краще, якщо я скерую до більш авторитетних джерел. Якщо вас це зацікавило, ви можете прочитати:
- Drummond MF, Richardson WS, O’Brien BJ, Levine M, Heyland D. User’s guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: A. Are the results of the study valid? JAMA 1997;277:1552-7.
- O’Brien BJ, Heyland D, Richardson WS, Levine M, Drummond MF. User’s guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: B. What are the results and will they help me in caring for my patients? JAMA 1997;277:1802-6.
Щоб підсумувати цей розділ:
Статистична значимість не прирівнюється до клінічної корисності. Щоб бути клінічно корисною, терапія повинна:
- впливати на результати, у яких зацікавлені пацієнти
- мати достатньо великий ефект, щоб бути результативною
- приносити більше користі, ніж завдавати шкоди
- бути економічно вигідною.
Якщо ви хочете додатково почитати про оцінку розміру ефекту, можна звернутися до::
Guyatt GH, Sackett DL, Cook DJ, та ін. User’s guide to the medical literature: II. How to use an article about therapy or prevention: B. What were the results and will they help me in caring for my patients? JAMA 1994;271:59-63.
4. Відеоматеріали
Практична діяльність заснована на доказах: частина 1.1 “Загальний огляд”
Практична діяльність заснована на доказах: частина 1.2 “Загальний огляд продовження”
Практична діяльність заснована на доказах: частина 2.0 “Критична оцінка доказів”