Samouczki

Możesz rozwinąć swoje umiejętności w zakresie evidence-based practice, korzystając z samouczków PEDro:

Jak zadać pytanie kliniczne
Czy eksperyment jest wiarygodny?
Czy ta terapia jest przydatna klinicznie?

1. Jak zadać pytanie kliniczne

Zanim zaczniemy wyszukiwanie klinicznych badań naukowych, najlepiej poświęcić trochę czasu i pomyśleć, na jakie pytanie chcemy znaleźć odpowiedź. Jest tak, ponieważ formułowanie i dopracowywanie takiego pytania powoduje, że łatwiej znaleźć badania naukowe, aby na nie odpowiedzieć. Ten samouczek wideo wyjaśnia, jak zadawać pytania kliniczne w formacie PICO (Patient-Intervention-Comparison-Outcome – Pacjent-Interwencja-Komparator-Efekt).

2. Czy eksperyment jest wiarygodny?

Czy laser niskoenergetyczny jest skuteczną terapią w zapaleniu nadkłykcia bocznego? Czy program stretchingu zapobiega rozwojowi przykurczów po udarze mózgu? Czy zastosowanie zastawki z wiotkim płatkiem zmniejsza oddechowe powikłania pooperacyjne? Ścisłe odpowiedzi na te pytania mogą być udzielone jedynie poprzez właściwie zaprojektowane, właściwie przeprowadzone kliniczne badania eksperymentalne. Niestety, literatura zawiera zarówno prawidłowo przeprowadzone badania, z wiarygodnymi wnioskami, jak i źle przeprowadzone badania, z niewiarygodnymi wnioskami. Czytelnik musi potrafić rozróżnić pomiędzy nimi. Ten samouczek opisuje kluczowe cechy klinicznych badań eksperymentalnych (czy też „filtry metodologiczne”), potwierdzające wiarygodność badania.

Niektóre badania, w których stwierdza się skuteczność postępowania fizjoterapeutycznego, po prostu obejmują grupę osób z danym problemem zdrowotnym i u tych osób wykonuje się ocenę nasilenia tego problemu zdrowotnego przed i po terapii. Jeżeli stan badanych poprawia się w okresie terapii, stwierdza się, że terapia była skuteczna. Badania, w których stosuje się te metody, rzadko dostarczają przekonujących dowodów skuteczności terapii, ponieważ rzadko można być pewnym, że obserwowana poprawa była spowodowana terapią, a nie czynnikami (zmiennymi) zewnętrznymi, jak naturalne zdrowienie, regresja statystyczna (prawidłowości statystyczne, przez które osoby stają się z czasem mniej „ekstremalnymi”, po prostu w wyniku zmienności ich problemu zdrowotnego), efekt placebo, albo efekt „Hawthorne” (gdzie badani zgłaszają poprawę, ponieważ myślą, że to chce usłyszeć badający). Jedynym zadowalającym sposobem radzenia sobie z tymi zagrożeniami wiarygodności badania jest grupa kontrolna. Wtedy porównanie jest dokonywane pomiędzy efektami u badanych, u których zastosowano terapię i u badanych, u których nie zastosowano terapii.

Logika badań kontrolowanych jest taka, że, przeciętnie, zmienne zewnętrzne powinny oddziaływać w tym samym stopniu na obie grupy – grupę z terapią i grupę kontrolną, tak aby jakiekolwiek różnice pomiędzy grupami na końcu eksperymentu były spowodowane terapią. Przykładowo, powszechnie wiadomo, że w większości przypadków ostre bóle dolnego odcinka kręgosłupa ustępują spontanicznie i szybko, nawet przy braku jakiejkolwiek terapii, a więc pokazanie po prostu, że stan badanych poprawił się w przebiegu terapii nie będzie stanowiło dowodu na skuteczność terapii. Badanie kontrolowane, w którym pokazano, że badani poddawani terapii uzyskali poprawę, w porównaniu do grupy kontrolnej, dostarczy lepszych dowodów, że poprawa wynikła z prowadzenia terapii, ponieważ naturalna poprawa powinna była wystąpić zarówno w grupie z terapią, jak i w grupie kontrolnej. Obserwacja, że poprawa w grupie z terapią była większa niż w grupie kontrolnej, sugeruje, że coś więcej niż naturalna poprawa spowodowało poprawę u badanych. Proszę zauważyć, że w badaniu kontrolowanym grupa „kontrolna” niekoniecznie nie musi otrzymywać terapii. Często w kontrolowanych badaniach eksperymentalnych porównuje się grupę kontrolną otrzymującą standardową terapię i grupę eksperymentalną otrzymującą standardową terapię plus terapię testowaną. Ewentualnie, niekiedy porównuje się grupę kontrolną otrzymującą standardową terapię i grupę eksperymentalną otrzymującą nową terapię.

Co istotne, grupy kontrolne chronią jedynie przed efektami zakłócającymi ze zmiennych zewnętrznych na tyle, na ile grupy eksperymentalna i kontrolna są podobne. Jedynie kiedy grupy eksperymentalna i kontrolna są takie same w każdym aspekcie determinującym wynik (z wyjątkiem stosowania lub niestosowania terapii), eksperyment można uznać za zapewniający, że różnice pomiędzy grupami na jego końcu są spowodowane terapią (badaną interwencją). W praktyce osiąga się to poprzez losowe przydzielanie badanych do grup eksperymentalnej i kontrolnej. Zapewnia to, że czynniki zewnętrzne, jak np. naturalna poprawa, mają mniej więcej takie samo znaczenie w grupach eksperymentalnej i kontrolnej. Tak naprawdę, kiedy badani są przydzielani losowo do grup, różnice pomiędzy grupami eksperymentalną i kontrolną mogą wystąpić jedynie z powodu terapii (interwencji) lub przez przypadek, i jest możliwe, aby wykluczyć przypadek, jeśli różnice są wystarczająco duże – do tego służą testy statystyczne. Proszę zauważyć, że jest to jedyny sposób na zapewnienie porównywalności grup eksperymentalnej i kontrolnej. Nie ma w pełni przekonującej alternatywy dla alokacji losowej.

Nawet jeśli badani są losowo przydzieleni do grup, koniecznie trzeba się upewnić, że efekt (albo brak efektu) nie jest wypaczony przez „błąd systematyczny obserwatora” („observer bias”). Odnosi się to do możliwości, że przekonanie badacza o skuteczności terapii (interwencji) może podświadomie wypaczyć ocenę (pomiar) efektów terapii. Najlepszym sposobem zapobiegnięcia jest „zaślepienie” obserwatora – upewnienie się, że osoba oceniająca (mierząca) efekty nie wie, czy u badanego stosowano terapię, czy nie . Generalnie jest pożądane, aby pacjent i terapeuta także byli zaślepieni. Kiedy pacjenci są zaślepieni, można stwierdzić, że przypuszczalne efekty terapii nie wynikają z placebo albo efektu Hawthorne. Zaślepienie terapeutów co do terapii, którą stosują, jest często trudne albo niemożliwe, ale w badaniach, w których terapeuci są zaślepieni co do terapii (jak, na przykład, w badaniach dotyczących laserów niskoenergetycznych, gdzie aparat emituje albo światło laserowe albo światło o danej barwie, ale terapeuta nie jest informowany, które), można stwierdzić, że efekty terapii nie były wytworzone przez entuzjazm terapeuty do terapii, zamiast terapii jako takiej.

Również jest ważne, aby niewielu badanych przerwało uczestnictwo („wypadający”, „drop-out”) w trakcie realizacji eksperymentu. Chodzi o to, że wypadanie może poważnie wypaczyć wyniki badania. Prawdziwy efekt terapii może być zamazany, jeżeli badani z grupy kontrolnej, których stan zdrowia się pogorszył, opuszczą badanie przed jego zakończeniem w poszukiwaniu leczenia. Może to spowodować, że przeciętny efekt w grupie kontrolnej będzie wyglądał lepiej niż faktycznie był. I odwrotnie, jeżeli terapia powoduje pogorszenie u niektórych badanych i ci badani opuszczą badanie, terapia będzie wyglądać na bardziej efektywną niż faktycznie była. Z tego powodu wypadanie zawsze prowadzi do niepewności co do wiarygodności wyników eksperymentu klinicznego. Oczywiście, im więcej wypadających, tym większa niepewność – z grubsza zakłada się, że jeśli wypada powyżej 15% badanych, to badanie jest poważnie wypaczone. Niektórzy autorzy po prostu nie informują o liczbie badanych, którzy nie dokończyli badania. Trzymając się utrwalonej naukowej zasady bycia winnym, dopóki nie udowodni się niewinności, takie badania powinny być uważane za potencjalnie niewiarygodne.

Podsumowując, wiarygodne eksperymenty kliniczne:

losowo rozmieszczają badanych w grupach z terapią i kontrolnej
zaślepiają badających, a najlepiej pacjentów i terapeutów
mają niewielu wypadających.

Następnym razem, gdy będziesz czytać artykuł opisujący eksperyment kliniczny dotyczący fizjoterapii, zadaj sobie pytanie, czy badanie ma te cechy. Zasadniczo badania eksperymentalne, które nie spełniają tych kryteriów, mogą być niewiarygodne i nie powinny być uważane za stanowiące silny dowód skuteczności (lub nieskuteczności) terapii. Te badania, które spełniają te kryteria, powinny być uważnie przeczytane, a ich wnioski powinny zapaść w pamięć!

Jeśli chcesz poczytać więcej na temat oceniania wiarygodności badania eksperymentalnego, spróbuj:
Guyatt GH, Sackett DL, Cook DJ, i wsp. User’s guide to the medical literature: II. How to use an article about therapy or prevention: A. Are the results of this study valid? JAMA 1993;270:2598-601.

3. Czy ta terapia jest przydatna klinicznie?

Poprzedni samouczek przedstawił listę kryteriów, które czytelnicy mogą użyć, aby rozróżnić, które badania mogą być wiarygodne, a które mogą nie być. Badania, które nie odpowiadają większości filtrów metodologicznych, zazwyczaj najlepiej, żeby były ignorowane. Ta sekcja zawiera wskazówki, jak terapeuci powinni interpretować te eksperymenty kliniczne, które odpowiadają większości filtrów metodologicznych. Przekaz jest taki, że nie wystarczy po prostu poszukać badań dostarczających dowodów na istotny statystycznie efekt terapii. Powinno się przekonać, czy eksperyment mierzy efekty, które mają znaczenie, i czy pozytywne efekty terapii są na tyle duże, aby sprawić, że terapia jest wartościowa. Szkodliwe skutki terapii muszą być nieczęste albo nieznaczne, tak aby terapia przynosiła więcej dobrego niż złego. Wreszcie, terapia musi być efektywna kosztowo.

Oczywiście, eksperyment, aby być użytecznym, musi badać skutki terapii, które mają znaczenie. Oznacza to, że efekty terapii muszą być mierzone w wiarygodny sposób. Uogólniając, ponieważ zazwyczaj oceniamy podstawową wartość postępowania (terapii, interwencji) przez to, czy zaspokaja potrzeby pacjentów, mierzone efekty powinny mieć znaczenie dla pacjentów. Czyli eksperyment pokazujący, że laser niskoenergetyczny obniża poziom serotoniny jest znacznie mniej użyteczny niż eksperyment pokazujący, że laser niskoenergetyczny zmniejsza ból, a eksperyment pokazujący, że trening motoryczny zmniejsza spastyczność jest znacznie mniej użyteczny niż eksperyment pokazujący, że trening motoryczny poprawia samodzielność funkcjonowania.

Wielkość efektu terapii jest oczywiście istotna, ale często ignorowana. Być może jest tak, ponieważ wielu czytających eksperymenty kliniczne nie docenia różnicy pomiędzy „istotnością statystyczną” a „istotnością kliniczną”. Albo być może jest to odbiciem przywiązania wielu autorów eksperymentów klinicznych do kwestii, czy „p < 0,05″, czy też nie. Istotność statystyczna („p < 0,05″) odnosi się do kwestii, czy efekt interwencji jest większy niż mógłby wynikać wyłącznie zprzypadku. Istotność statystyczna ma znaczenie (potrzebujemy wiedzieć, czy obserwowane efekty interwencji nie były jedynie dziełem przypadku), ale sama w sobie nic nam nie mówi, jak faktycznie duży był efekt. Najlepszym oszacowaniem wielkości efektu interwencji (postępowania, terapii) jest przeciętna różnica między grupami. Zatem, jeśli hipotetyczny eksperyment na temat skutków mobilizacji donosi, że ból barku, mierzony za pomocą 10 cm skali wzrokowo-analogowej, został zmniejszony średnio o 4 cm w grupie z terapią i o 1 cm w grupie kontrolnej, naszym najlepszym oszacowaniem średniego efektu terapii będzie 3 cm zmniejszenie w VAS (bo 4 cm minus 1 cm to 3 cm). Inny hipotetyczny eksperyment na temat stretchingu mięśni przed treningiem sportowym mógłby donosić o 2% pacjentów w grupie ze stretchingiem, którzy następnie doznali urazu, w porównaniu do 4% w grupie kontrolnej. W tym przypadku naszym najlepszym dowodem (wiedzą) z tego badania jest, że stretching zmniejszył ryzyko urazu o 2% (bo 4% minus 2% to 2%). Czytelnicy eksperymentów klinicznych powinni zwracać uwagę na wielkość przedstawianego efektu, aby zdecydować, czy efekt jest wystarczająco duży, aby być wartościowym klinicznie. Pamiętajmy, że pacjenci często przychodzą na terapię szukając remedium (oczywiście to uogólnienie może nie być właściwe do wszystkich obszarów praktyki klinicznej) – większość nie jest zainteresowanych terapiami, które przynoszą jedynie małe efekty.

Jest pewien ważny niuans, jeśli spojrzy się na wielkość efektów terapii. Odnosi się on do badań, w których efekty mają miary dychotomiczne (efekty dychotomiczne mogą mieć jedną z dwóch wartości, na przykład żywy lub martwy, doznał urazu lub nie doznał urazu, przyjęty do zakładu opiekuńczo-leczniczego lub nie przyjęty do zakładu opiekuńczo-leczniczego; kontrastuje to ze zmiennymi takimi jak ocena nasilenia bólu skalą VAS, gdzie wynik może mieć jakąkolwiek wartość pomiędzy 0 i 10, włączając 0 i 10). Wiele badań, mierzących efekty dychotomiczne, będzie wskazywało efekty terapii za pomocą ilorazów (stosunku), a nie za pomocą różnic. (Iloraz jest niekiedy nazywany „ryzykiem względnym” albo „ilorazem szans” albo „ilorazem ryzyka”, ale zdarzają się też inne określenia). Wyrażone w ten sposób wnioski z naszego hipotetycznego badania dotyczącego stretchingu byłyby przedstawione jako 50% zmniejszenie ryzyka urazu (bo 2% to połowa z 4%). Zazwyczaj efekt wyrażenia skutków terapii jako ilorazów służy spowodowaniu, aby efekt terapii wyglądał na duży. Różnica pomiędzy dwoma grupami jest lepszą miarą. (Tak naprawdę, najbardziej użyteczną miarą będzie z powodzeniem odwrócenie różnicy. Czasami nazywa się to „liczbą niezbędną do poddaniu interwencji” („numer needed to treat”), ponieważ mówi nam o tym, średnio, ilu pacjentów trzeba poddać interwencji, aby u jednego zapobiec jednemu niekorzystnemu punktowi końcowemu – w przykładzie ze stretchingiem NNT wynosi 1/0,02 = 50, zatem zapobiega się jednemu urazowi dla każdych 50 osób, które stosują stretching).

W wielu badaniach nie przedstawia się efektów szkodliwych terapii (czyli „efektów ubocznych” albo „komplikacji” terapii). To źle, ponieważ brak doniesień o efektach szkodliwych terapii jest często interpretowany jako wskazujący, że terapia nie działa szkodliwie, a jasne jest, że tak nie powinno się wnioskować. Glaziou i Irwig (BMJ 1995;311:1356-9) przekonują, że skutki terapii są zazwyczaj najbardziej wydatne, jeśli ją zastosować u pacjentów z najbardziej poważnymi problemami zdrowotnymi (na przykład, odsysanie oskrzelowe może spowodować największą redukcję ryzyka zatrzymania oddychania u pacjenta z urazem głowy z obfitym wydzielaniem śliny niż u pacjenta z urazem głowy z nieznacznym wydzielaniem śliny). Przeciwnie, ryzyka leczenia (w tym przypadku, z powodu zwiększonego ciśnienia wewnątrzczaszkowego) raczej są względnie stałe, bez względu na to jak poważny jest problem zdrowotny. Zatem jest bardziej prawdopodobne, że terapia przyniesie więcej dobrego niż złego, kiedy jest stosowana u pacjentów z poważnymi problemami zdrowotnymi, a terapeuci powinni być względnie niechętni do stosowania terapii, potencjalnie przynoszącej poważne efekty uboczne, kiedy pacjent ma mniej poważny problem zdrowotny.

W praktyce, często trudno, aby eksperymenty kliniczne wykryły efekty szkodliwe, ponieważ efekty szkodliwe mają tendencję do nieczęstego występowania, a większość badań będzie miało niewystarczające wielkości próby (liczbę badanych) do wykrycia efektów szkodliwych, kiedy one wystąpią. Zatem, nawet po przeprowadzeniu dobrych randomizowanych eksperymentów kontrolowanych dotyczących terapii, pozostaje ważna rola badań „monitorujących” o dużej skali, w których obserwuje się duże kohorty pacjentów poddawanych terapii, aby upewnić się, że skala zdarzeń szkodliwych nie jest duża. Dopóki takie badania nie zostaną przeprowadzone, terapeuci powinni być rozważni w stosowaniu potencjalnie szkodliwych terapii, zwłaszcza u pacjentów, którzy mogą zyskać na terapii stosunkowo niewiele.

Wyższy poziom zaawansowania oceny krytycznej dotyczy analizy stopnia niedokładności szacunków wielkości efektu, prezentowanych w eksperymentach klinicznych. Eksperymenty są prowadzone na próbach badanych, co do których oczekuje się, że będą reprezentatywne dla konkretnych populacji. Oznacza to, że najlepsze, co można zapewnić w eksperymencie, to (niezupełnie precyzyjne) oszacowanie wielkości efektu terapii (interwencji). Eksperymenty kliniczne na dużych grupach badanych dostarczają lepszych (bardziej precyzyjnych) szacunków wielkości efektu terapii niż eksperymenty kliniczne na małych grupach badanych. Najlepiej, decydując, jaki jest przekaz eksperymentu klinicznego czyli co eksperyment kliniczny wnosi, czytelnicy powinni rozważyć stopień niedokładności oszacowania, ponieważ często taka niedokładność zaburza stopień pewności wniosków, jakie wyciągnięto na podstawie danego eksperymentu. Najlepszym sposobem dokonania tego jest obliczenie przedziałów ufności w odniesieniu to szacunków wielkości efektu interwencji (terapii), o ile nie zostały one wyczerpująco przedstawione w publikacji badania. Samouczek, jak obliczać i interpretować przedziały ufności w odniesieniu do typowych miar wielkości efektu znajduje się w:

Herbert RD. How to estimate treatment effects from reports of clinical trials. I: Continuous outcomes. Aust J Physiother 2000;46:229-35
Herbert RD. How to estimate treatment effects from reports of clinical trials. II: Dichotomous outcomes. Aust J Physiother 2000;46:309-13.

Czytelnicy, którzy są obeznani z przedziałami ufności, mogą uznać za przydatne pobranie kalkulatora przedziałów ufności PEDro. Kalkulator jest w postaci arkusza kalkulacyjnego Excel.

Ostatni etap decydowania co do przydatności terapii obejmuje decydowanie, czy terapia jest efektywna kosztowo. Jest to szczególnie istotne, gdy opieka zdrowotna jest finansowana lub współfinansowana ze środków publicznych. Nigdy nie wystarczy środków, aby zapłacić za wszystkie innowacje w opiece zdrowotnej (przypuszczalnie nie wystarczy nawet dla wszystkich dobrych innowacji). Zatem koszt każdej terapii jest taki, że pieniądze wydane na tą terapię nie będą wydane na inne formy opieki zdrowotnej. Sensowna alokacja ograniczonej sumy środków obejmuje wydawanie pieniędzy tam, gdzie efekt w przeliczeniu na złotówkę jest największy. Oczywiście, terapia, która nie jest efektywna, nie może być efektywna kosztowo. Ale efektywne terapie mogą być nieefektywne kosztowo. Metody stosowane do określania efektywności kosztowej są poza zakresem wiedzy specjalistycznej autora, i zapewne lepiej będzie, jeśli odniosę się do bardziej autorytatywnych źródeł. Jeżeli jesteście zainteresowani, może mielibyście ochotę poczytać:

Drummond MF, Richardson WS, O’Brien BJ, Levine M, Heyland D. User’s guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: A. Are the results of the study valid? JAMA 1997;277:1552-7.
O’Brien BJ, Heyland D, Richardson WS, Levine M, Drummond MF. User’s guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: B. What are the results and will they help me in caring for my patients? JAMA 1997;277:1802-6.

Podsumowując tę sekcję:

Istotność statystyczna to nie to samo co przydatność kliniczna. Aby być przydatną klinicznie, terapia (interwencja) musi:

zmieniać efekty, którymi zainteresowani są pacjenci
przynosić wystarczająco duże efekty, aby być wartą stosowania
czynić więcej dobrego niż złego
być efektywną kosztowo.

Jeśli chcielibyście poczytać więcej o szacowaniu wielkości efektu, można skorzystać z:

Guyatt GH, Sackett DL, Cook DJ, i wsp. User’s guide to the medical literature: II. How to use an article about therapy or prevention: B. What were the results and will they help me in caring for my patients? JAMA 1994;271:59-63.

1. Jak zadać pytanie kliniczne

2. Czy eksperyment jest wiarygodny?

3. Czy ta terapia jest przydatna klinicznie?

Czy chcesz wesprzeć PEDro?

Zapisz się do newslettera PEDro, aby otrzymywać najnowsze wiadomości