Tutoriais

Você pode aprimorar suas habilidades em prática baseada em evidências usando estes tutoriais do PEDro:

  1. Como realizar uma pergunta clinica
  2. Esse estudo é válido?
  3. Essa terapia é clinicamente útil?

1. Como realizar uma pergunta clinica

Antes de iniciar a sua busca por uma pergunta clínica é bom desprender algum tempo pensando sobre a questão que você quer responder. Isto porque, formular e refinar sua questão, vai tornar mais fácil a buscar por uma resposta. Este vídeo tutorial explica como realizar uma pergunta clinica com o formato PICO (Paciente-Intervenção-Comparação-Desfecho).

2. Esse estudo é válido?

Laser seria um tratamento efetivo para epicondilite lateral? Programas de alongamento previnem o desenvolvimento de contratura em pacientes que tiveram acidente vascular cerebral? O uso de flutter reduz complicações pulmonares pós-operatórias? Respostas rigorosas para essas questões só podem ser dadas através de um estudo clínico propriamente delineado e implementado. Infelizmente a literatura médica possui tanto estudos bem delineados com conclusões válidas quanto estudos mal delineados com conclusões inválidas. O leitor precisa ter condições de dintinguir esses dois tipos de estudo. Esse tutorial descreve pontos centrais de estudos clínicos (ou “filtros metodológicos”) que conferem a validade dos mesmos.

Alguns estudos que supostamente determinam a eficácia de tratamentos de fisioterapia simplesmente recrutam um grupo de pacientes e medem a severidade da condição antes e após o tratamento. Se os voluntários melhoraram após o tratamento, é dito que o tratamento foi eficaz. Estudos que usam desses métodos raramente proporcionam uma evidência que o tratamento foi eficaz, uma vez que não é possível dizer que toda a melhora foi devida exclusivamente ao tratamento. Fatores como história natural, “regressão para a média” (um fenômeno estatístico que as pessoas se tornam menos “extremas” com o passar do tempo simplesmente devido a variabilidade do problema), efeitos placebo e efeitos “Hawthorne” (que sujeitos reportam melhoras, simplesmente para deixar os investigadores satisfeitos). A única maneira de lidar com esses problemas que ameaçam a validade do estudo é através da adoção de um grupo controle. Dessa forma uma comparação é feita entre os resultados dos pacientes que receberam o tratamento e os pacientes que não receberam o tratamento.

A lógica de estudos clínicos é que, na média, variáveis externas (como placebo, por exemplo) deveriam agir da mesma forma nos grupos intervenção e controle. Assim, qualquer diferença entre os grupos ao final do experimento só seria creditada ao tratamento. Por exemplo, é sabido que a maioria dos casos de dor lombar aguda se resolve expontaneamente e rapidamente, mesmo sem tratamento. Por isso, demonstrar que os sujeitos melhoraram após receber tratamento não constitui evidência de eficácia terapêutica. Um estudo clínico controlado que mostra que sujeitos que receberam o tratamento foram melhores que os controles constituirá melhor evidência que a melhoria ocorreu devido ao tratamento, porque a história natural deve ter ocorrido tanto no grupo intervenção, quanto no grupo controle. A observação que os sujeitos que receberam o tratamento melhoraram mais que os controles sugerem que alguma coisa maior que a “recuperação natural” fez que os sujeitos melhorassem. Note que num estudo controlado, o grupo “controle” não precisa ser um grupo sem tratamento. Geralmente, em estudos clínicos, a comparação é entre um grupo controle que recebeu terapia convencional e o grupo experimental recebeu o tratamento convencional mais o tratamento a ser investigado. Alguns estudos comparam tratamento convencionais e um grupo experimental que recebeu uma terapia nova.

Importante dizer que os grupos controle somente proporcionam proteção contra efeitos de variáveis externas se as características dos grupos tratamento e controle forem semelhantes. O pesquisador só pode se certificar que as diferenças entre os grupos ao fim do estudo se deu ao tratamento se os pacientes dos grupos tratamento e controle são similares. Isso pode acontecer se a distribuição dos sujeitos for aleatória. Isso assegura que fatores externos como história natural terá o mesmo efeito nos grupos tratamento e controle. De fato, quando sujeitos são distribuídos em grupos, as diferenças entre as condições de tratamento e controle pode somente ocorrer devido ao tratamento ou ao acaso, e é possivel eliminar diferenças ao acaso através de testes estatísticos. Note que essa é a unica maneira de se assegurar a comparabilidade dos grupos tratamento e controle. Não existe nenhuma outra forma satisfatória alternativa para se distribuir sujeitos que não seja através de aleatorização.

Mesmo quando os sujeitos forem distribuídos aleatoriamente , é necessário assegurar que o efeito (ou falta do efeito) do tratamento não foi distorcido por viés de avaliação (ou observação). Isso porque existe a possibilidade que as crenças do investigador sobre a eficácia de determinado tratamento pode inconscientemente distorcer a medida dos resultados do tratamento. A melhor proteção seria “cegar” o avaliador, certificando-se que a pessoa que mediu os resultados não sabia se o sujeito fez ou não o tratamento. É geralmente desejável que os pacientes e terapeutas também sejam cegos. Quando os pacientes estão cegos, você se certifica que o efeito aparente da terapia não foi produzido por efeitos placebo ou Hawthorne. Cegar os terapeutas das terapias que os mesmos estão aplicando é difícil ou impossível, mas nos estudos que é possivel cegar os terapeutas (por exemplo em estudos de terapia a laser, que os laser emitem laser ou apenas uma luz colorida, mas o terapeuta não sabe qual é real), você saberá que os efeitos da terapia são de fato efeitos da própria terapia ao invés de terem sido produzidos pelo entusiasmo do terapeuta.

É também importante que poucos ou nenhum sujeito interrompa a participação durante o estudo (drop out). Isso porque os abandonos podem seriamente distorcer os achados do estudo. O efeito real do tratamento pode ser manipulado se, por exemplo, os participantes do grupo controle que pioraram durante o estudo abandonarem o mesmo para procurar outro tratamento; isso faria com que a média de resultados do grupo controle fosse melhor do que a média de resultados se os participantes não saíssem do estudo. Da mesma forma, se o tratamento causar a piora dos sujeitos e os mesmos saíram do estudo, o tratamento vai parecer mais eficaz do que seria. Por esse motivo, drop-outs sempre produzem incertezas na validade de um estudo clínico. Quanto mais drop-outs, maior será a incerteza. Via de regra se mais do que 15% dos sujeitos interromperem o estudo, os resultados do mesmo estará sériamente comprometido. Alguns autores simplesmente não reportam o número de drop-outs. Mantendo a visão científica de “culpado até que se prove ao contrário” esses estudos devem ser considerados inválidos.

Para sumarizar, estudos clínicos validos:

  • distribui aleatoriamente sujeitos em grupos de tratamento e controle
  • os avaliadores devem ser cegos, e preferencialmente os pacientes e terapeutas também deveriam estar cegos
  • ter poucos dropouts.

Na próxima vez que você ler um estudo clínico de um tratamento de fisioterapia, pergunte a você mesmo se o estudo possui essas características. Via de regra, os estudos que não satisfazem esses critérios podem ser considerados inválidos e não deveriam ser considerados como prova de forte evidência para a eficácia (ou ineficácia) de determinado tratamento. Os estudos que satisfazem esses critérios devem ser lidos com muito cuidado e os resultados devem ser memorizados para sempre!

Se você quiser ler mais sobre avaliação da validade de estudos clínicos, procure ler o seguinte texto:
Guyatt GH, Sackett DL, Cook DJ, et al. Users’ guide to the medical literature: II. How to use an article about therapy or prevention: A. Are the results of this study valid? JAMA 1993;270:2598-601.

3. Essa terapia é clinicamente útil?

O tutorial anterior apresentou uma lista de critérios que os leitores podem utilizar para diferenciar estudos que seriam válidos daqueles que não seriam. Estudos que não satisfazem esses filtros metodológicos deveriam ser ignorados. Essa seção considera como os terapeutas devem interpretar os estudos que satisfazem a maioria dos filtros metodológicos. A mensagem a ser passada é que olhar simplesmente para significância estatística não é suficiente. Você precisa checar se os resultados medidos são relevantes e se os efeitos positivos da terapia são suficientemente grandes para que um determinado tratamento seja considerado útil. Os efeitos deletérios (colaterais) da terapia também devem ser pequenos ou ausentes para que a terapia faça mais bem do que mal para os pacientes. Finalmente a terapia deve ter um bom custo-benefício.

Para um estudo ser considerado útil, o mesmo deve investigar efeitos terapêuticos relevantes. Isso significa que os resultados devem ser medidos de uma forma válida. Em geral, devemos julgar se o tratamento vale a pena somente se o mesmo satisfaz as necessidades dos pacientes, ou seja as medidas de resultados devem ser relevantes para os pacientes. Sendo assim, um estudo que mostra que laser de baixa intensidade diminui os níveis de serotonina é muito menos valioso do que um estudo que mostra que laser de baixa intensidade diminui dor, assim como um estudo que demonstra que treinamento motor diminui espasticidade é muito menos útil do que um que demonstra que a mesma intervenção aumentou a independência funcional dos pacientes.

O tamanho do efeito é obviamente relevante, mas isso é constantemente deixado de lado. Talvez isso aconteça porque muitos leitores não sabem distinguir “significância estatística” de “significância clínica”. Ou talvez porque os estudos refletem a preocupação de muitos autores de estudos clínicos se o “p foi menor que 0.05” ou não. Significância estatística (“p < 0.05”) é usada para saber se o efeito da terapia foi grande o suficiente para que essa diferença não ocorresse ao acaso. Isso é muito importante (nós precisamos saber se o efeito observado não ocorreu simplesmente ao acaso) mas a significância estatística não diz nada a respeito da magnitude do efeito terapêutico. A melhor estimativa do tamanho do efeito é a diferença média entre os grupos. Portanto, imagine um estudo hipotético que mediu os efeitos de mobilização em pacientes com dor no ombro. Esse estudo mediu dor numa escala de 10 centímetros em que o grupo que recebeu o tratamento teve a dor reduzida em 4 cm e o grupo controle teve a dor reduzida em 1 cm, a melhor estimativa do efeito é uma redução de 3 cm na escala visual análoga de dor (isso é 4 cm menos 1 cm = 3 cm). Outro estudo hipotético que testou exercícios de flexibilidade antes da prática esportiva reportou que 2% dos pacientes no grupo alongamento se lesionaram, comparado a 4% no grupo controle. Nesse caso a melhor evidência é que alongamento reduz o risco de lesão em 2% (4% menos 2% = 2%). Leitores de estudos clínicos precisam olhar para o tamanho do efeito para que os mesmos decidam se o efeito é grande o suficiente para que seja clinicamente relevante. Lembre-se que pacientes geralmente procuram curas através dos tratamentos (claro que essa generalização não se aplica em muitas áreas clínicas) e muitos pacientes não estão interessados em terapias com efeitos pequenos.

Há uma importante distinção quando se analisa o tamanho dos efeitos de tratamento. Isso se aplica a estudos os quais os resultados são medidos por uma medida dicotômica (ou categórica) (resultados dicotômicos só podem ter um de dois valores, como sobrevivência ou morte, admissão a um setor de saúde ou não admissão, o que não se aplica para variáveis como dor, que é usualmente medida numa escala de 0 a 10). Muitos estudos que medem resultados dicotômicos vão reportar os efeitos da terapia através de razões ao invés de diferenças (Essa razão é usualmente chamada de “risco relativo” ou “odds ratio” ou “hazard ratio”, mas também podem ter outros nomes). Quando os resultados são expressados dessa forma, os achados do nosso estudo hipotético de exercícios de flaxibilidade seria reportado como 50% de redução no risco de lesão (uma vez que 2% é metade de 4%). Usualmente o problema de reportar os efeitos de tratamento em razões é que o efeito parece ser grande. A melhor medida é a diferença entre dois grupos (de fato, a medida mais útil seria o inverso da diferença que é chamado de “número necessário para tratar – NNT” por nos dizer quantos pacientes nós precisariamos tratar para previnir um evento adverso. No caso do estudo de flexibilidade o NNT é 1/0.02 = 50, portanto uma lesão é previnida para cada 50 pessoas que se alongam).

Muitos estudos não reportam efeitos deletérios dos tratamentos (efeitos colaterais ou complicações). Isso é uma pena, uma vez que a ausência dessa informação é comumente interpretada como que a terapia não teria nenhum efeito deletério, o que é improvável. Glaziou e Irwig (BMJ 1995;311:1356-9) declararam que os efeitos da terapia são usualmente maiores em pacientes que estão em condições mais severas (por exemplo, espera-se que aspiração brônquica produza uma maior redução no risco de parada respiratória em pacientes com traumatismo craniano que tenham altos volumes de secreção do que em pacientes com traumatismo craniano que tenham baixos volumes de secreção). Em contraste, os riscos da terapia (nesse caso, devidos a pressão intracraniana) tendem a ser relativamente constantes, independente da severidade do problema. Portanto a terapia tem maiores chances de ter uma melhor relação risco-benefício em pacientes com maior severidade, e terapeutas devem estar relutantes em prescrever uma terapia que possui possíveis efeitos colaterais em pacientes com problemas de menor severidade.

Em termos práticos, é geralmente difícil de serem detectados efeitos deletérios em estudos clínicos, isso se deve porque efeitos deletérios não ocorrem frequentemente, e a maioria do estudos terão amostras insuficientes para detectar esses efeitos deletérios (quando os mesmos acontecerem). Então, mesmo com estudos clínicos aleatorizados de alta qualidade, faz-se necessário que sejam realizados estudos de coorte prospectivos para monitorar os pacientes para que se tenha certeza que efeitos deletérios não ocorreram de forma excessiva. Até que esses estudos sejam realizados, terapeutas devem estar cientes que suas terapias podem estar gerando efeitos deletérios, particularmente naqueles pacientes que vão ter pouco benefício da terapia.

Num nível maior de sofisticação em análise crítica de estudos clínicos deve-se considerar o grau de imprecisão nas estimativas de efeito. Estudo são feitos com amostras populacionais que seriam representativas de certas populações. Isso significa que na melhor das hipóteses um estudo clínico pode proporcionar com precisão “imperfeita” a estimativa do tamanho do efeito terapêutico. Estudos clínicos com um número alto de sujeitos apresentam uma melhor (mais precisa) estimativa do tamanho do efeito do que estudos com um pequeno número de sujeitos. Os leitores de estudos clínicos deveriam considerar o grau de imprecisão das estimativas para tomar suas decisões sobre o que o estudo realmente quer dizer (ou seja as conclusões do estudo dependem criticamente dos graus de certeza ou incerteza apresentados pelo estudo). A melhor maneira de se fazer isso seria calcular os intervalos de confiança que cercam as estimativas do efeito (no caso que o estudo não apresente os intervalos de confiança). Um tutorial sobre como calcular e interpretar intervalos de confiança é apresentada por:

Leitores que estão confiantes sobre intervalos de confiança podem achar relevante fazer o download da calculadora de intervalos de confiança do PEDro, essa calculadora está na forma de uma planilha Excel.

A última parte sobre a decisão de que uma terapia é ou não útil está relacionada ao custo-benefício da terapia. Isso é particularmente importante quando o custo do tratamento é pago através do governo. Nunca haverá recursos suficientes para pagar todas as inovações de cuidados de saúde (provavelmente nem para pagar as boas inovações em saúde). A alocação de recursos financeiros deve seguir os princípios do bom senso e portanto o dinheiro deve ser investido aonde o efeito finaceiro é o melhor. Claramente uma terapia não pode ter um bom custo-benefício se não há benefício, mas terapias eficazes podem ter uma relação de custo-benefício alta. Os métodos utilizados para determinar custo-benefício estão acima dos limites do conhecimento do autor que escreveu esse texto, e seria melhor se você procurasse uma melhor fonte de informação, caso você esteja interessado, você provavelmente vai gostar de ler:

  • Drummond MF, Richardson WS, O’Brien BJ, Levine M, Heyland D. Users’ guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: A. Are the results of the study valid? JAMA 1997;277:1552-7.
  • O’Brien BJ, Heyland D, Richardson WS, Levine M, Drummond MF. User’s guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: B. What are the results and will they help me in caring for my patients? JAMA 1997;277:1802-6.

Sumarizando essa seção:

Significância estatística não é a mesma coisa que utilidade clínica. Para ser clinicamente útil, a terapia deve:

  • ser dirigida aos interesses do paciente
  • ter efeitos grandes o suficiente para que valha a pena
  • fazer mais bem do que mal
  • ter uma boa relação de custo-benefício.

Se você quiser ler mais sobre avaliação do tamanho do efeito, você pode consultar:
Guyatt GH, Sackett DL, Cook DJ, et al. Users’ guide to the medical literature: II. How to use an article about therapy or prevention: B. What were the results and will they help me in caring for my patients? JAMA 1994;271:59-63.

Inscreva-se na Newsletter do PEDro para receber as últimas notícias