사용지침서

PEDro 튜토리얼을 통해 근거중심치료 능력을 향상시킬수 있습니다:

임상 질문을 하는 방법
임상시험이 타당한가
치료법이 임상적으로 유용한가

1. 임상 질문을 하는 방법

검색을 시작하기전에 자신이 원하는 답에 대한 질문을 생각해보는 것이 좋습니다. 답에 대한 질문을 다시금 생각해보는 것이 검색을 더욱 용이하게 할 수 있기 때문입니다. 이 비디오는 PICO (Patient (환자) – Intervention (중재) – Comparison (비교) – Outcome (결과)) 형식을 이용해 어떻게 임상질문을 하는지 보여줍니다.

2. 임상시험이 타당한가

낮은 에너지 레이저가lateral epicondylitis (상완골외상과염)의 치료에 효과적인가? 스트레칭 프로그램이 뇌출혈 후에 수반되는 근육 구축 발생을 예방할 수 있는가? Flutter valve 사용이 수술 후 호흡기 합병증을 줄일 수 있는가? 이러한 질문들의 철저한 답변은 적절하게 계획되고 적합하게 실행된 임상시험을 통해서만 이루어질 수 있을 것입니다. 불행히도 문헌에는 타당한 결론을 도출해내는 제대로 잘 실행된 시험과 타당하지 못한 결론을 도출해내는 잘못 실행된 시험 두 가지가 모두 존재합니다. 독자는 이 두 가지의 차이를 구별해 낼 줄 알아야만 합니다. 이 사용 지침서는 타당성을 부여해줄 임상 시험의 핵심적 특징(혹은 “방법론적 여과장치”)을 설명하여 줍니다.

물리치료의 효과를 밝히기를 주장하는 어떤 연구들은 그저 특정한 질환이 있는 피실험자 집단을 구성하고 치료 전과 후 질환의 심각성 정도만을 측정합니다. 만약 피실험자가 치료 기간 중 호전되었다면, 치료는 효과적이었던 것으로 거론됩니다. 이런 방법을 채택하는 연구들은 치료 효과의 만족스런 근거를 거의 제시하지 못합니다. 왜냐하면 관찰된 호전 양상이 치료로 인한 것인지 아니면 자연 치유, 통계적 회귀(단순한 가변적 결과로 인해 환자의 질환이 시간이 흐름에 따라 그 상태가 덜 “심각”해지는 통계적 현상), 플라시보 효과, 혹은 “Hawthorne” 효과 (피실험자가 호전되었다고 말하는 것이 연구원이 듣고 싶어하는 것이란 생각에 호전되었다고 전하는 것)로 인한 것은 아닌지 명확한 경우가 거의 없기 때문입니다. 이러한 치료 연구의 타당성을 검증하는 만족스런 방법은 대조군을 두는 것밖에 없습니다. 그러면 치료를 받은 피실험자와 치료를 받지 않은 피실험자 간의 결과 차이를 비교할 수 있게 됩니다.

대조군이 있는 연구의 논리는 평균적으로 외부적 변수는 실험군과 대조군 모두에게 같은 정도로 작용하도록 해서 실험 끝날 때 그룹간의 어떤 차이도 치료에 기인한 것이 되도록 한다는 것이다. 그 한 예로써, 대부분의 급성 허리 통증의 경우 아무런 치료를 하지 않아도 자발적으로 급속히 좋아진다는 것은 널리 알려져 있다. 그래서 단순히 피실험자의 상태가 치료단계를 거치며 호전되었다고 보여주는 것은 치료 효과의 근거를 입증할 수 없다. 대조군의 피실험자보다 치료를 받은 피실험자가 나아졌다는 것을 보여주는 실험 결과는 자연 치유가 실험군과 대조군 모두에게서 일어났었기 때문에 대조군의 피실험자의 호전된 상태는 치료에 기인한다는 것을 입증할 더 강력한 근거가 될 수 있다. 대조군이 있는 연구에서는 “대조군”에게 연구 주제가 되는 치료는 전혀 할 필요가 없다는 것을 염두에 두어야 한다. 또한 자주 대조군이 있는 연구에서는 기존에 있는 치료를 받은 대조군과 기존의 치료와 함께 물리 치료를 받은 실험군이 비교 대상이 된다. 그렇지 않으면, 어떤 연구에서는 기존의 치료를 받은 대조군과 새로운 치료를 받은 실험군을 비교하기도 한다.

중요한 것은 실험군과 대조군이 비슷하다는 전제하에 외부 혼란 변수의 영향에 대조군만 보호를 제공한다는 것입니다. 결과를 결정짓는 모든 측면에서 실험군과 대조군이 동일할 때에만 (그들이 치료를 받았는지 안 받았는지를 제외한) 실험자는 실험 결과에서 두 그룹간의 차이가 치료에 기인한 것임을 확신할 수 있습니다. 실제로 이것은 실험 가능한 피실험자 집단을 실험군과 대조군에 무작위로 할당할 때 가능해집니다. 이렇게 함으로써 자연치유의 범위와 같은 외부적 요인은 실험군과 피실험군에게 똑같은 영향을 미치는 것이 확실하게 됩니다. 사실, 피실험자가 무작위로 그룹에 할당되게 되면 실험군과 대조군의 차이는 치료 효과나 우연성에만 기인하게 되고 그 차이가 충분히 크다면 우연성도 배제시키는 것이 가능하게 됩니다-이것은 바로 통계 검증에서 하는 일입니다. 이것이 실험군과 대조군의 비교 가능성을 확고히 할 유일한 방법임을 염두에 두어야 합니다. 무작위 할당외에 확실히 만족할만한 대체 방법은 없습니다.

피실험자가 무작위로 그룹으로 할당되더라도 “관찰자의 편견”으로 치료의 효과 (비효과)가 왜곡되지 않도록 해야합니다. 이것은 치료의 효과가 있다는 연구자의 믿음은 무의식속에서 치료 결과 측정을 왜곡시킬수 있습니다. 이것을 막을 수 있는 가장 최상의 방법은 관찰자에게 맹목법을 사용하는것입니다 – 결과 측정자에게 피실험자가 치료를 받았는지 안 받았는지를 알지 못하게 하는것입니다. 일반적으로 환자와 치료사에게 또한 맹목법을 적용시키는것이 바람직합니다. 만약 환자에게 맹목법을 적용시키면, 그 치료의 효과가 플라시보 효과, 혹은 “Hawthorne” 효과로 인한것이 아님을 알 수 있습니다. 만약 치료사에게 맹목법을 적용시키는게 때론 힘들거나 가능하지 않을 수 있지만 그럴경우에 (예를들어, 치료사에게 저주파 레이저 인지 아님 단지 색깔이 있는 빛 레이저인지를 알려주지 않은 치료사일 경우), 치료의 효과는 치료사의 치료 열정에 의한 것이 아니라 치료 그 자체로 효과가 있었다는것을 알 수 있습니다.

연구가 진행되는 동안, 몇몇의 피실험자가 참여를 그만 두었는가 (“중도하차”) 또한 중요합니다. 왜냐하면 그만둠으로 인해 그 연구의 결과물이 심히 왜곡될 수 있기 때문입니다. 만약 연구중에 상태가 악화된 대조군의 한 피실험자 그 연구에서 빠지게 되면, 그 대조군의 평균값은 원래 값보다 더 좋게 나오게 됨으로써 진정한 치료효과가 가려질 수 있습니다. 역으로, 치료가 어떤 피실험자의 상태를 악화시켰는데, 그 피실험자가 연구에서 빠지게 되면, 그 치료는 원래보다는 더 효과적으로 보여지게 됩니다. 이러한 이유로, 중도포기한 피실험자들로 임상시험의 타당성에 불확실성이 보여집니다. 물론, 더 많은 중도포기한 피실험자가 있다면, 더 큰 불확실성이 있습니다 –어림잡아 15% 보다 더 많은 피실험자가 연구에서 중도포기하여 빠지게 되면 그 논문은 잠재적으로 심한 결점이 있게 됩니다. 몇몇의 저자들은 중도포기한 사람의 수를 단순히 기록하지 않습니다. 무죄라고 판단되기 전까지 문제점의 과학적인 원리확립을 생각해 볼때, 이러한 연구 논문들은 잠정적으로 근거없는 논문으로 고려해야 합니다.

요약하자면, 타당성이 있는 임상 시험은:

피실험자가 치료군 그리고 대조군으로 무작위로 배정되어야 합니다
관찰자에게 맹검법이 사용되어야 합니다. 가급적이면 환자와 치료사 또한 맹검법이 사용되어야 합니다
몇몇의 중도하차.

다음번에 물리치료의 임상 시험 논문을 읽게 된다면, 그 논문안에 다음과 같은 사항들을 포함하는지 본인에게 물어보십시오. 통상적으로, 이러한 기준에 미치지 못하는 논문들은 타당성이 없고 그러한 논문들은 치료 효과의 강력한 근거로 고려하지 말아야 합니다. 하지만 이러한 기준에 적합한 논문들은 꼼꼼히 살펴보아야 하고, 그 결과들은 잘 숙지하여야 합니다.

만약 논문의 타당성 평가에 관해 더 많이 알고 싶으면, 다음 논문을 참조하십시오:
Guyatt GH, Sackett DL, Cook DJ, et al. Users’ guide to the medical literature: II. How to use an article about therapy or prevention: A. Are the results of this study valid? JAMA 1993;270:2598-601.

3. 치료법이 임상적으로 유용한가

앞에 보여진 사용 지침서에서는 독자로 하여금 타당성이 있는 논문과 그렇지 않은 논문을 구별할 수 있는 기준 목록이 있습니다. 방법론적인 기준에 미치지 못한 논문들은 대부분 배제되고 있습니다. 이 부분은 어떻게 치료사들이 방법론적인 기준들은 만족시킨 논문들을 해석해야할지에 대해 고려하고 있습니다. 이는 통계학적으로 유의한 치료 효과의 근거만을 단순히 찾는것만으로는 충분하지 않다는 것입니다. 임상시험은 의미있는 결과를 측정하며, 치료의 긍정적인 효과가 그 치료를 의미있게 만들기에 충분함을 만족시켜야 합니다. 치료의 해로운 효과는 아주 작거나 드물게 나타나야 합니다. 왜냐하면 치료는 해로운 것보다 좋은 영향을 주어야 하기 때문입니다. 마지막으로, 치료는 비용 효율이 높아야 합니다.

물론, 논문이 유용하려면, 치료의 의미있는 효과를 조사하여야 합니다. 즉, 결과를 타당성있는 방법으로 측정해야 합니다. 일반적으로, 치료의 최상의 가치는 환자의 요구사항에 만족했는지에 따라 판단되어지기 때문에 측정된 결과는 환자들에게 의미가 있습니다. 따라서 low-energy laser (저 에너지 레이저) 치료가 통증을 줄인다는 논문보다 세라토닌의 양을 줄인다는 논문이 덜 유용합니다. 그리고 motor training 이 경직을 줄여준다는 논문이 motor training 이 일상생활의 자립을 높인다는 논문보다 덜 유용합니다.

치료 효과의 크기는 확실히 중요하지만 간혹 간과되기도 합니다. 아마도 임상시험 논문을 읽는 많은 독자들은 “통계학적인 유의성”과 “임상적인 유의성”의 차이를 인식하지 못하기 때문입니다. 또는 임상시험 논문을 읽는 많은 독자들이 “p<0.05”인지 아닌지에만 중점을 두고 있기 때문입니다. 통계학적 유의성 (“p<0.05”)은 치료 효과가 우연으로 나온 결과 보다 큰지 아닌지를 알아보는 것입니다. 이 또한 중요하지만 (왜냐하면 보여진 치료의 효과가 단지 우연으로 발견된 결과가 아닌것을 알기 위해서) 그 자체로는 효과가 얼마나 큰지를 알 수는 없습니다. 치료 효과의 크기의 최대 추정치는 그룹간의 평균차이입니다. 따라서 관절 가동법 (mobilisation)이 어깨의 통증, 10cm 시각통증척도로 측정,에 미치는 효과를 보는 가상의 임상시험에서 치료그룹에서는 시각통증척도가 4cm가 감소하였고 대조군에서는 1cm가 감소하였을때, 평균 치료 효과의 최대의 추정치는 시각통증척도에서 3cm 감소입니다 (4cm – 1cm = 3cm이므로). 또다른 예로, 운동을 하기 전의 근육 스트레칭의 효과를 보는 가상의 임상시험에서는 스트레칭 그룹에서 2%의 환자가 나중에 부상을 입었고, 대조군에서는 4%의 환자가 부상을 입었습니다. 이런 경우에 스트레칭이 부상의 위험도를 2% 감소시켰습니다 (4% – 2% = 2% 이므로). 임상시험 논문을 읽는 독자들은 효과가 임상적으로 가치가 있는지를 결정하기 위해서 보고된 효과의 크기를 고려해야 합니다. 환자들은 병을 치유하기 위해서 (물론, 이런 일반화는 모든 분야에 다 적용되지는 않지만) 치료사들을 찾는다는 것을 기억해야 합니다 – 모든 사람들은 작은 효과의 치료에는 관심이 없습니다.

치료 효과의 크기를 고려하려면 아주 세밀해야 합니다. 양분된 결과를 측정하는 연구에 적용됩니다 (양분된 결과는 두개의 값 중 하나, 예를 들어, 삶과 죽음, 부상과 부상없음, 양로병원에 입원과 입원안함; 이러한 값들은 다음에 나오는 변수들과는 반대입니다. 예를 들어, 통증을 측정하는 VAS, 0 에서 10까지에서의 값). 양분된 결과를 측정하는 많은 논문들은 치료 효과를 차이점 보다는 비율로 나타냅니다. (비율은 때때로 “상대 위험” 또는 “오즈비” 또는 “위험 비율”로 불려집니다. 그러나 또다른 이름으로도 불려집니다). 이런식으로 표현된다면, 스트레칭 가상의 연구 결과는 부상 위험도가 50% 줄었다고 기록됩니다 (2%는 4%의 절반이기 때문에). 일반적으로 치료 효과를 비율로 표현하는 결과는 치료 효과를 더 크게 보이기 위해서 입니다. 더 좋은 측정은 두 그룹의 차이를 보는 것입니다. (사실, 가장 유용한 측정은 차이의 정반대일 것입니다. 이는 때때로 “치료가 필요한 환자수 (NNT)”로 불려집니다. 왜냐하면 평균적으로, 유해한 사건을 막기 위하여 얼마나 많은 환자들을 치료해야 하나를 말해주기 때문입니다 – 스트레칭 예에서 보듯이 치료가 필요한 환자수는 1/0.02 =50 이므로 스트레칭한 50환자중 1명은 부상을 방지할 수 있습니다.

많은 연구들은 치료의 해로운 영향 (예를 들어, 치료의 부작용 또는 합병증)을 보고하지는 않습니다. 해로의 영향에 대한 보고가 없으면 종종 치료로 인한 피해가 없다고 보일 수 있습니다. Glaziou 및 Irwig (BMJ 1995;311:1356-9) 저자들은 치료의 효과는 일반적으로 심각한 상태의 (예를 들어, 뇌 손상환자들에게 기관지 흡인법을 사용하면 가래를 적게 보유하고 있는 환자보다 가래를 많이 보유하고 있는 환자의 호흡정지 위험도는 더 많이 낮아집니다) 환자들에게 치료할때가 더 효과가 좋다라고 주장합니다. 하지만, 상태의 심각성과는 무관하게 치료의 위험도 (이런 경우에는 뇌압상승)가 비교적 일정한 경향이 있습니다. 따라서 치료는 심각한 상태인 환자들에게 치료할때 해롭기 보다는 더 좋은 효과를 보입니다. 그리고 치료사들은 환자가 덜 심각한 상태인 경우에는 잠재적으로 심각한 부작용이 있는 치료를 상대적으로 꺼립니다.

실질적으로, 임상시험에서 해로운 영향을 발견하기는 어렵습니다. 왜냐하면 해로운 영향은 드물게 나타나고, 대부분의 연구들은 해로운 영향을 발견할 수 있는 샘플의 크기가 충분히 크지 않기 때문입니다. 따라서, 좋은 치료의 무작위 대조군 연구을 했더라도, 여러번의 치료를 받은 환자들을 통해 해로운 일들이 과다하게 생기지 않음을 확인하는 큰 규모의 “모니터링”연구가 중요합니다. 그런 연구들이 실행될때까지, 치료사들은 잠정적으로 해로운 영향을 미치는 치료에 있어서, 특히 치료를 받고 아주 미약한 효과를 얻는 환자들을 조심해야 합니다.

비판적인 평가에서 복잡함의 추가적인 단계는 임상시험에서 제공된 효과크기의 추정치의 모호함의 정도를 고려하는 것을 포함합니다. 특정 집단 사람들을 대표하는것으로 예상하는 피실험자의 샘플을 대상으로 임상시험은 이루워집니다. 즉, 연구가 최고로 제공할수 있는 것은 (불완전하게 정확한) 치료 효과 크기의 예상치입니다. 다수의 피실험자를 대상으로 한 임상시험은 작은수의 피실험자를 대상으로 한 시험보다는 좀 더 나은 (좀 더 정확한) 치료 효과 크기의 추정치를 제공합니다. 이상적으로, 독자들은 임상시험이 무슨 의미를 하는지를 결정할때 추정치의 모호함의 정도를 고려해야 합니다. 왜냐하면 이것이 특정의 연구에서 결론을 내는데 부여하는 확실성의 정도에 종종 미치기 때문입니다. 만약 임상시험 논문에 분명하게 기록되어 있지 않다면 치료 효과 크기의 추정치에 대한 신뢰구간을 산출하는것이 최상의 방법입니다. 효과크기의 일반적인 측정에 관한 신뢰구간 산출 그리고 해석에 관한 사용 지침서는 기재되어 있습니다:

Herbert RD. How to estimate treatment effects from reports of clinical trials. I: Continuous outcomes. Aust J Physiother 2000;46:229-35
Herbert RD. How to estimate treatment effects from reports of clinical trials. II: Dichotomous outcomes. Aust J Physiother 2000;46:309-13.

신뢰구간에 관해 전문적인 지식이 있는 독자들은 PEDro에 있는 신뢰구간 계산기를 다운로드 하십시오. 이 계산기는 엑셀 스프레드시트의 형태로 되어 있습니다.

치료의 유용함을 결정하는데 있어서 포함시켜야 할 마지막 부분은 치료의 비용효율을 결정하는것 입니다. 이것은 국고에서 지불된 또는 후원된 의료 서비스일때 특히 중요합니다. 의료서비스에서 모든 신기술을 지원하는 충분한 자원이 있을 수가 없습니다 (아마도 모든 좋은 신기술만을 지원하는 것조차도). 따라서 치료에 쓰인 비용은 다른 유형의 의료 서비스에 쓰여지지 못합니다. 비용당 최대 효과를 창출하도록 돈을 사용하는 것이 한정된 지원금액의 합리적인 분할입니다. 물론, 치료가 효과적이지 않으면 치료는 비용면에서 효율성이 있을 수 없습니다. 그러나 효과적인 치료는 비용 효율적일 수 있습니다. 비용 효율성을 결정짓는데 사용된 방법은 저자의 전문분야가 아닙니다. 따라서 권위있는 출저를 추천합니다. 만약 관심이 있으면, 다음을 읽으십시오:

Drummond MF, Richardson WS, O’Brien BJ, Levine M, Heyland D. Users’ guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: A. Are the results of the study valid? JAMA 1997;277:1552-7.
O’Brien BJ, Heyland D, Richardson WS, Levine M, Drummond MF. User’s guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: B. What are the results and will they help me in caring for my patients? JAMA 1997;277:1802-6.

이 부분을 요약하자면:

통계학적으로 유의함은 임상적 유용성과는 대등하지 않습니다. 임상적으로 유용하려면, 치료법은 다음과 같아야 합니다:

환자가 관심있는 결과에 영향을 미치는
가치가 있도록 아주 충분한 효과가 있는지
해롭기 보다는 더 도움이 되는지
비용 효율성이 있는지.

만약 효과 크기를 평가하는것에 더 알고 싶으면, 다음을 참고하십시오:
Guyatt GH, Sackett DL, Cook DJ, et al. Users’ guide to the medical literature: II. How to use an article about therapy or prevention: B. What were the results and will they help me in caring for my patients? JAMA 1994;271:59-63.

1. 임상 질문을 하는 방법

2. 임상시험이 타당한가

3. 치료법이 임상적으로 유용한가

PEDro 를 후원하고 싶으시면?

최근소식을 받고 싶으면 PEDro 뉴스레터에 등록하십시오