您可以運用PEDro教學來提高您的實證本位治療的技能:
1.怎樣去問一個臨床問題
在進行臨床研究文獻搜尋前你最好是先花些時間去思考一下您要回答的問題。因為把問題組織好何具體化能使你更容易找到研究文獻去回答你的問題。這個視頻教程說明如何以PICO(Patient(病人或問題)-Intervention(介入措施或治療)-Comparison(對比的介入措施)-Outcome(預後結果))形式去問一個臨床問題。
2.本研究是否具效度?
低功率激光能否有效治療肱骨外上髁炎?牽拉訓練是否能防止中風後攣縮?使用翼閥能否減少術後呼吸併發症?只有通過設計、進行得當的臨床研究,才能對以上問題提供缜密的答案。令人遺憾的是,文獻資料中既有進行得當、獲得具效度結論的研究,也有進行不當、得出無效結論的研究。讀者必須能夠甄別。本教案描述了具效度臨床研究的重要特徵(或篩選標準)。
有些旨在判斷物理治療方法療效的研究,只是簡單地將一組有特定病情的人放在一起,測量治療前後的嚴重程度。如果受試者經過一段時間治療之後病情有所改善,就說該治療是有效的。採用此類方法的研究很少能提供充分證據說明治療的成效,因爲它幾乎不能確定所觀察到的症狀改善應該歸功於治療,而不是歸結於其他因素,諸如:自然復健、統計回歸(一種統計現象,患者的病情由於隨著時間而波動,從而逐漸顯得不那麽嚴重)、安慰劑效應或霍桑效應(受試者報告病情改善僅因爲他們認爲這是研究者希望看到的效果)。要消除影響研究效度的這些因素,唯一有效的方法是設立對照組。然後,將已接受治療的受試者與沒有接受治療的受試者進行結果對比。
控制研究的邏輯是這樣的:平均而言,研究外因素對治療組和對照組的影響程度是相同的,這樣在研究結束時兩組之間的差值就歸功於治療。舉例來說,衆所周知,大多數急性腰部疼痛病例即使不進行任何治療,也會自然、迅速地消退;因此只能表明受試者在治療過程中病情有所改善,不能證明治療有效。而控制研究表明治療組的受試者比對照組的受試者的進展更好,這樣就比較有力地證明治療使病情改善,因爲治療組和控制組同樣有自然復健的情況。觀察顯示接受治療組比控制組受試者的病情進展更好,說明除了自然復健之外還有其它因素使受試者的病情得到改善。注意:在控制研究中,“對照”組不一定不接受任何治療。在控制研究中,經常將對接受傳統療法的對照組與接受傳統療法加新治療的研究組進行比較。或者,有些研究將接受傳統療法的對照組與接受新療法的研究組進行比較。
重要的是,對照組只能防止研究外因素的干擾,以保證治療組與控制組條件相同。只有當治療和控制組在對結果有決定作用的各個方面都一樣(除了是否接受治療之外),才能確定研究最後的組間差值是治療的結果。在執業中,將整體受試者隨機分配到治療組和對照組,即可達到上述要求。這樣可以確保研究外因素(如自然復健)對治療組和對照組的影響程度是一樣的。實際上,當受試者被隨機分配到各個組時,治療組和對照組之間的差值只是治療或機率造成的結果,如果差值足夠大的話極有可能排除機率因素,這就是統計檢驗的內容。注意:這是保證治療組與對照組之間可比性的唯一方法。還沒有真正滿意的方法可以取代隨機分配。
即使把受試者隨機分配到各組,還必須確保療效(或沒有療效)不會由於“觀察者偏差”而失真,這是指研究者由於相信某項治療而可能會下意識地歪曲治療結果的測量值。最好的保護做法就是對“觀察者”使用受盲,確保測量治療結果的人員不知道受試者是否接受了治療。一般而言,最好對病人和治療師也使用受盲。當病人不知情時,就說明明顯的療效不是由安慰劑效應或霍桑效應造成的。要對治療師使用受盲、不讓他們知道自己採用的療法,這是很難或不可能的。但是如果研究能採用治療師受盲(例如,在低功率激光研究中,可以不讓治療師知道激光器放射的是激光還是彩光),就可以知道療效不是由於治療師熱衷於這種療法,而是因爲這種療法本身有作用。
另外重要的一點,是研究過程中幾乎沒有受試者中途退出。因爲中途退出會嚴重影響研究結果。如果對照組受試者因在研究過程中病情惡化而中途退出以尋求治療,這種情況會掩蓋真實療效,因爲這樣會使控制組的平均結果看起來比實際情況好。相反,如果治療導致某些受試者病情惡化而退出研究,這時療效看起來會比實際效果好。由於這個原因,中途退出經常會給臨床研究的效度帶來不確定性。當然,中途退出越多,不確定性就越大。根據經驗粗略計算:如果15%的受試者退出研究,該研究極可能嚴重失真。有些作者根本就不提及中途退出的人數。按照已經確立的“瑕疵假定”科學原則,這些研究應視爲無效。
總而言之,具效度的臨床研究應該:
- 將受試者隨機分配到治療組和對照組
- 對觀察者使用受盲,最好對病人和治療師也使用受盲
- 極少有受試者中途退出的情況。
下次當您在閱讀物理治療臨床研究報告時,問問自己這項研究是否具備這些特點。一般原則是,不符合這些標準的研究可能是不具效度的,也就是沒有足夠的證據說明治療有效(或無效)。符合這些標準的研究應仔細閱讀,並記下其研究結果!
如果您希望進一步了解研究效度評估,請查看:
Guyatt GH, Sackett DL, Cook DJ, et al. Users’ guide to the medical literature: II. How to use an article about therapy or prevention: A. Are the results of this study valid? JAMA 1993;270:2598-601。
3.這種療法在臨床上有用嗎?
指導書前面的部分列舉了一個標準清單,讀者可用它來區分研究有無具效度。通常說來,不符合大多數篩選標準的研究最好忽略不計。本章考慮治療師應如何解釋那些符合大多數篩選標準的研究。應該知道,僅僅尋找統計學上有顯著意義的療效證據是不夠的。一項研究必須滿足以下條件:研究所測量的結果是有意義的,所取得的正面療效要大到足以使治療值得進行;其有害作用則必須很少出現或很小,從而益處多於害處;最後,該療法必須比較符合成本效果。
當然,研究要有用,必須先調查療效是否有意義。這意味著必須對治療結果進行具效度的測量。一般而言,由於我們經常根據治療是否滿足了病人的需要來判斷治療的主要價值,所以測量結果對病人要有意義。因此,表明低功率激光減少疼痛的研究,比表明低功率激光降低血清素水平的研究要有用得多。表明運動訓練減少痙攣的研究,卻不如運動訓練強化功能獨立性的研究那麽有用。
效應值的大小顯然很重要,但常常被忽略。也許這是因爲許多臨床實驗的讀者忽略了“統計學意義”和“臨床意義”之間的差別,或者可能是反映了許多臨床研究的作者對“p < 0.05”先入爲主的觀念。統計學意義(“p<0.05”)指能否合理地認爲療效大於機率因素所引起的結果。這一點非常重要(我們需要知道所觀察到的療效不僅僅是牽拉因素引起的),但是其本身並不能說明實際療效有多大。對治療效應值的最佳估計值是組間平均差。因此,如果一項關於關節鬆動術療效的假設研究報告表明:肩部疼痛的視覺類比量表(VAS)爲10公分,在治療組降低了4公分,在對照組降低了1公分,我們對療效的最佳估計值是視覺類比量表(VAS)降低了3公分(4公分減去1公分=3公分)。另一個探究運動前肌肉牽拉療效之研究報告顯示:牽拉組有2%的病人受傷,而對照組有4%的病人受傷。在這種情況下,我們的最佳證據是:牽拉將損傷風險降低了2%(因爲4%減去2%=2%)。臨床研究讀者需要查看所報告的效應值來決定療效是否足夠大而具有臨床價值。要記住的是,病人尋求治療通常是爲了治癒疾病(當然這種歸納不一定適用於所有的臨床研究領域),大多數人對療效甚微的治療不感興趣。
在查看療效時,有一個非常重要的細微差異。它適用於測量結果採用二分法的研究。(二分法的結果可以是兩個類別之中的一個,如死亡或存活,受傷或未受傷,入住養老院或未入住養老院;它與VAS疼痛視覺類比量表之類的變異量不同,後者可以是0至10之間的任何數值,包括0和10)。許多測量結果採用二分值的研究報告療效時採用比率(有時也稱爲“相對風險”或“勝算比”或“危險比”,同時還有其它名稱),而不是採用組間差。如果採用這種表達方式,我們假設的牽拉研究結果報告可以聲稱受傷危險降低了50%(2%是4%的一半)。通常用比率表達療效可以使療效看起來非常大。組間差是一種更好的測量形式。(實際上,最有用的測量值或許是差值的倒數,有時也稱“需要治療的人數”(NNT),因爲它說明指平均需要治療多少個病例才能防止一例不良事件。在牽拉例子中需治療數爲1/0.02=50,因此為每50個受試者進行牽拉,可以防止一例損傷)。
許多研究沒有報告治療的有害作用(如:治療的“副作用”或“併發症”)。這很讓人遺憾,因爲不報告有害作用常常被解釋爲治療沒有害處,但是事實不一定如此。Glaziou和Irwig(BMJ 1995;311:1356-9)認爲,療效通常在病情最嚴重的病人身上表現最爲顯著。(例如,頭部受傷病人使用支氣管抽吸來降低呼吸停止風險,大量痰積的患者的療效可能比微量痰積的患者更爲明顯)。相比之下,治療的風險(在本病例中,即顱內壓升高的風險)趨向於相對不變,跟病情嚴重程度無關。所以,一種治療方法用於嚴重病人時,其有利作用大於副作用;如果患者病情較輕,治療副作用可能嚴重,治療師就不太願意使用這種方法。
實際上,臨床研究通常難以識別有害作用,因爲有害作用往往不經常發生,大多數研究的樣本數量不足以發現何時發生有害作用。因此,即使對一種療法進行了非常好的隨機控制研究,仍需要進行大量的監測研究:即對大批治療病人進行追蹤,以確認沒有發生較多的有害事件。在沒有完成監測研究之前,治療師要十分謹慎地使用可能有副作用的療法,尤其對那些接受治療後療效相對不大的病人。
更精細的系統性文獻回顧會考慮到臨床研究的療效估計值不精確的程度。研究是對受試者樣本進行的,並預期這些受試者能夠代表某個特定人群。這就意味著研究至多只能提供療效的估計值(並非完全精確)。對大量受試者進行臨床研究,所獲得的療效估計值比對少量受試者的臨床研究更好(更精確)。讀者在判斷臨床研究的意義時,最好應考慮到估計值的不精確度,因爲不精確度常常會影響到某項特定研究所得結論的確定性程度。做到這一點的最好辦法就是:如果研究報告沒有明確提供療效估計值的信賴區間,就應計算出信賴區間。Herbert提供了一份教案,教您如何計算、解釋常見的療效測量值的信賴區間:
- Herbert RD. How to estimate treatment effects from reports of clinical trials. I: Continuous outcomes. Aust J Physiother 2000;46:229-35。
- Herbert RD. How to estimate treatment effects from reports of clinical trials. II: Dichotomous outcomes. Aust J Physiother 2000;46:309-13。
讀者如果覺得對信賴區間較有信心,可下載PEDro的信賴區間計算器。計算器是Excel格式。
要判定一項治療的效用,最後一步就是判斷治療是否符合成本效果。如果由公衆的醫療保健系統支付或補貼,這一點就尤其重要。永遠都不可能有足夠的經費來支持所有的醫療創新(甚至不夠支持所有好的醫療創新)。因此,一定金額的醫療費用,一旦用於某項療法,那麽就不能花在其它醫療項目上了。合理分配有限的資金,就是要把錢用於每一元錢的平均療效最好的療法。當然,沒有療效的治療不可能談得上符合成本效果。但是有效的療法成本效果未必良好。關於判斷是否符合成本效果的方法,已經超出了本文作者的專長範圍,或許最好參閱更權威的資料來源。感興趣的讀者可以閱讀以下資料:
- Drummond MF, Richardson WS, O’Brien BJ, Levine M, Heyland D. Users’ guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: A. Are the results of the study valid? JAMA 1997;277:1552-7。
- O’Brien BJ, Heyland D, Richardson WS, Levine M, Drummond MF. User’s guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: B. What are the results and will they help me in caring for my patients? JAMA 1997;277:1802-6。
本章小結:
統計意義不等於臨床效用。治療要有臨床有用性,必須滿足下列條件:
- 能影響病人感興趣的那些結果
- 療效足夠大,值得進行治療
- 正面療效大於有害作用
- 符合成本效果。
如果您想進一步了解有關評估療效的訊息,可以查閱以下資料:
Guyatt GH, Sackett DL, Cook DJ, et al. Users’ guide to the medical literature: II. How to use an article about therapy or prevention: B. What were the results and will they help me in caring for my patients? JAMA 1994;271:59-63。