您可以运用PEDro教学来提高您的实证本位治疗的技能:
1.怎样去问一个临床问题
在进行临床研究文献搜寻前您最好是先花些时间去思考一下您要回答的问题。因为把问题组织好和具体化能使您更容易找到研究文献去回答您的问题。这个视频教程说明如何以PICO(Patient(病人或问题)-Intervention(干预措施或治疗)-Comparison(对比的干预措施)-Outcome(预后结果))形式去问一个临床问题。
2.本试验是否有效?
低功率激光能否有效治疗肱骨外上髁炎?拉伸训练是否能防止中风后挛缩?使用翼阀能否减少术后呼吸综合症?只有通过设计、进行得当的临床试验,才能对以上问题提供缜密的答案。令人遗憾的是,文献资料中既有进行得当、获得有效结论的试验,也有进行不当、得出无效结论的试验。读者必须能够甄别。本教程描述了有效临床试验的重要特征(或筛选标准)。
有些旨在判断物理疗法疗效的研究,只是简单地将一组有特定病情的人放在一起,测量治疗前后的病情危重程度。如果受试者经过一段时间治疗之后病情有所改善,就说该治疗是有效的。采用此类方法的研究很少能提供充分证据说明治疗的有效性,因为它几乎不能确定所观察到的症状改善应该归功于治疗,而不是归结于随机变量,诸如:自然康复、统计回归(一种统计现象,患者的病情由于随着时间而波动,从而逐渐显得不那么严重)、安慰剂效应或霍桑效应(受试者报告病情改善仅因为他们认为这是研究者希望看到的效果)。要消除影响研究有效性的这些因素,唯一有效的方法是设立对照组。然后,将已接受治疗的受试者与没有接受治疗的受试者进行结果对比。
控制研究的逻辑是这样的:平均而言,随机变量对治疗组和对照组的影响程度是相同的,这样在试验结束时两组之间的差值就归功于治疗。举例来说,众所周知,大多数急性腰疼病例即使不进行任何治疗,也会自然、迅速地消退;因此只能表明受试者在治疗过程中病情有所改善,不能证明治疗有效。而控制试验表明治疗组的受试者比对照组的受试者的进展更好,这样就比较有力地证明治疗使病情改善,因为治疗组和控制组同样有自然康复的情况。观察显示接受治疗的受试者比控制组受试者的病情进展更好,说明除了自然康复之外还有其它因素使受试者的病情得到改善。注意:在控制研究中,“对照”组不一定不接受任何治疗。在控制试验中,经常将对接受传统疗法的对照组与接受传统疗法加治疗的试验组进行比较。或者,有些试验将接受传统疗法的对照组与接受新疗法的试验组进行比较。
重要的是,对照组只能防止随机变量的干扰,以保证治疗组与控制组条件相同。只有当治疗和控制组在对结果有决定作用的各个方面都一样(除了是否接受治疗之外),才能确定试验最后的组间差值是治疗的结果。在实践中,将整体受试者随机分配到治疗组和对照组,即可达到上述要求。这样可以确保随机变量(如自然康复)对治疗组和对照组的影响程度是一样的。实际上,当受试者被随机分配到各个组时,治疗组和对照组之间的差值只是治疗或偶然性的结果,如果差值足够大的话极有可能排除偶然因素,这就是统计检验的内容。注意:这是保证治疗组与对照组之间可比性的唯一方法。还没有真正满意的方法可以取代随机分配。
即使把受试者随机分配到各组,还必须确保疗效(或没有疗效)不会由于 “观察偏差”而失真,这是指研究者由于相信某项治疗而可能会下意识地歪曲治疗结果的测量值。最好的保护措施就是对“观察者”使用盲法,确保测量治疗结果的人员不知道受试者是否接受了治疗。一般而言,最好对病人和治疗师也使用盲法。当病人不知情时,就说明明显的疗效不是由安慰剂效应或霍桑效应造成的。要对治疗师使用盲法、不让他们知道自己采用的疗法,这是很难或不可能的。但是如果研究能采用治疗师盲法(例如,在低功率激光试验中,可以不让治疗师知道激光器放射的是激光还是彩光),就可以知道疗效不是由于治疗师热衷于这种疗法,而是因为这种疗法本身有作用。
另外重要的一点,是试验过程中几乎没有受试者中途退出。因为中途退出会严重影响研究结果。如果对照组受试者因在研究过程中病情恶化而中途退出以寻求治疗,这种情况会掩盖真实疗效,因为这样会使控制组的平均结果看起来比实际情况好。相反,如果治疗导致某些受试者病情恶化而退出研究,这时疗效看起来会比实际效果好。由于这个原因,中途退出经常会给临床试验的效度带来不确定性。当然,中途退出越多,不确定性就越大。根据经验粗略计算:如果15%的受试者退出研究,该研究极可能严重失真。有些作者根本就不提及中途退出的人数。按照已经确立的“瑕疵假定”科学原则,这些研究应视为无效。
总而言之,有效的临床试验应:
- 将受试者随机分配到治疗组和对照组
- 对观察者使用盲法,最好对病人和治疗师也使用盲法
- 极少有受试者中途退出的情况。
下次当您在阅读物理治疗临床试验报告时,问问自己这项试验是否具备这些特点。一般原则是,不符合这些标准的试验可能是无效的,也就是没有足够的证据说明治疗有效(或无效)。符合这些标准的试验应仔细阅读,并记下其试验结果!
如果您希望进一步了解试验效度评估,请查看:
Guyatt GH, Sackett DL, Cook DJ, et al. Users’ guide to the medical literature: II. How to use an article about therapy or prevention: A. Are the results of this study valid? JAMA 1993;270:2598-601。
3.这种疗法在临床上有用吗?
指导书前面的部分列举了一个标准清单,读者可用它来区分有效研究和无效研究。通常说来,不符合大多数筛选标准的研究最好忽略不计。本章考虑治疗师应如何解释那些符合大多数筛选标准的研究。应该知道,仅仅寻找统计学上有显著意义的疗效证据是不够的。一项试验必须满足以下条件:试验所测量的结果是有意义的,所取得的正面疗效要大到足以使治疗值得进行;其有害作用则必须很少出现或很小,从而益处多于害处;最后,该疗法必须比较节省。
当然,试验要有用,必须先调查疗效是否有意义。这意味着必须对治疗结果进行有效测量。一般而言,由于我们经常根据治疗是否满足了病人的需要来判断治疗的主要价值,所以测量结果对病人要有意义。因此,表明低功率激光减少疼痛的试验,比表明低功率激光降低血清素水平的试验要有用得多。表明运动训练减少痉挛的试验,却不如运动训练强化功能独立性的试验那么有用。
治效的大小显然很重要,但常常被忽略。也许这是因为许多临床实验的读者忽略了 “统计学意义”和“临床意义”之间的差别,或者可能是反映了许多临床试验的作者对“p < 0.05”先入为主的观念。统计学意义(“p < 0.05”)指能否合理地认为疗效大于偶然因素所引起的结果。这一点非常重要(我们需要知道所观察到的疗效不仅仅是偶然因素引起的),但是其本身并不能说明实际疗效有多大。对治疗有效性的最佳估计值是组间平均差。因此,如果一项关于关节松动术疗效的假设试验报告表明:肩部疼痛的视觉类比标度(VAS)为10cm,在治疗组降低了4cm,在对照组降低了1cm,我们对疗效的最佳估计值是视觉类比标度(VAS)降低了3cm (4cm 减去 1cm = 3cm)。另一个运动前肌肉拉伸假设试验报告显示:拉伸组有2%的病人受伤,而对照组有4%的病人受伤。在这种情况下,我们的最佳证据是:拉伸将损伤风险降低了2%(因为4% 减去 2% = 2%)。临床试验读者需要查看所报告疗效的有效性来决定疗效是否足够大而具有临床价值。要记住的是,病人寻求治疗通常是为了治愈疾病(当然这种归纳不一定适用于所有的临床试验领域),大多数人对疗效甚微的治疗不感兴趣。
在查看疗效时,有一个非常重要的细微差异。它适用于测量结果采用二分值的研究。(二分值的结果可以是两个值之中的一个,如死亡或存活,受伤或未受伤,入住养老院或未入住养老院;它与VAS疼痛视觉类比标度之类的变量不同,后者可以是0至10之间的任何数值,包括0和10)。许多测量结果采用二分值的研究报告疗效时采用比率(有时也称为“相对风险”或“胜算比”或“危险比”,同时还有其它名称),而不是采用组间差。如果采用这种表达方式,我们假设的拉伸研究结果报告可以声称受伤危险降低了50%(2%是4%的一半)。通常用比率表达疗效可以使疗效看起来非常大。组间差是一种更好的测量形式。(实际上,最有用的测量值或许是差值的倒数,有时也称“需要治疗的人数”(NNT),因为它说明指平均需要治疗多少个病例才能防止一例不良事件。在拉伸例子中需治疗数为1/0.02 = 50,因此每50个受试者进行拉伸,可以防止一例损伤)。
许多研究没有报告治疗的有害作用(如:治疗的“副作用”或“并发症”)。这很让人遗憾,因为不报告有害作用常常被解释为治疗没有害处,但是事实不一定如此。Glaziou和Irwig (BMJ 1995;311:1356-9)认为,疗效通常在病情最严重的病人身上表现最为显著。(例如,头部受伤病人使用支气管抽吸来降低呼吸停止风险,大量痰积的患者的疗效可能比微量痰积的患者更为明显)。相比之下,治疗的风险(在本病例中,即颅内压升高的风险)趋向于相对不变,跟病情严重程度无关。所以,一种治疗方法用于严重病人时,其有利作用大于毒副作用;如果患者病情较轻,治疗副作用可能很严重,治疗师就不太愿意使用这种方法。
实际上,临床试验通常难以识别有害作用,因为有害作用往往不经常发生,大多数研究的样本数量不足以发现何时发生有害作用。因此,即使对一种疗法进行了非常好的随机控制试验,仍需要进行大量的监测研究:即对大批量的治疗病人进行跟踪访问,以确认没有发生较多的有害事件。在没有完成监测研究之前,治疗师要十分谨慎地使用可能存在有害作用的疗法,尤其对那些治疗时疗效相对不大的病人。
更精细的评论会考虑到临床试验的疗效估计值不精确的程度。试验是对受试者样本进行的,并预期这些受试者能够代表某个特定人群。这就意味着试验至多只能提供疗效的估计值(并非完全精确)。对大量受试者进行临床研究,所获得的疗效估计值比对少量受试者的临床研究更好(更精确)。读者在判断临床试验的意义时,最好应考虑到估计值的不精确度,因为不精确度常常会影响到某项特定试验所得结论的确定性程度。做到这一点的最好办法就是:如果试验报告没有明确提供疗效估计值的可信区间,就应计算出可信区间。Herbert 提供了一份教程,教您如何计算、解释常见的疗效测量值的可信区间:
- Herbert RD. How to estimate treatment effects from reports of clinical trials. I: Continuous outcomes. Aust J Physiother 2000;46:229-35。
- Herbert RD. How to estimate treatment effects from reports of clinical trials. II: Dichotomous outcomes. Aust J Physiother 2000;46:309-13。
读者如果觉得可信区间太大或太小 PEDro的可信区间计算器。读者如果觉得可信区间太大或太小 PEDro的可信区间计算器。计算器是Excel格式。
要判定一项治疗的效用,最后一步就是判断治疗是否节省。如果由公众的医疗保健系统支付或补贴,这一点就尤其重要。永远都不可能有足够的经费来支持所有的医疗创新(甚至不够支持所有好的医疗创新)。因此,一定金额的医疗费用,一旦用于某项疗法,那么就不能花在其它医疗项目上了。合理分配有限的资金,就是要把钱用于每一元钱的平均疗效最好的疗法。当然,没有疗效的治疗不可能谈得上节省。但是有效的疗法也未必就是节省的。关于判断是否节省的方法,已经超出了本文作者的专长范围,或许最好参阅更权威的资料来源。感兴趣的读者可以阅读以下资料:
- Drummond MF, Richardson WS, O’Brien BJ, Levine M, Heyland D. Users’ guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: A. Are the results of the study valid? JAMA 1997;277:1552-7。
- O’Brien BJ, Heyland D, Richardson WS, Levine M, Drummond MF. User’s guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: B. What are the results and will they help me in caring for my patients? JAMA 1997;277:1802-6。
本章小结:
统计意义不等于临床效用。治疗要有临床效用,必须满足下列条件:
- 能影响病人感兴趣的那些结果
- 疗效足够大,值得进行治疗
- 正面疗效大于有害作用
- 节省。
如果您想进一步了解有关评估疗效的信息,可以查阅以下资料:
Guyatt GH, Sackett DL, Cook DJ, et al. Users’ guide to the medical literature: II. How to use an article about therapy or prevention: B. What were the results and will they help me in caring for my patients? JAMA 1994;271:59-63。