يمكنك تعزيز مهاراتك في الممارسة القائمة على الأدلة باستخدام برامج PEDro التعليمية التالية:
1. كيف تسأل سؤالاً سريرياً
قبل البدء في البحث عن الأبحاث السريرية، من الأفضل قضاء بعض الوقت في التفكير في السؤال الذي تريد الإجابة عنه. وذلك لأن تكوين سؤالك وتنقيحه يجعل من السهل العثور على الأبحاث للإجابة عنه. يشرح هذا الفيديو التعليمي كيفية طرح الأسئلة السريرية باستخدام صيغة (PICO): المريض (Patient)-العلاج (Intervention)-المقارنة (Comparison)-النتيجة (Outcome).
2. هل كانت التجربة ناجحة؟
هل الليزر منخفض الطاقة علاج فعال لالتهاب اللقيمة الجانبي في المرفق؟ هل تمنع تمارين التمدد من حدوث تقلص العضلات بعد السكتة الدماغية؟ هل يمكن استخدام صمام الرفرفة لتقليل مضاعفات الجهاز التنفسي بعد العملية الجراحية؟ لا يمكن تقديم إجابات صارمة على هذه الأسئلة إلا من خلال الدراسات السريرية المصممة والمنفذة بشكل صحيح. ولسوء الحظ فإن التقارير المنشورة تحوي دراسات أُجريت بشكل جيد استخلصت استنتاجات صحيحة ودراسات أخرى أجريت بشكل سيء استخلصت استنتاجات غير صحيحة. لذا يجب أن يكون القارئ قادراً على التمييز بين الاثنين. يصف هذا البرنامج التعليمي الملامح الرئيسة للدراسات السريرية (أو “المرشِّحات المنهجية”) التي تمنح المصداقية.
بعض الدراسات التي تزعم أنها تحدد فعالية وسائل العلاج الطبيعي هي ببساطة تجمع مجموعة من الأشخاص بحالة مرضية معينة وتقيس مدى شدة الحالة قبل وبعد العلاج. وإذا تحسن هؤلاء الأشخاص خلال فترة العلاج، فإنه يقال إن العلاج كان فعالاً. ونادراً ما توفر هذه الدراسات التي تستخدم هذه الأساليب دليلاً مـُـرضياً على فاعلية العلاج لأنه نادراً ما يكون من المؤكد أن التحسن الملحوظ كان بسبب العلاج وليس المتغيرات الخارجية مثل الشفاء الطبيعي، أو الانحدار الإحصائي (ظاهرة إحصائية يصبح فيها الناس أقل “شدة” مع الوقت وذلك بسبب التباين في حالتهم)، أو التأثير الوهمي، أو تأثير “هوثرن” (حيث يذكر الأشخاص أنهم تحسنوا لأنهم يعتقدون أن هذا هو ما يريد الباحث سماعه). الطريقة المُرضية الوحيدة للتعامل مع هذه التهديدات على مصداقية الدراسة هي وجود مجموعة ضابطة. ثم يتم إجراء مقارنة بين نتائج الأشخاص الذين تلقوا العلاج والذين لم يتلقوا العلاج.
منطق الدراسات المحكمة بشكل عام هو أن العوامل والمتغيرات الخارجية تعمل بنفس الدرجة على كلا المجموعتين العلاجية والضابطة، بحيث يكون أي فرق بين المجموعات في نهاية التجربة ناجماً عن العلاج. فعلى سبيل المثال، من المعروف على نطاق واسع أن معظم حالات آلام أسفل الظهر الحاد تتسحن بشكل تلقائي وسريع، حتى في غياب أي علاج، وبذلك تحسن المرضى مع العلاج لا يشكل دليلاً على فاعلية العلاج. الدراسة المحكمة التي تظهر أن الأشخاص في المجموعة العلاجية أفضل من الأشخاص في المجموعة الضابطة يشكل دليلاً أقوى على أن التحسن كان بسبب العلاج، لأن الشفاء الطبيعي كان ينبغي أن يحدث في كلا المجموعتين: العلاجية والضابطة. ملاحظة أن الأشخاص في المجموعة العلاجية تحسنوا أكثر من الأشخاص في المجموعة الضابطة يدل على أن شيئاً أكثر من الشفاء الطبيعي كان يجعل الأشخاص أفضل. لاحظ أن المجموعة الضابطة في الدراسة المحكمة تحتاج تلقي علاج معين. في كثير من الأحيان، تتم المقارنة في الدراسات المحكمة بين مجموعة ضابطة تتلقى العلاج التقليدي ومجموعة التجربة التي تتلقى العلاج التقليدي بالإضافة إلى العلاج الفعلي. ومن ناحية أخرى، بعض الدراسات تقارن مجموعة ضابطة تتلقى العلاج التقليدي مع مجموعة التجربة التي تتلقى علاجاً جديداً.
من المهم معرفة أن دور مجموعات الضبط هو مجرد توفير الحماية ضد الآثار المرتبطة بالمتغيرات الخارجية التي تتعلق بمجموعة العلاج ومجموعة الضبط على حد سواء. ولا يمكن للباحث أن يكون على يقين من أن الاختلافات بين المجموعات في نهاية الدراسة تُعزى إلى العلاج فقط إلا عندما تكون مجموعة العلاج ومجموعة الضبط هي نفسها في كل الاحتمالات التي تحدد النتائج (بخلاف ما إذا كانت قد تلقت العلاج أم لا). في الواقع يتحقق ذلك عن طريق توزيع مجموعة الأشخاص عشوائياً على مجموعتي العلاج والضبط. وهذا يضمن أن العوامل الخارجية مثل مدى الشفاء الطبيعي لها نفس التأثير في المجموعتين. في الواقع، عندما يتم توزيع الأشخاص بشكل عشوائي على المجموعات، فإن الاختلافات بين مجموعة العلاج والمجموعة الضابطة لا يمكن أن تكون إلا بسبب العلاج أو الصدفة، ومن الممكن استبعاد فرصة إذا كانت الاختلافات كبيرة بما يكفي – وهذا ما تفعله الاختبارات الإحصائية. لاحظ أن هذه هي الطريقة الوحيدة لضمان المقارنة بين مجموعة العلاج ومجموعة الضبط. ولا يوجد بديل مُرضٍ للتوزيع العشوائي.
حتى عندما يتم توزيع الأشخاص عشوائياً على المجموعات، فمن الضروري التأكد من أن تأثير العلاج (أو عدمه) لا يتأثر سلبـاً بسبب “تحيز المقيـّم”. هذا يشير إلى احتمال أن اعتقاد الباحث في فاعلية العلاج قد يحرّف قياس نتائج العلاج دون وعي. أفضل وسيلة للوقاية من ذلك هي “تعمية أو حجب” المقيـّم للتأكد من أن الشخص الذي يقيس النتائج لا يعرف ما إذا كان هذا الشخص حصل أو لم يحصل على العلاج. ومن المرغوب فيه عموماً أن يكون المريض والمعالجون محجوبين أيضاً. عندما يكون المرضى محجوبين، فإنه يمكنك أن تعرف أن التأثير الواضح من العلاج لم ينتج عن طريق العلاج الوهمي أو آثار “هوثرن”. غالباً ما يكون من الصعب أو المستحيل حجب المُعالِجين عن العلاج الذي يطبقونه، ولكن في تلك الدراسات التي يكون فيها المعالجون محجوبين عن العلاج (على سبيل المثال، في تجارب الليزر ذات الطاقة المنخفضة حيث يبعث الجهاز إما أشعة الليزر أو الضوء الملون، ولم يتم إبلاغ المعالج عنه)، يمكنك معرفة أن آثار العلاج لم تنتج بسبب حماس المعالِج مع العلاج أو بسبب العلاج نفسه.
من المهم أيضًا أنه قد يتوقف بعض الأشخاص عن المشاركة (“التسرب”) أثناء عمل الدراسة. وذلك لأن المتسربين يمكن أن يحرّفوا في نتائج الدراسة بشكل كبير. ويمكن أن يـُـخفى التأثير الحقيقي للعلاج إذا غادر الأشخاص في المجموعة الضابطة الدراسة بسبب تدهور حالتهم على مدى فترة الدراسة للحصول على العلاج، وهذا من شأنه أن يجعل متوسط نتائج المجموعة الضابطة تبدو أفضل مما كانت عليه في الواقع. وعلى النقيض من ذلك، إذا تسبب العلاج في تدهور حالة بعض الأشخاص وتركوا الدراسة، فإن العلاج يبدو أكثر فاعلية مما كان عليه في الواقع. لهذا السبب فإن التسربات دائماً تقود إلى الشك في مصداقية الدراسة السريرية. وبطبيعة الحال، كلما زاد عدد التسربات، زادت درجة الشك في نتائج الدراسة – وكقاعدة عامة، فإنه في حال تسرب أكثر من 15٪ من الأشخاص من الدراسة، فمن المحتمل جداً أن تكون الدراسة معيبة بشكل كبير. بعض الباحثين ببساطة لا يذكرون عدد المتسربين، وتمشياً مع المبدأ العلمي القائل بأن المتهم مذنب حتى تثبت براءته، يجب اعتبار نتائج هذه الدراسات غير صحيحة.
باختصار، الدراسات السريرية ذات المصداقية:
- توزع الأشخاص عشوائياً على المجموعتين: العلاج والضبط
- تحجب المقيـّـمين ويفضل المرضى والمعالِجين أيضاً
- بها تسرب قليل.
عندما تقرأ في المرة القادمة دراسة سريرية عن العلاج الطبيعي، اسأل نفسك إذا كانت هذه الدراسة لديها هذه المواصفات. وكقاعدة عامة، تلك الدراسات التي لا تفي بهذه المعايير ربما تعتبر غير صحيحة ولا تعطي دليلاً قوياً على فاعلية العلاج (أو عدم فاعليته). تلك الدراسات التي تفي بهذه المعايير ينبغي أن تُقرأ بعناية وتُحفظ نتائجها في الذاكرة!
إذا كنت ترغب في قراءة المزيد حول تقييم مصداقية دراسة ما، فجرب:
Guyatt GH, Sackett DL, Cook DJ, et al. User’s guide to the medical literature: II. How to use an article about therapy or prevention: A. Are the results of this study valid? JAMA 1993;270:2598-601
3. هل العلاج السريري مفيد؟
قدم البرنامج التعليمي السابق قائمة بالمعايير التي يمكن للقراء استخدامها للتمييز بين الدراسات التي يرجح أن تكون ذات مصداقية من تلك التي قد لا تكون كذلك. عادة ما يتم تجاهل الدراسات التي لا تلبي معظم المرشحات أو المعايير المنهجية. يتناول هذا القسم كيف يمكن للمعالجين تفسير تلك الدراسات التي تلبي معظم المرشحات أو المعايير المنهجية. الرسالة هي أنه لا يكفي أن ننظر فقط للدلالة الإحصائية لتأثير علاج معين. تحتاج إلى أن تكون راضياً أن الدراسة تقيس النتائج التي هي ذات معنى، وأن الآثار الإيجابية للعلاج كبيرة بما فيه الكفاية لجعل العلاج جديراً بالاهتمام. الآثار الضارة للعلاج يجب أن تكون نادرة أو صغيرة بحيث يكون العلاج مفيداً أكثر من ضرره. أخيراً، يجب أن يكون العلاج فعالاً من حيث التكلفة.
بطبيعة الحال، يجب أن تحقق دراسة ما نتائج ذات معنى للعلاج لكي تكون هذه الدراسة مفيدة. هذا يعني أنه يجب قياس النتائج بطريقة صحيحة. بشكل عام، ينبغي أن تكون نتائج القياس ذات معنى للمرضى لأننا عادة نحكم على القيمة الأولية للعلاج إذا كان هذا العلاج يرضي احتياجات المرضى. وبالتالي فإن الدراسة التي تظهر أن الليزر منخفض الطاقة يقلل مستويات السيروتونين هي أقل فائدة بكثير من تلك التي تظهر على أنه يقلل الألم، والدراسة التي تظهر على أن التدريب العضلي يقلل من التشنج هي أقل فائدة بكثير من الدراسة التي تظهر على أنه يعزز الاستقلال الوظيفي.
إن حجم تأثير العلاج مهم جداً، ولكن غالباً ما يتم تجاهله. ولعل هذا لأن العديد من قراء الدراسات السريرية لا يستطيعون التمييز بين “الدلالة الإحصائية” و “الدلالة السريرية”. أو ربما بسبب انشغال العديد من باحثي الدراسات السريرية بقيمة الدلالة الإحصائية (p) سواءً أقل من 0.05 أو لا. الدلالة الإحصائية (p أقل من 0.05) تشير إلى ما إذا كان تأثير العلاج أكبر مما يمكن أن يعزى إلى الصدفة وحدها. هذا أمر مهم (فنحن بحاجة إلى معرفة أن التأثيرات الملحوظة من العلاج لم تكن مجرد نتيجة الصدفة) ولكن لا تخبرنا شيئاً عن مدى حجم التأثير الفعلي. إن متوسط الاختلاف بين المجموعات يعد أفضل تقدير لحجم تأثير علاج ما. وعليه، إذا كانت دراسة افتراضية عن تأثير العلاج اليدوي ذكرت بأن ألم الكتف- الذي يقاس بمقياس الألم البصري من 10 سم – انخفض بمتوسط 4 سم في مجموعة العلاج و 1 سم في المجموعة الضابطة، فإن أفضل تقدير لمتوسط تأثير العلاج هو نقص 3 سم في مقياس الألم البصري (VAS) (4 سم ناقص 1 سم هو 3 سم). دراسة افتراضية أخرى عن إطالة العضلات قبل ممارسة الرياضة قد تذكر أن 2٪ من المرضى في مجموعة إطالة العضلات أصيبوا في وقت لاحق، مقارنة مع 4٪ في المجموعة الضابطة. في هذه الحالة، أفضل دليل لدينا هو أن إطالة العضلات قلل من خطر الإصابة بنسبة 2٪ (4٪ ناقص 2٪ هو 2٪). لذلك فإن قرّاء الدراسات السريرية يجب عليهم الاطلاع على حجم التأثير المذكور في الدراسات لتحديد ما إذا كان التأثير كبيراً بما يكفي ليكون مفيداً سريرياً. وتذكـّـر أن المرضى غالباً يأتون للعلاج للبحث عن شفاء (طبعاً هذا التعميم قد لا يتم في جميع مجالات الممارسة السريرية) – فمعظم هؤلاء المرضى غير مهتمين بالعلاجات ذات الأثر الضعيف فقط.
توجد جوانب معقدة عند النظر إلى حجم تأثير علاج ما. هذا ينطبق على الدراسات التي يتم قياس أثرها باستخدام النتائج ثنائية التفرع (النتائج ثنائية التفرع تكون واحداً من اثنين من القيم، مثل حي أو ميت، ومصاب أو غير مصاب، ومقبول في دار رعاية المسنين أو غير مقبول؛ هذا يختلف عن متغيرات أخرى مثل مقياس شدة الألم البصري الذى يمكن أن يكون له أي قيمة من صفر إلى 10. العديد من الدراسات التي تقيس النتائج ثنائية التفرع تذكر تأثير العلاج من حيث النسب وليس من حيث الاختلافات. (وتُسمى هذه النسبة أحيانا “الخطر النسبي” أو “نسبة الاحتمال” أو “نسبة الخطر”، ولها أسماء أخرى أيضاً). فمثلاً، نتائج دراسة فرضية على إطالة العضلات يمكن أن تذكر 50٪ نقص في خطر الإصابة (كـ 2٪ هي نصف من 4٪). عادة ما يكون الانطباع عند ذكر نتائج العلاج كنسب هو جعل تأثير العلاج يبدو كبيراً. إن المقياس الأفضل هو الاختلاف بين المجموعتين. (في الحقيقة، أن المقياس الأكثر نفعاً من المحتمل أن يكون نقيض الاختلاف. وهذا ما يطلق عليه أحياناً “العدد المطلوب للعلاج (NNT)” لأنه يخبرنا – في المتوسط – كم من المرضى نحتاج إلى علاجهم لمنع حدث سلبي واحد. ففي مثال إطالة العضلات NNT هو 1 / 0.02 = 50، لذلك يتم منع إصابة واحدة لكل 50 شخصـاً يعملون إطالة للعضلات.
العديد من الدراسات لا تذكر الآثار الضارة للعلاج (أي “الآثار الجانبية” أو “مضاعفات” العلاج). وهذا أمر مؤسف، لأن عدم ذكر الآثار الضارة غالباً ما يُفسر على أنه يشير إلى أن العلاج غير ضار، ولكن ليس من الضروري أن يكون الأمر كذلك. Glaziou و Irwig (BMJ 1995;311:1356-9) دللا على أن اثار العلاج عادة ما تكون ظاهرة عندما يُعطى للمرضى ذوي الحالات الصعبة (فعلى سبيل المثال: من المتوقع أن شفط الشعب الهوائية يقلل خطر توقف التنفس في مريض الشلل الدماغي الذي لديه كمية كبيرة من البلغم أكثر من المريض الذي لديه كمية قليلة من البلغم). في المقابل، فإن أخطار العلاج (في هذه الحالة، ارتفاع الضغط داخل الجمجمة) تميل إلى أن تكون ثابتة نسبياً بغض النظر عن شدة الحالة. ولذلك فإن العلاج من المحتمل جداً أن يكون ذو فائدة أكثر عندما يستخدم مع المرضى ذوي الحالات الشديدة. وعليه، ينبغي أن يكون المعالجون مترددين نسبياً في إعطاء العلاج الذي يحتمل أن يكون له آثار جانبية خطيرة عندما تكون حالة المريض أقل خطورة.
عمليـاً يكون غالباً من الصعب على الدراسات السريرية اكتشاف الآثار الضارة، لأن الآثار الضارة لا تحدث كثيراً، ومعظم الدراسات لديها عدد قليل من العينات لا يكفي للكشف عن الآثار الضارة عندما تحدث. ولذلك، حتى بعد إجراء دراسات عشوائية ضابطة جيدة عن علاج معين، فإن هناك دور مهم لدراسات “الرصد” واسعة النطاق التي تتابع أعداداً كبيرة من المرضى للتأكد من أن الأحداث الضارة لا تحدث بشكل مفرط. وحتى يتم إجراء مثل هذه الدراسات، يجب أن يكون المعالجون حذرين حول تطبيق العلاجات التي يحتمل أن تكون ضارة، وخاصة للمرضى الذين سوف يستفيدون بشكل قليل نسبياً من العلاج.
هناك مستوىً أعلى في التقييم النقدي يتضمن النظر في درجة عدم دقة تقديرات حجم التأثير التي تقدمها الدراسات السريرية. يتم إجراء الدراسات على عينات من الأشخاص الذين يتوقع أنهم يمثلون مجتمعـاً محدداً. هذا يعني أن أفضل ما توفره دراسة ما هو تقدير (ناقص الدقة) لحجم تأثير العلاج. توفر الدراسات السريرية التي تختبر أعداداً كبيرة من الأشخاص تقديرات (أكثر دقة) لحجم تأثير العلاج أفضل من الدراسات التي تختبر عدداً قليلاً من الأشخاص. ينبغي على القراء أن يأخذوا في الاعتبار درجة عدم الدقة في التقدير عند تحديد ما تعنيه الدراسات السريرية، لأن ذلك سيؤثر غالباً على درجة الثقة في الاستنتاجات المستخلصة من دراسة ما. أفضل طريقة للقيام بذلك هي حساب فاصل الثقة حول تقدير حجم تأثير العلاج إذا لم تكن هذه المعلومات واضحة بشكل صريح في تقرير الدراسة. يتوفر برنامج تعليمي عن كيفية حساب وتفسير فواصل الثقة حول القياسات الشائعة لحجم التأثير في:
- Herbert RD. How to estimate treatment effects from reports of clinical trials. I: Continuous outcomes. Aust J Physiother 2000;46:229-35
- Herbert RD. How to estimate treatment effects from reports of clinical trials. II: Dichotomous outcomes. Aust J Physiother 2000;46:309-13
القراء الملمون بفواصل الثقة قد يجدون أنه من المفيد تحميل حاسبة PEDro لفواصل الثقة. هذه الحاسبة في شكل جدول إكسل.
يتضمن الجزء الأخير من تحديد فائدة علاج ما على تحديد ما إذا كان العلاج فعالاً من حيث التكلفة. يكتسب هذا الأمر أهمية خاصة عندما يتم إقراض أو دفع رسوم الرعاية الصحية من قِبل الخزانة العامة. لن يكون هناك أبداً ما يكفي من الموارد لتمويل جميع الابتكارات في مجال الرعاية الصحية (وربما ليس حتى كل الابتكارات الجيدة). وبالتالي فإن تكلفة أي علاج هو أن الأموال التي تنفق عليه لا يمكن أن تنفق على أشكال أخرى من الرعاية الصحية. إن تخصيص الأموال المحدودة بشكل معقول يتضمن إنفاق المال حيث يكون التأثير لكل دولار أكبر. و بالطبع، فالعلاج لا يمكن أن يكون فعالاً من حيث التكلفة إذا لم يكن فعالاً من حيث نتائجها. ولكن العلاجات الفعالة في نتائجها يمكن أن تكون غير فعالة من حيث التكلفة. الأساليب المستخدمة في تحديد الفعالية من حيث التكلفة هي خارج نطاق خبرة الباحثين، وربما يكون من الأفضل لو رجعنا إلى مصادر موثوقة أكثر. إذا كنت مهتماً بذلك فيمكنك قراءة:
- Drummond MF, Richardson WS, O’Brien BJ, Levine M, Heyland D. User’s guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: A. Are the results of the study valid? JAMA 1997;277:1552-7
- O’Brien BJ, Heyland D, Richardson WS, Levine M, Drummond MF. User’s guide to the medical literature: XIII. How to use an article on economic analysis of clinical practice: B. What are the results and will they help me in caring for my patients? JAMA 1997;277:1802-6
لتلخيص هذا القسم:
الدلالة الإحصائية لا تساوي الفائدة السريرية. لكي يكون العلاج مفيداً سريرياً يجب أن:
- يؤثر على النتائج التي يهتم بها المرضى
- يكون له آثار كبيرة بما يكفي ليكون مفيداً
- يكون نفعه أكثر من ضرره
- يكون فعالاً من حيث التكلفة.
إذا كنت ترغب في قراءة المزيد عن تقييم حجم التأثير، يمكنك مراجعة:
Guyatt GH, Sackett DL, Cook DJ, et al. User’s guide to the medical literature: II. How to use an article about therapy or prevention: B. What were the results and will they help me in caring for my patients? JAMA 1994;271:59-63