07 ธันวาคม 2551

Sample of Appraising an RCT - 1

พอดีวันนี้มีคนถามมาถึงเรื่องการอ่าน RCT ฉบับหนึ่ง (จริงๆ ผมแอบสงสัยว่ามีคนอ่านบล็อกผมด้วยแฮะ :P) ก็เลยขออนุญาตมาลอง Appraise ดูกันในนี้เลยนะครับ

Paper ดังกล่าวคือ Hsia J, Heiss G, Ren H, Allison M, Dolan NC, Greenland P, et al. Calcium/vitamin D supplementation and cardiovascular events. Circulation. 2007 Feb 20;115(7):846-54. สามารถเข้าได้ที่เว็บไซต์ของ Circulation (คลิ๊กที่นี่ก็ได้) นะครับ

ก่อนอื่นเลยผมขออ่านเฉพาะ Abstract ก่อนเพื่อดูแนวคิดของ Paper ก่อนที่จะอ่านต่อไป เราควรได้ไอเดียคร่าวๆ ว่าใคร ทำอะไร ที่ไหน เกิดผลอะไร อย่างไร คล้ายๆ กับการอ่านเรื่องย่อของหนังก่อนเดินเข้าโรงน่ะครับ

โดยทั่วไปแล้วเวลาทำการศึกษาวิจัย ก็จะต้องมีคำถามหลักที่งานวิจัยทำขึ้นเพื่อตอบอยู่เสมอ เราจะต้องพยายามคิดให้ได้ว่า งานวิจัยที่เรากำลังอ่านนี้ เขาตั้งใจจะตอบคำถามอะไร ส่วนหนึ่งเราก็จะได้รู้ด้วยว่าคำถามของเขา กับคำถามของเรา (หรืออีกนัยนึงคือคำถามของคนไข้นั่นแหละ) มันคล้ายกันไหม น่าจะอ่านต่อไปหรือเปล่า

อย่างใน Abstract นี้ถ้าเราอ่านแล้วจับใจความจาก Background ก็จะได้คำถามประมาณนี้นะครับ

"ผู้หญิงอายุ 50-79 ที่ได้ Ca + Vit D จะมี CV Event แตกต่างจากผู้ที่ไม่ได้ หรือไม่"

(ของคุณผู้อ่านบล็อกอาจไม่จำเป็นจะต้องเหมือนกันเป๊ะๆ ก็ได้นะครับ แต่น่าจะคล้ายๆ กันนี้)

ทีนี้บางคนงง ไม่รู้จะสร้างคำถามยังไง หลายๆ ที่เลยแนะนำให้แตกคำถามออกเป็น 4-5 ส่วน โดยใช้หลักซึ่งจำได้ง่าย (หรือเปล่า?) ว่า PICO หรือ PICOT กล่าวคือ

  • P = Patient คนไข้ของเรา
  • I = Intervention สิ่งที่เราตั้งใจจะดู
  • C = Comparison สิ่งที่เรายึดเพื่อจะเปรียบเทียบด้วย
  • O = Outcome เราสนใจวัดผลยังไง
  • T = Time ภายในเวลาเท่าไหร่ (อันนี้บางคนอาจจะละไว้ในฐานที่เข้าใจ ก็ได้ครับ ก็เหลือแค่ PICO)

ถ้าผมเอาคำถามผมมาแตกใหม่ตาม PICO มันก็จะได้ประมาณนี้

  • P: Postmenopausal women, 50-79 years of age, at 40 clinical sites (ตรงนี้จะละเอียดแค่ไหนก็ได้ครับ ยิ่งละเอียดก็ยิ่งดี แต่มันก็อาจจะยิ่งไม่ตรงกับคำถามของเราเข้าไปเรื่อยๆ ซึ่งก็ดี เราจะได้เห็นความแตกต่างว่าเราจะเอาคำตอบเขามาใช้กับคำถามเราได้หรือเปล่า)
  • I: Calcium 500 mg + Vit D supplement (200 IU twice daily)
  • C: Placebo
  • O: CV Event: MI/Coronary heart disease death, Stroke
  • T: 7 years of follow-up

หลังจากนั้นเราก็อาจลองสร้าง Diagram คร่าวๆ ว่ามันเกิดอะไรขึ้นในการศึกษานี้ จากเฉพาะการอ่าน Abstract

path4700

จะสังเกตเห็นว่า ผมยังไม่ได้เข้าไปอ่านข้างในเลยนะครับ ดังนั้น ตอนหลังเราอาจเพิ่มเติม Diagram นี้ก็ได้

เรามาลองแปลผลดูก่อน โดยเฉพาะสำหรับท่านที่งงว่า เอ๊ะ Hazard Ratio นี่มันคืออะไร

Hazard Ratio เวลาแปลผลนั้นอยากให้คิดเหมือนกันกับ Odds Ratio ครับ เพียงแต่ว่า การที่จะเป็น Hazard Ratio ได้นั้น เขาเอา "เวลา" เข้ามาคิดด้วย อย่างในที่นี้ ก็คือในเวลา 7 ปีนั้นครับ นั่นคือ ที่ว่า HR=1.04 ก็หมายความว่า คนที่ได้ Ca+VitD มีโอกาสเป็น 1.04 เท่าที่จะเกิด MI เมื่อเทียบกับคนที่ได้ Placebo นั่นเองครับ

สังเกตว่าในกรณีนี้ คนที่ได้ Ca+VitD มันเป็น MI ซะมากกว่าคนปกติซะอีก อย่างไรก็ตาม ค่านี้เราไม่ควรจะนำมาพิจารณาเพียงค่าเดียว แบบที่ผมเคยบอกไว้ใน post เก่าๆ ครับ เราควรจะนำ 95% Confident Interval มาคิดด้วย นั่นก็คือ มันอาจเป็นไปได้ที่:

  • คนที่ได้ Ca+VitD มีโอกาสเป็น 0.92 เท่าที่จะเกิด MI ....
  • คนที่ได้ Ca+VitD มีโอกาสเป็น 0.93 เท่าที่จะเกิด MI ...
  • คนที่ได้ Ca+VitD มีโอกาสเป็น 0.94 เท่าที่จะเกิด MI ...
  • .
  • .
  • คนที่ได้ Ca+VitD มีโอกาสเป็น 1.00 เท่าที่จะเกิด MI ...
  • .
  • .
  • คนที่ได้ Ca+VitD มีโอกาสเป็น 1.16 เท่าที่จะเกิด MI ...
  • คนที่ได้ Ca+VitD มีโอกาสเป็น 1.17 เท่าที่จะเกิด MI ...
  • คนที่ได้ Ca+VitD มีโอกาสเป็น 1.18 เท่าที่จะเกิด MI ...

สังเกตว่าถ้ามันมีค่า <1 หมายความว่า คนที่กินยา เขาเกิด MI น้อยกว่า ในขณะที่ อีกข้างหนึ่งที่ >1 หมายความว่า คนที่กินยา เขาเกิด MI มากกว่า ซึ่งแสดงว่า มันขัดแย้งกันเอง ทำให้เราสรุปได้ว่า มันน่าจะไม่เกี่ยวข้องกัน

ในทำนองเดียวกัน เราสามารถแปลแบบนี้กับ Stroke ได้ ลองแปลดูซิครับ (อย่าเพิ่งอ่านบรรทัดต่อไปจนกว่าจะแปลเองได้นะ)

ถ้าผมแปล ก็จะแปลว่า คนที่ได้ Ca+VitD มีโอกาสเป็น 0.95 เท่าที่จะเกิด Stroke เมื่อเทียบกับคนที่ได้ Placebo โดยเจ้าจำนวนเท่าเนี่ย มันอาจจะเป็นได้ทั้ง 0.82 เท่า (หมายความว่ากินยาแล้วเป็นน้อยกว่า) ถึง 1.10 เท่า (หมายความว่ากินยาแล้วดันเป็นมากกว่า) นั่นเองครับ

เดี๋ยวตอนหน้าจะมาต่อการ Appraise ข้างใน Paper นะครับ

(ถ้าอ่านแล้วสงสัย สามารถเมล์มาได้นะครับ pawinpawin@gmail.com หรือจะทิ้ง Comment ไว้ก็ได้ครับ ขอบคุณครับ)

24 กันยายน 2551

Guideline for Appraisal of Therapy (Clinical Trials, RCTs)

Adapted from User's guide to the Medical Literature
Guyatt G, Rennie D, Meade M, Cook D. Users' Guides to the Medical Literature: Essentials of Evidence-Based Clinical Practice. 2nd ed. McGraw-Hill Professional; 2008.

วันนี้ผมจะพูดเรื่องของการอ่าน paper เกี่ยวกับ therapy ซึ่งเป็นสิ่งที่อ่านได้ไม่ยากนัก และพบได้บ่อยครับ จะพยายามเขียนให้เป็นภาษาที่เข้าใจง่ายมากที่สุดที่จะทำได้นะครับ

หลักการ Appraisal เบื้องต้นที่ผมคิดไว้นะครับ

  1. อ่านเฉพาะ Introduction, Material & Method, Result ก็เพียงพอ ระหว่างอ่านไป อาจเขียนเป็น diagram ง่ายๆที่เราเข้าใจเองก็ได้
  2. หลังจากนั้นพยายามสรุปผลเอาเองก่อน แล้วเทียบกับที่ผู้วิจัยสรุปไว้ตรง Discussion
  3. พยายามคิดเห็นขัดแย้งให้ได้มากที่สุด (จะได้ไม่หลงเชื่อที่เขา Discuss ไว้ก่อน) แต่บางครั้งก็อาจจะไม่รู้ว่าจะคิดแย้งอย่างไรเนื่องจากอาจจะดีอยู่แล้วหรือซ่อนความจริงได้เนียนมาก
  4. ถ้าเป็นไปได้ควรไปหาความเห็นของคนอื่นเพื่อมาคิดแย้งกับความเห็นของเรา เช่น
  • จาก Editorials ของ Journal ฉบับนั้นๆ
  • จากเพื่อนฝูง ในวงการเดียวกัน หรือจาก Expert ใน Field ที่เรารู้จัก
  • จาก Secondary Journal เช่น ACP Journal Club, Evidence-Based Medicine Journal ของ BMJ อันนี้อาจจะต้องรอนิดหน่อย และอาจมีเฉพาะ Paper ใหญ่ๆ และสำคัญ แต่คนที่เอามาสรุปพวกนี้มักติดต่อคนที่ทำวิจัยเมื่อมีข้อสงสัยที่ไม่ได้ตีพิมพ์ใน Journal จึงทำให้เราอาจทราบถึงความจริงอื่นที่ไม่ได้ตีพิมพ์ใน paper นั้นๆ ได้
  • บางวารสารจะมี Letters to the editor หรือ Rapid Responses จากคนอื่นๆ ที่อ่านแบบเดียวกับเรา

  
 

การ Appraisal นั้นมีหลักการอยู่สามข้อครับ คือ Validity, Result และ Application
 

Validity หรือความถูกต้อง คือข้อสรุปที่ได้จากการศึกษานั้นๆ ทำตามขั้นตอนที่ถูกต้อง จนได้มาซึ่งข้อสรุปที่ถูกต้องหรือไม่ ถ้าเป็นไปได้พยายามจำสิ่งที่ต้องพิจารณาต่อไปนี้ก่อนจะไปอ่าน จะได้อ่านแล้วจับได้ถูกว่าเป็นอย่างไร (คือจำ Guideline แต่ละข้อไว้ด้วยน่ะครับ)

1.     กลุ่ม Intervention กับกลุ่ม Control เริ่มด้วยความเสี่ยงที่จะเป็นหรือจะหายเท่าๆ กันหรือไม่ ดูได้จาก

1.1.
มีการ Randomize คนไข้หรือไม่ ซึ่งต้องระวังเล็กน้อย ไม่ใช่ดูแต่คำว่า Randomize เนื่องจากวิธีการ Randomize ที่ดี ควรทำให้ทุกๆ คนที่เข้ามาอยู่ในการศึกษามีโอกาสที่จะได้รับ Treatment เท่าๆ กัน ที่ต้องทำเช่นนี้เพื่อเป็นการ "เกลี่ย" ลักษณะที่ไม่เหมือนกันในสองกลุ่ม เช่น เพศ อายุ ลักษณะพื้นฐานต่างๆ วิธีการ Randomize จึงเป็นสิ่งที่สำคัญ หากเป็นการ Randomize แต่ตามใจผู้ศึกษา (เช่นคนไข้เลขคู่ เอาไปอยู่กลุ่ม Treatment คนไข้เลขคี่เอาไปอยู่กลุ่ม Control) จะทำให้ไม่เกิดการ "เกลี่ย" ที่แท้จริงนี้ได้

1.2.
การ Randomization ที่กระทำโดยปกปิด (conceal) หรือไม่ เนื่องจากหากไม่ปกปิด ก็อาจทำให้ไม่เกิดการ Randomization ที่แท้จริงได้ ตัวอย่างที่คลาสสิก ก็คือการเทียบระหว่าง Open & Laparoscopic appendectomy เมื่อมีคนไข้มาตอนกลางคืน ถ้าไม่ปกปิด ผู้ร่วมวิจัยที่ขี้เกียจทำ Laparoscopic appendectomy ก็อาจโยนสลากที่จับได้ทิ้ง แล้วจับใหม่จนกว่าจะได้ Open เป็นต้น

1.3.
คนสองกลุ่มนี้เหมือนกันในข้อมูลพื้นฐานหรือไม่ อันนี้มักอ่านได้จาก Table ของ Baseline Characteristic ซึ่งมักจะอยู่เป็น Table 1 เป็นการสะท้อนให้เห็นว่าการ Randomization นั้นเกิดการ "เกลี่ย" จริงหรือไม่ บางคนอาจติดใจกับการที่ต้องมีค่าทางสถิติเช่น p-value มาอยู่ในตาราง แต่แท้จริงแล้วการที่เราพอจะดูว่ามัน "เกลี่ย" ได้จริงหรือไม่อาจไม่จำเป็นต้องเป็นค่า p-value ที่มีนัยสำคัญเสมอไป เอาแค่ดูแล้วมันใกล้เคียงกันก็เพียงพอ (สังเกตได้จาก Journal เก่าๆ มักแสดง p-value แต่ Journal ใหม่ๆ จะเลิกแสดงไปแล้ว)

2.     นอกจาก Intervention ที่เราสนใจแล้ว ทั้งกลุ่ม Control และ Treatment ได้รับการรักษาแบบเดียวกันหรือไม่

อันนี้ดูได้จากว่ามีการ Blind มากแค่ไหน ถ้ายิ่ง Blind มากก็ยิ่งป้องกันความลำเอียง (Bias) ได้มากเท่านั้น คนที่ต้องพิจารณามีอยู่ 5 กลุ่มคือ Patient, Clinician, Data collector, Outcome adjudicator, Analyst

สิ่งที่น่าสนใจคือ paper ส่วนใหญ่มักเสนอตัวเองว่าเป็น double-blind ซึ่งคำนี้เป็นคำที่ลำบากในการแปลความหมายเนื่องจากไม่รู้ว่าที่ blind 2 คนนั้นเป็นใครบ้างใน 5 กลุ่มข้างต้น แนะนำให้อ่านแล้วทำความเข้าใจมากกว่าว่ากลุ่มใดบ้างที่ blind แต่โดยมากแล้วคำว่า double blind มักหมายถึง blind patient และ clinician โดยการ blind ส่วนใหญ่ที่เกี่ยวกับยามักใช้เป็นยาหลอก หรือ placebo

สิ่งที่น่าสนใจถัดมาคือการศึกษาที่ดูแล้วไม่สามารถ blind ได้แน่ๆ เช่นการศึกษาทางศัลยกรรม แบ่งกลุ่มผ่าตัด และไม่ผ่าตัด อันนี้อาจจะ blind ลำบาก ทางแก้คือดูว่าเขาพยายาม blind แค่ไหน เช่น พยายามเอาผ้ามาพันไม่ให้คนที่มาวัด outcome เห็นว่าผ่าหรือไม่ผ่า

นอกจากนี้แล้วเรายังสามารถดูผลของการ blind ได้จากการดูว่ามันเกิด co-intervention หรือสิ่งที่ให้ไปพร้อมๆ กับ intervention ที่แตกต่างกันระหว่างสองกลุ่มหรือไม่ เช่นกลุ่มที่ได้ยา A ได้รับคำแนะนำอย่างดี ส่วนกลุ่ม placebo ไม่ได้รับคำแนะนำอะไรเลย ในกรณีนี้หากผลที่ได้ออกมาแตกต่างกัน มันอาจจะเกิดจาก "คำแนะนำ" ไม่ใช่จาก "ยา A" ก็ได้

3.     เมื่อจบการศึกษาแล้ว ทั้งสองกลุ่ม (Treatment, Control) ยังเท่าเทียมกันในแง่ต่างๆ อีกหรือไม่

3.1.
Follow up ได้ครบหรือไม่ หากกลุ่มใดกลุ่มหนึ่ง Follow up ได้น้อยกว่าอีกกลุ่ม หรือได้น้อยทั้งสองกลุ่ม ก็อาจจะแปลผลได้ลำบาก เนื่องจากไม่รู้ว่าคนที่หายไปนั้นเกิดเหตุการณ์อะไรขึ้นกันแน่ การที่จะบอกว่า Follow up ได้เท่าไหร่ถึงจะเรียกว่าครบเพียงพอนั้นไม่มีกำหนดชัดเจน อาจลองคิดดูจากว่าถ้าคนที่หายไปตายหรือเกิดผลเสียทั้งหมด จะส่งผลกระทบต่อตัวเลขเสียเท่าใด อย่างไรก็ดี ถ้า Loss Follow up <5% ก็มักไม่เกิดปัญหา

3.2.
การศึกษานั้นหยุดก่อนที่ตั้งใจจะหยุดหรือไม่ เนื่องจากบางการศึกษาอาจมีความจำเป็นหลายด้านที่ต้องหยุดก่อนที่กำหนดเวลาการศึกษานั้นจะเป็นจริง อันนี้อาจมีปัญหาได้หากผลการศึกษานั้นเป็นแบบหนึ่งในตอนแรก และกลับข้างเป็นอีกแบบในตอนหลัง หากเราหยุดตรงกลางก็อาจให้ข้อสรุปที่ผิดไปจากความเป็นจริงได้

3.3.
การวิเคราะห์ข้อมุลเป็นแบบ Intention-To-Treat หรือไม่ บางการศึกษาใช้การวิเคราะห์อีกแบบที่เรียกว่า Per-Protocol คือเอาข้อมูลตามความเป็นจริงเช่น นาย ข. ได้รับยา A แต่ดันไม่กินเลย ก็จะวิเคราะห์โดยจัด นาย ข อยู่ในกลุ่มที่ไม่กินแทน อันนี้ส่งผลเป็นอย่างมากต่อการ Randomization ทำให้สิ่งที่เราอุตส่าห์เกลี่ยจากการ Randomization นั้นเปลี่ยนไปโดยสิ้นเชิง ดังนั้นการวิเคราะห์แบบนี้จึงไม่ดี อย่างไรก็ตามส่วนใหญ่ในช่วงหลังมักจะเป็น Intention-To-Treat (แต่หากไม่ได้เขียนต้องตั้งข้อสงสัยว่าอาจเป็นแบบ Per-Protocol)

บางคนอาจสงสัยเรื่องของ คำว่า Internal Validity/External Validity คำนี้เป็นคำที่นักวิจัยใช้ครับ กล่าวคือ Internal Validity หมายถึงว่า "ถูกต้อง"ในระดับของตัวอย่าง (sample) ที่นำมาศึกษานั้นๆครับ ส่วน External Validity หมายถึง "ถูกต้อง"ในระดับของกลุ่มประชากรเป้าหมายทั่วๆ ไปครับ (target population) สำหรับในการ appraisal นั้นคำนึงถึงเรื่องของ Internal Validity มากกว่าเนื่องจากจะเอาส่วนของ External Validity ไปอยู่ในหัวข้อของ Application ครับ

 บางคนพยายามจะ "ให้คะแนน" ความ Valid แต่ละข้อ และแต่ละวิธีก็มีการให้คะแนนแตกต่างกันไปแล้วแต่แต่ละคน เช่น บางคนอาจจะคิดว่าเรื่องของการ Randomization มันสำคัญมาก แต่อีกคนอาจคิดว่าเรื่องของ Blinding สำคัญกว่า เรื่องนี้ไม่มีข้อสรุปที่ชัดเจน ทำให้จริงๆ แล้วเราไม่สามารถบอกได้ว่า paper แต่ละอันมีค่าของความ "Validity" เท่าไหร่ นิยมให้ตามความรู้สึกของผู้ appraise มากกว่า (เช่น ถ้ารู้สึกว่าโอ้โห มันจับผิดไม่ได้เลย ก็อาจให้ 80-90% หรือถ้ามันห่วยจนไม่มีซักอย่างก็อาจให้ 30-40% ก็เป็นไปได้)

  
 


 

Result หรือผลที่ได้ จะต้องดูว่าผลที่ได้นั้น ใหญ่แค่ไหน (Large) และ แม่นยำแค่ไหน (Precise)

สูตรคำนวณที่อาจต้องใช้คือ Number Needed to Treat (NNT) = 100/Risk Reduction (เป็น %)

เช่น Risk ในการลดอาการของยา A = 10 คน ใน 200 คน = 10/200 = 5%

Risk ในการลดอาการของ Placebo = 5 คนใน 200 คน = 5/200 = 2.5%

ดังนั้น Risk Reduction = 5% - 2.5% = 2.5%

และ Number Needed to Treat (NNT) = 100/2.5 = 40

หมายความว่า เราต้องรักษาคนไข้จำนวน 40 คนจึงจะลดอาการได้ 1 คน

 ซึ่งขึ้นอยู่กับว่าการศึกษานั้นๆ เป็นการศึกษาแบบไหนครับ บางการศึกษาก็คำนวณได้ บางทีก็คำนวณไม่ได้

สำหรับเรื่องของ Precise นั้นให้ดูจากค่าของ 95% Confident Interval (95%CI) ซึ่งเป็นตัวบอกว่า "ค่าจริง" ที่เราทำได้ เรามั่นใจ 95% ว่ามันน่าจะอยู่ในช่วงนั้นๆ เช่น คำนวณ Odds Ratio (OR) ว่ายา A ดีกว่า placebo ในแง่หายจากอาการได้ 2.03 โดยที่ 95%CI อยู่ระหว่าง 1.0-3.5 แสดงว่า เรามั่นใจ 95% ว่าค่าจริงๆ ของ OR จะอยู่ในช่วง 1.0-3.5 วิธีที่จะดูว่ามันส่งผลอย่างไร ก็ให้ดูว่าในช่วงนั้นๆ เรารับได้แค่ไหน

เช่น การแปลผลของ OR ดังกล่าว หมายถึง คนที่ใช้ยา A มีโอกาสหายจากอาการเป็น 2.03 เท่าของคนที่ใช้ placebo ซึ่งอันนี้เป็นการแปลของจุดที่คำนวณได้ (Point Estimate) คือ 2.03 แต่เราก็ต้องแปลความหมายของ 95%CI ด้วยว่าจริงๆ แล้วโอกาสที่บอกว่า 2.03 เท่านั้นน่ะ ความเป็นจริงมันก็เป็นได้ตั้งแต่ 1.0 เท่า ถึง 3.5 เท่านะ (สังเกตว่าถ้าพูดว่า โอกาสเป็น 1 เท่าของคนที่ได้ placebo จะแปลว่า "เท่ากัน" แสดงว่ามันก็อาจจะไม่ได้ช่วยอะไรเลยก็ได้ บางคนอาจเรียกสถานการณ์นี้ว่า "คร่อม 1" อย่างไรก็ดีแนะนำให้ลองแปลผลดูจะดีกว่าจำตัวเลขว่า คร่อม 1 คร่อม 0)

สำหรับเรื่องของ 95%CI นั้นยังมีอีกเรื่องหนึ่งคือ การคำนวณ 95%CI มักจะสัมพันธ์ไปกับจำนวนของกลุ่มตัวอย่าง (sample size หรือสัญลักษณ์ n) กล่าวคือ ยิ่งกลุ่มตัวอย่างยิ่งใหญ่เท่าไหร่ ค่าที่เราได้ก็จะยิ่งมั่นใจมากขึ้นเท่านั้น (ตาม common sense ธรรมดาๆ)

บางการศึกษาจะรายงานผลออกมามีค่า p-value ด้วยซึ่งตรงจุดนี้จริงๆ แล้วไม่จำเป็นต้องให้ความสนใจมากนัก เนื่องจากจะสัมพันธ์ไปกับค่า 95%CI ที่ได้เสมอ

  
 

Application หรือการนำผลที่ได้ไปใช้ที่ต้องดูคือ

1.     คนไข้เราเหมือนคนไข้ในการศึกษาหรือเปล่า อันนี้อาจดูจากว่า จริงๆ แล้วคนไข้เราสามารถเข้าการศึกษานี้ได้ไหม อาจดูจาก inclusion/exclusion ของการศึกษา ปัญหาหลักคือก็มักจะมีคนแย้งว่าการศึกษานี้ทำในต่างประเทศอาจเอามาใช้กับคนไทยไม่ได้ อันนี้เป็นเรื่องที่เถียงกันยังไงก็ไม่จบ อย่างไรก็ตาม หากไม่อยากเถียงก็อาจหาเหตุผลมาแสดงในมุมย้อนกลับก็ได้ว่าเพราะเหตุอันใดคนไข้เราถึงจะไม่สามารถใช้ผลจากการศึกษานี้ได้

2.     มีการพิจารณาถึง outcome ที่คนไข้สนใจจริงๆ หรือไม่ (Patient-Oriented Outcome) บางการศึกษาสนใจแค่ระดับของฮอร์โมน ระดับของน้ำตาล ซึ่งอาจไม่เป็นสิ่งที่คนไข้สนใจจริงๆ เช่น ความตาย ความพิการ ก็ได้ (เรียก outcome ที่ไม่สนใจคนไข้นี้ว่า surrogate outcome) นอกจากนี้ยังต้องระวัง outcome ที่เป็นแบบรวมๆ (composite outcome) เช่น รวมระหว่างความตาย+พิการ+ระดับน้ำตาลลด อันนี้ต้องพิจารณาว่ามันควรจะไปด้วยกันหรือไม่ ตามตัวอย่างนี้ outcome บางอย่างอาจจะไป "ฉุด" ให้ outcome อื่นนั้น significant ก็ได้ เช่น จริงๆ แล้วมันทำให้ระดับน้ำตาลลดมากๆ แต่ไม่ได้เกี่ยวกับการตายเสียเท่าไหร่ แต่พอมารวมกันก็ฉุดให้ดูเหมือนลดการตายไปด้วยเป็นต้น

3.     ผลที่ได้นี้คุ้มกับผลเสียหรือไม่ อันนี้อาจจะต้องพิจารณาถึงเรื่องของ side effect ของการรักษา, เรื่องของค่าใช้จ่ายของการรักษา ซึ่งใน paper อาจไม่มีอาจต้องไปหาเพิ่มเติม อาจชั่งระหว่าง Number Needed to Treat กับผลเสียก็ได้หากมีข้อมูล


 

ไว้คราวหน้าผมจะลอง Appraise บางอันให้ดูเป็นตัวอย่างนะครับ

07 สิงหาคม 2551

Tips for good discussion lecture

เมื่อสองอาทิตย์ที่แล้วได้มีโอกาสฟัง Professor Gordon จาก McMaster University มาบรรยายเรื่องการสอน EBM ครับ แกแนะนำวิธีการสอนกลุ่มย่อยของ EBM ให้ประสบผลสำเร็จดังนี้ครับ

To have good discussion lecture on EBM, Prof. Gordon from McMaster University have some tips:
  • Class participation: try to get everybody to involve in the topic
    พยายามให้ทุกคนมีส่วนรวม
  • Divide the tasks into smaller groups and check the smaller group whether they are struggling
    แบ่งงานเป็นกลุ่มย่อยๆ และสังเกตว่ากลุ่มที่แบ่งไปนั้นมีปัญหาในการทำงานที่มอบหมายหรือไม่
  • Have lots of example (simple and easy example)
    ยกตัวอย่างบ่อยๆ และควรเป็นตัวอย่างที่เข้าใจง่าย
  • Comparison between things: to make something more clearly, we should contrast them with others.
    พยายามใช้การเปรียบเทียบเพื่อให้เห็นได้ชัด
  • Voting: let attendant have their own thoughts.
    ให้ทุกคนมีส่วนร่วมว่าเห็นด้วยหรือไม่เห็นด้วยด้วยการโหวต
  • Keep everything simple
    พยายามทำอะไรให้ง่ายเข้าไว้
  • Outline & structure of topic speaking
    พยายามแสดงให้เห็นว่าวันนี้เราจะพูดอะไรบ้าง
  • Repeated summary when finishes
    สรุปเมื่อจบ
  • Move people!
    พยายามให้ผู้คนมีการเคลื่อนไหว (ขยับ) จะได้ไม่น่าเบื่อ
  • Humor
    พยายามสอดแทรกความตลก
  • Voice (Vary voice tone, use the higher voice when speaking important points)
    พยายามใช้เสียงดังเพื่อเน้นจุดที่สำคัญ
  • Always use a whiteboard
    พยายามเขียนกระดาน
  • Review last session before begin a new session
    ก่อนจะเริ่มชั่วโมงใหม่ให้สรุปสิ่งที่เรียนมาในชั่วโมงที่แล้ว

24 กรกฎาคม 2551

ทำไม Evidence-Based Practice ถึงไม่เป็นที่แพร่หลายในแพทย์ทั่วไปในเมืองไทย

ทำไม Evidence-Based Practice ถึงไม่เป็นที่แพร่หลายในแพทย์ทั่วไปในเมืองไทย

ทุกวันนี้การที่เราจะทำอะไร ก็จะต้องมีหลักฐานหรือเหตุผลมารองรับการตัดสินใจอยู่เสมอ ในทางการแพทย์ก็เช่นเดียวกัน แพทย์สมัยใหม่ ควรที่จะมีหลักฐานหรือเหตุผลมารองรับการตัดสินใจนั้นๆ ผมจะไม่พูดถึงสำหรับการอธิบายให้ผู้ป่วยเข้าใจถึงหลักฐาน แต่จะพูดในมุมมองของแพทย์ทั่วไป (ผมเพิ่งจบมาได้ไม่กี่ปี และมีโอกาสได้ทดลองใช้ EBM บ้างตอนอยู่โรงพยาบาลชุมชนในต่างจังหวัด) ปัญหาที่ผมพบก็คือ

1. เวลา: แพทย์คงไม่สามารถที่จะมีเวลาไปค้นหาความรู้ที่เป็นหลักฐานรองรับมาได้อย่างเพียงพอ เนื่องจากในการตรวจผู้ป่วยของประเทศไทยนั้น ยังต้องตรวจผู้ป่วยเป็นจำนวนมากต่อวันอยู่ (บางคนตรวจผู้ป่วยนอกเกือบ 100 รายต่อ 8 ชม. นั่นคือรายละประมาณ 5 นาที นี่ยังไม่นับเวลาพักเที่ยงและเวลาที่ต้องไปดูผู้ป่วยในซึ่งเสียเวลามาก)

นอกจากนี้เมื่อแพทย์เลิกงาน ก็หวังที่จะได้พักผ่อนเช่นวิชาชีพอื่น มีเวลาไปทำในสิ่งที่บันเทิงใจ เช่น อ่านหนังสือ ดูภาพยนตร์ ฟังเพลง เล่นกีฬาบ้าง ยิ่งทำให้ไม่มีเวลาเข้าไปใหญ่

หากจะถามว่าภายใน 5 นาทีนั้น ไม่มีเวลาสำหรับหาข้อมูลอย่างมีหลักฐานเลยหรือ ผมมีความคิดว่า มันเป็นไปได้เหมือนกัน แต่ลำบาก เนื่องจากภายใน 5 นาทีนี้ ต้อง ซักประวัติ, ตรวจร่างกาย, นึกถึงโรคที่จะเป็นไปได้, สั่งการรักษา, อธิบกายการรักษา ซึ่งผมคิดว่ามันยากมากในการหาข้อมูลทั้งหมด แพทย์หลายท่านใช้วิธีหาข้อมูลจากหนังสือ หรือ PDA หรือจากอินเทอร์เน็ต แต่ข้อมูลที่หาได้ใน 5 นาทีนี้ ท่านคิดหรือว่ามันจะเชื่อถือได้ 100%.. มันก็เป็นเพียงข้อมูลที่คนอื่นเป็นคนรวบรวม ไม่ใช่แพทย์คนนั้นตัดสินใจสำหรับผู้ป่วยคนนั้นๆ เสียหน่อย

นอกจากนั้นแต่ละคนไข้ ยังมีคำถามที่น่าสนใจหลายคำถาม และแพทย์ส่วนใหญ่ก็ไม่รู้ว่าคำถามที่สำคัญในสถานการณ์นั้นๆ คืออะไร ยิ่งทำให้ค้นหาได้ลำบากมากขึ้น เพราะกว่าจะคิดคำถามได้ คนไข้ก็ออกันเต็มห้องตรวจแล้ว

2. เครื่องมือในการหาความรู้: แพทย์ส่วนใหญ่ในเมืองไทย ไม่ค่อยมีเครื่องมือในการหาข้อมูลทางความรู้เท่าใดนัก บางโรงพยาบาลไม่สามารถใช้อินเทอร์เน็ตระหว่างตรวจคนไข้ได้ แพทย์จบใหม่ไม่มีเงินสำหรับแหล่งความรู้ราคาแพงสำหรับเมืองนอก (เช่น UpToDate, Evidence-Based Journals)

นอกจากนี้ แพทย์ไทย ยังมีปัญหาเกี่ยวกับการอ่านภาษาอังกฤษ (เนื่องจากภาษาอังกฤษ ไม่ได้เป็นภาษาหลักที่ใช้ในการสื่อสาร) ต้องมีการแปลความจากข้อมูลของต่างประเทศที่เป็นภาษาอังกฤษ มาเป็นภาษาไทยอีกครั้ง บางครั้งเกิดความเข้าใจผิด และเกิดการท้อ ไม่อยากอ่านหรือค้นคว้าต่อ

หลักฐานทั้งหลายที่มีอยู่ในเมืองไทย ก็มักไม่อยู่ในที่ๆ สามารถหาได้ง่ายแบบ PubMed และหากจะหาได้ ก็ต้องอาศัยความยากลำบากในการติดต่อห้องสมุด แสดงให้เห็นว่าเมืองไทย ยังไม่มีระบบจัดการด้านความรู้ทางการแพทย์ที่ดีพอ (ถ้ามีจริง อย่างน้อยก็ขาดการประชาสัมพันธ์เป็นอย่างมาก แม้แต่ผมยังไม่รู้เลย)

3. วัฒนธรรมของคนไทย: คนไทยส่วนมากมีความขี้เกียจค้นคว้า รู้แต่สิ่งที่ตนเองเคยปฏิบัติ ไม่ไขว่คว้าหาความรู้ใหม่ๆ อันนี้อาจหมายถึงคนที่จบไปได้สักพักแล้วเกิดอาการ "หมดไฟ"

นอกจานี้วัฒนธรรมการเคารพระหว่างรุ่นพี่รุ่นน้อง และความเชื่อที่ว่ารุ่นพี่จะต้องถูกเสมอ ยังบั่นทอนการปฏิบัติตามหลักฐาน เนื่องจากรุ่นน้องเมื่อหาข้อมูลที่มีเหตุผลมาโต้แย้ง รุ่นพี่ ก็มักจะไม่สนใจ ถือว่ารุ่นน้องจะต้องปฏิบัติตามตนเองอย่างไร้เหตุผล เชื่อแต่ตนเองเป็นหลัก

4. ความรู้ของคนไข้: ความรู้ความเข้าใจของคนไข้ ก็เป็นส่วนหนึ่งที่ทำให้เมื่อค้นหาหลักฐานมาใช้แล้ว เราไม่สามารถจะอธิบายคนไข้ให้เข้าใจและตัดสินใจได้ ผมมีประสบการณ์ในการอธิบายคนไข้คนหนึ่งให้เขาตัดสินใจเองเป็นเวลานาน แต่ผลสุดท้ายคำถามที่เขาตั้งกลับมาคือ "จะทำอย่างไรก็ได้ สุดแล้วแต่หมอเถอะ

บางส่วนที่ผมยกตัวอย่างไปนี้ผมคิดว่าสามารถที่จะแก้ไขได้ แต่การที่จะแก้ไขด้วยคนเพียงกลุ่มเดียว คงลำบาก และจะต้องแก้ไขทั้งระบบ อย่างค่อยเป็นค่อยไป เพื่อลดความขัดแย้งด้วย



Why Evidence-Based Practice is not working in Thailand.

Nowadays when we are practicing modern medicine, we have got to give our reasons for everything. From my point of view (once being a general practitioner in a small 30-bed rural hospital in Thailand), to be reasonable for decisions and using EBM in Thailand, there are several problems:

1. Time: Thai doctors don't always have enough time to search for evidence. Doctors in small hospital have to see a large number of patients per day. Some even have to see 100 patients in 8 hr (which is 5 minutes/case), this does not even include doing rounds, servicing the in-patients department, and lunch.

Also, after doctors finished their work, they are tired and wanted to do something interesting to amuse themselves such as reading books, watching movies, listening to music, playing sports, etc. This cuts the time more.

And actually, the time is not even really 5 minutes because doctors have to take histories, do physical exams, differential diagnoses, order medications and explain the treatment to the patient. If you are curious whether this 5-minute-per-patient is enough to search for evidence or not, I am going to tell you that actually 5-minute-searching is enough, but you get what you pay for. Some doctors use secondary data such as from textbooks, from PDAs or from the Internet. The data from these sources are from other points of view (experts' points of view) and may not be applicable to our patients.

Also, for each patient we see, there are lots of questions. Many doctors don't know what the important question is. This requires more and more time on searching.

2. Tools and resources: many doctors in Thailand do not have tools to access the best evidence available. Some hospitals don't even provide internet access while you are taking care of a patient. Also, newly-graduated medical students usually don't have enough money for international high-quality evidences such as UpToDate and BMJ's Evidence-Based Medicine.

In addition, there is a language barrier: Thais are not good at English - even doctors who read lots of English textbooks. English is not in everyday use. There always has to be some kind of translation. And doctors are not good at translating, we get confused easily. This further discourages them to search and use the evidence.

Another reason is that there are not enough accessible Thai evidences. To reach for Thai medical research abstracts, one has to go to a medical school's library. That seems like Thailand's medical authorities have to do something to improve our knowledge management system. (Even if there really are some search websites, it seems like there are not enough public relations – I, for one, don't know any of them.)

3. Thai culture: Thai people usually don't care about getting more knowledge. Thais usually rely on old beliefs, and never violate them. This also happens when someone graduated for such a long time.

Also there is a culture of respecting one's elders. Young doctors usually have to do what the older doctors say. This leads to the failure of practicing EBM. When young doctors have reasons against something, old-established doctors just ignore them. They only believe in themselves.

4. Patient knowledge: Thai patients seem to be not well-educated enough. I had this problem myself in the past: I was once asked for an answer to a very good clinical question by the patient. I answered them thoroughly about benefits and risks, but after a long time of talking, I asked what the decisions of the patient and the relatives were. They just simply said "Doctor, please choose for us."

Some of these problems can be managed easily, but I think to manage these problems we have to do it in a more sophisticated and collaborative system. And the change should be gradual to lessen the effect of protest.

05 มิถุนายน 2551

ยินดีต้อนรับครับ

สวัสดีครับ ผมชื่อ ปวิน นำธวัช ครับ เป็นนักศึกษา Ph.D Clinical Epidemiology ครับ ตอนนี้เรียนอยู่ที่คณะแพทยศาสตร์ รพ. รามาธิบดีครับ เว็บบล็อกนี้ผมจะเก็บเกี่ยวกับสิ่งต่างๆ ที่ผมได้เรียนรู้ใน course นี้นะครับ ท่านใดที่สนใจสามารถติดต่อผมได้ทางอีเมลล์ที่ pawinpawin@gmail.com ครับ (ข้อมูลเกี่ยวกับตัวผม ดูเพิ่มเติมได้ที่เว็บไซต์ของผมนะครับ)