29 มกราคม 2552

ว่าด้วย Study Design

มีหลายคนมีข้อสงสัยเกี่ยวกับเรื่อง Study Design จากวันก่อนที่ผมเกริ่นไว้คร่าวๆ นะครับ วันนี้จะลองมาขยายความอีกเล็กน้อย

ก่อนอื่นต้องอธิบายสองคำนี้นิดนึงนะครับ

  • Exposure หมายถึงภาวะที่เราสนใจว่ามันจะทำให้เกิดผลอะไรบางอย่าง เช่น การกินยา การสูบบุหรี่
  • Outcome คือผลที่เกิดขึ้นที่เราสนใจ เช่น การเกิดมะเร็งปอด การเกิดหัวใจวาย เป็นต้น

การศึกษาทางระบาดวิทยานั้นโดยหลักๆ แล้วจะแบ่งออกเป็นสองประเภทใหญ่ๆ คือ

1. Experimental Design คือผู้วิจัยนั้นเป็นผู้กำหนดเองว่า Subject ในงานวิจัยนั้นจะได้รับ Exposure เอง เช่น กำหนดว่าจะให้กินยา, กำหนดว่าจะได้รับการผ่าตัด, กำหนดว่าจะได้รับการอบรมจิตวิทยา เป็นต้น

ข้อดีของ Experimental Design นี้มีหลายประการครับเช่น

  • สามารถควบคุมปัจจัยต่างๆ ได้เต็มที่ (ภาษาระบาดเรียกว่าคุม Confounding Factors)
  • เนื่องจากเราเป็นคนให้ exposure ก่อนวัด outcome เสมอ (บางคนเรียกการวัด exposure ก่อน outcome นี้ว่า prospective หรือไปข้างหน้า) เราก็จะบอกได้ชัดเจนขึ้นว่า Exposure นั้นเป็นสาเหตุของ outcome แน่ๆ เรื่องเป็นเหตุเป็นผลกันนี้เขามีหลักการชัดเจน คือเรื่อง Causation ซึ่งไว้คราวหลังผมจะเขียนถึงอีก
  • สามารถดู incidence ที่เกิดขึ้นได้ (ซึ่งเป็นผลพลอยได้จากการที่เป็น prospective นั่นเอง)

ข้อเสียก็เยอะเหมือนกันครับ เช่น

  • แพง
  • ทำยาก (จะไปหาใครมายอมเข้าการศึกษา, การศึกษาต้องผ่านการพิจารณาด้านจริยธรรมค่อนข้างมาก)
  • ตัวแทนที่เข้าร่วมการศึกษา นั้นอาจไม่ใช่กลุ่มเดียวกับประชากรที่เราสนใจ เช่น ตัวแทนเป็นคนที่สนใจในสุขภาพตัวเองอยู่แล้ว จึงมาเข้างานวิจัย อาจไม่เหมือนกันกับประชากรจริงๆ ที่ไม่ได้สนใจสุขภาพเท่าไหร่ ก็ได้ครับ

โดย Experimental Design นั้นจะแบ่งได้หลายแบบ เช่นแบ่งว่าเป็น randomized/non-randomized design เป็นต้น

2. Observational Design คือผู้วิจัยไม่ได้เป็นผู้กำหนดเองครับ (exposure นั้นเกิดขึ้นเองโดยธรรมชาติของผู้ถูกศึกษา) ซึ่งโดยมากจะแบ่งออกเป็น

2.1 Descriptive Study เป็นการศึกษาที่ไม่ได้สนใจการเปรียบเทียบอะไรกันเลย กล่าวคือ ศึกษาคนกลุ่มเดียว โรคเดียว งานวิจัยพวกนี้เช่น

  • Case study หรือ case report แค่รายงานผลการรักษาของคนไข้ไม่กี่ราย
  • Case series อาจจะหลายรายขึ้นมาหน่อย เช่น 200-300 ราย
  • Cross-sectional คือการไปเจาะดูในช่วงเวลาเวลาหนึ่ง เช่น ศึกษาดูอัตราการเกิดโรคหัวใจในประชาชนที่อาศัยในกรุงเทพฯ ช่วงปี 2551, ศึกษาดูอัตราการตายของเด็กแรกเกิดในโรงพยาบาลชุมชนในระยะเวลาหนึ่งๆ
  • Longitudinal study อาจมีการตามคนไข้ไปชั่วระยะเวลาหนึ่ง
  • Ecological study เป็นการศึกษาที่หน่วยย่อยไม่ใช่รายคน เช่น การศึกษาเทียบ GDP ของประเทศในกลุ่มอาเซียนกับอัตราตายของโรคหัวใจ (ซึ่งจะเห็นว่าหน่วยย่อยในที่นี้เป็น “ประเทศ” ไม่ใช่คน) เป็นต้น จริงๆ บางคนก็จะจัด Ecological study นี้เข้าไปใน Analytical Study ได้เหมือนกันนะครับ

2.2 Analytical Study เป็นการศึกษาที่มี “การเปรียบเทียบ” ของกลุ่มคนตั้งแต่สองกลุ่มขึ้นไป สังเกตว่าจริงๆ แล้วงานวิจัยส่วนใหญ่จะพยายามทำการเปรียบเทียบตรงนี้ขึ้นมาด้วย วิธีสังเกตง่ายๆ ก็คือมักจะมีการใช้วิธีทางสถิติเข้ามาจับ แล้วก็จะได้ค่า p-Value มาด้วย (ถ้าเป็นแค่ Descriptive จะออกมาแค่ %, incidence, prevalence อย่างเดียว ไม่มี p-Value)

Analytical Observational Study นั้นส่วนใหญ่ที่เจอบ่อยมีสามอย่างครับ คือ

  • Cross sectional จะเห็นว่าซ้ำกับตรง descriptive เพราะว่า cross-sectional เป็นการบ่งว่าตัดส่วนหนึ่งของเวลามาทำการศึกษา แต่ทีนี้แทนที่จะศึกษาดูแค่ % ในคนทั้งหมด ก็แบ่งคนทั้งหมดเป็นสองกลุ่มแทน แล้วค่อยวิเคราะห์ “เปรียบเทียบ” ระหว่างสองกลุ่มในแง่ต่างๆ แทน

     cross-sectional
  • Case control เป็นการศึกษาที่ outcome มันเกิดขึ้นมาแล้วเราถอยกลับไปดูว่าคนที่มี outcome กับคนที่ไม่มี outcome นั้นมันแตกต่างกันหรือไม่ครับ ยกตัวอย่างเช่น การศึกษาเพื่อดูความเกี่ยวข้องโรคมะเร็งของเส้นประสาทหูชั้นในกับการใช้มือถือ โรคมะเร็งประสาทหูชั้นในนี้ปีนึงจะมีคนเกิดโรคนี้ซัก 3-4 คน การที่เราจะติดตามประชากรทั้งเมืองที่ใช้และไม่ใช้มือถือ (exposure) เพื่อรอให้โรค (outcome) นี้เกิดนั้นก็คงจะทำลำบาก ก็เลยใช้วิธีเอาคนที่เกิดโรคแล้ว (มี outcome แล้ว - หรือเป็น case) เทียบกับกลุ่มที่ไม่มีโรค (ไม่มี outcome - หรือเรียกว่า control) กลับมาย้อนซักประวัติว่า แต่ก่อนเคยใช้มือถือหรือเปล่า (exposure) ครับ จะเห็นได้ว่า เราย้อนจากผล (outcome) มาหาเหตุ (exposure) แทน

    case-control 

    หรือจะพูดอีกอย่างว่าเราแบ่งกลุ่มคนตาม outcome ก่อน แล้วค่อยแยกดูอัตราของการ exposed เทียบกัน ก็ได้

    ปัญหาของเจ้า case control นั้นอยู่ที่การเลือก control ครับ ซึ่งจะส่งผลไปตอนที่เราสรุปการศึกษา ยกตัวอย่างเช่นจากการศึกษามะเร็งที่ผ่านมา สมมุติว่าถ้าเราเลือก control เป็นคนที่นอนอยู่ที่รพ.ในเวลาเดียวกัน ถ้าผลออกมาพบว่าคนที่เป็นมะเร็งใช้มือถือมากกว่าจริงๆ เราก็จะสรุปได้แค่ว่า “สำหรับคนที่นอนรพ. แล้ว” พบว่าคนที่เป็นมะเร็งใช้มือถือมากกว่า -- หมายความว่าเราไม่สามารถจะเอาไปแสดงถึง “คนที่ไม่ได้นอน รพ.” ได้ครับ บางการศึกษาเลยเลือก case จากหลายแห่ง เช่นนอกจากจะในรพ. ยังเลือกตามชุมชน เป็นต้นครับ
  • สุดท้ายคือการศึกษาแบบ Cohort นั่นคือเราจะดู exposure ก่อนว่าคนนั้นๆ มี exposure หรือไม่แล้วค่อยตามดูว่าเกิด outcome หรือเปล่า เช่น การศึกษาเรื่องสูบบุหรี่ กับการเกิดมะเร็งปอด ก็จะตามดูคนที่สูด กับคนที่ไม่สูบ ว่าอัตราการเกิดมะเร็งปอดในสองกลุ่มนี้เท่ากันหรือไม่ (สังเกตว่าเราแบ่งกลุ่มคนจาก exposure ก่อน แล้วค่อยแยกดูอัตราของ outcome) เป็นต้น

    cohort 

    สังเกตว่ามันก็ไม่ต่างอะไรกับการทำ Experimental เพียงแต่อันนี้เราไม่สามารถไปกำหนด Exposure เองได้เพราะมันจะดูผิดจริยธรรมเกินไป (คือ เราไม่สามารถบอกให้คนทีอ่ยู่ในกลุ่มแรกไปสูบบุหรี่ซะ คนกลุ่มที่สองไม่ต้องสูบ นั่นเอง)

    สำหรับข้อดีของการศึกษาแบบนี้ก็คล้ายกับ experiment บางส่วนคือเราจะรู้ว่ามันเป็นเหตุเป็นผลกันแน่ๆ แต่ปัญหาคือมันก็เสียเวลาในการรอให้ outcome เกิดเหมือนกัน นอกจากนี้แล้วถ้า outcome มันไม่ค่อยเกิด (เช่นมะเร็งในหูชั้นใน) ก็คงจะต้องรอไปเรื่อยๆ จนกว่านักวิจัยแก่ก่อนแน่เลย

มึนกันหรือยังครับ ผมขอพูดคำที่สับสนกันเป็นประจำดีกว่า นั่นคือ คำว่า “Prospective” กับ “Retrospective” อันนี้เป็นที่สงสัยกันมาก แล้วก็สับสนกันมากๆ เลยครับ

คำว่า Prospective หมายถึง การมองไปข้างหน้า ส่วน Retrospective นั้นหมายถึงการมองย้อนหลัง มีผู้ใช้คำคู่นี้สองความหมาย ด้วยกัน

ความหมายที่หนึ่งที่มักใช้บ่อย คือการมองไปข้างหน้าเมื่อเทียบกับเวลา ณ การเริ่มศึกษาของผู้วิจัย เช่น ผมเริ่มศึกษาในปีนี้ (2009) การศึกษาใดๆ ไม่ว่าจะเป็น case control, cohort ที่นั่งรอเก็บข้อมูลตั้งแต่ปีนี้ (2009) ไปถึงปีในอนาคต (2010 2011…) นั้นผมก็อาจจะเรียกว่าเป็น prospective ได้

ในขณะเดียวกัน การศึกษาที่ไปย้อนดูบันทึกต่างๆ เวชระเบียน ที่เขียนขึ้นมาเมื่อปีที่ผ่านๆ มา (2008 2007 …) ก็จะเรียกว่าเป็น retrospective

แต่มีอีกหลายคนใช้ความหมายที่สองคือ prospective ในแง่ว่าเป็นการดู exposure ก่อน outcome (นั่นก็คือเป็นเป็น cohort นั่นเอง) และ retrospective ในแง่ว่าการดู outcome ก่อน exposure (ซึ่งก็คือ case-control) อย่างไรก็ตามคนที่ใช้ความหมายที่สองนี้มีอยู่น้อยนิดครับ คิดว่าส่วนใหญ่จะหมายถึงความหมายที่หนึ่งซะมากกว่า

มาสรุปทบทวนกันดีไหมครับ ว่าเรารู้ study design แบบไหนกันบ้างแล้วครับ ลองดูเลยครับ

study-design

เป็นไงครับ เข้าใจเพิ่มขึ้นบ้างหรือเปล่า ยังไงก็ลองสอบถามกันได้นะครับถ้างง

25 มกราคม 2552

Intention To Treat, ARR, AR, OR

วันนี้มีน้องที่สนใจระบาดวิทยา อีเมลมาถามเกี่ยวกับคำต่างๆ ก็เลยขอเอามาตอบในบล็อกด้วยเลยละกันนะครับ เพื่อเป็นประโยชน์ต่อคนอื่นๆ

สวัสดีคะ พี่ปวิน

พอดีว่าหนูได้ค้นหาข้อมูลเกี่ยวกับระบาดวิทยาอยู่ค่ะ แล้วค้นไปค้นมาก้อไปเจอบล็อกของพี่เข้าแล้วลองอ่านดูก็เข้าใจง่ายคะ  และหนูก็มีเรียนวิชาพวกนี้ด้วย และก็มีการบ้านคืออาจารย์ให้ประเมินวรรณกรรมค่ะ อ่านบล็อกที่พี่เขียนแล้วได้แนวทางในการประเมินหลายอย่างคะ แต่ว่าศัพท์เฉพาะบางตัวหนูก็ไม่ค่อยรู้อะคะ หนูอยากหาหนังสือที่เป็นภาษาไทยมาอ่านอะคะ แต่ค้นหาแล้วมันไม่เจออะคะ พี่พอจะรู้บ้างไหมคะว่าจะหาอ่านจากไหน เพราะอาจารย์สอนหนูก็พอรู้เรื่องบ้างแต่มันคร่าว ๆ อะคะ แล้วหนูก็ลืม ก็เลยอยากอ่านที่มันละเอียดจริง ๆ ตามที่พี่อธิบายไว้ในบล็อกเป็นอะไรที่หนูเข้าใจมากๆ เพราะพี่ใช้ภาษาง่ายๆ

พี่คะ อย่าง intention to treat มันหมายถึงยังไงคะ แล้วพวกค่าทางสถิติพวกARR ,relative risk, oddratio อะไรพวกนี้ค่ะมันหมายถึงอะไรบ้างคะ พี่พอจะมีการคำนวณหรืออธิบายที่เป็นภาษาไทยบ้างไหมคะ แล้วก็ข้อมูลเกี่ยวกับวิธีการทดลองอะคะ เช่น rct metaanalysis systemic review มันเป็นอย่างไร แตกต่างกันอย่างไรบ้างคะ

คือหนูต้องประเมินวรรณกรรมส่งอาจารย์หนูไม่รู้จะเริ่มเขียนยังงัยดี เขียนได้แต่ pico แต่ทำส่งอาจารย์ต้องมีการวิเคราะห์ด้วยค่ะ ถ้าพี่มีเนื้อหาเกี่ยวกับการอ่านวรรณกรรมที่เป็นภาษาไทยช่วยส่งให้หนูหน่อยได้ไหมคะ

ก่อนอื่นต้องขอขอบคุณมากนะครับที่อ่านบล็อกของผม ถึงแม้ว่าจะเป็นบล็อกเล็กๆ แต่ก็จะพยายามหาคำตอบมาให้ทุกๆ คนนะครับ ผมว่าอย่างน้อยอาจารย์น่าจะดีใจ ที่คุณพยายามหาคำถามและคำอธิบายแน่ๆ

สำหรับหนังสือที่ผมแนะนำ ผมไม่เคยอ่านหนังสือระบาดภาษาไทยเสียเท่าไหร่ แต่ได้อ่านหนังสือภาษาอังกฤษ User’s Guide to Medical Literature ของ Gordon Gyatt เล่มเล็กๆ เท่าฝ่ามือ (เล่มนี้) หรือจะอ่านจากเว็บไซต์นี้ก็ได้เหมือนกัน ซึ่งการประเมินวรรณกรรม ก็ทำตามหัวข้อในนั้นละครับ (เหมือนกันกับที่ผมเคยเขียนคือ Validity, Result, Application) ภาษาอ่านง่ายมากครับ และมีคำอธิบายเกี่ยวกับคำศัพท์พวกนี้ไว้เกือบหมดเลยทีเดียว อย่างไรก็ตามผมจะลองตอบคำถามที่ถามมาเป็นข้อๆ นะครับ

1. Intention To Treat คืออะไร

นึกสภาพ เวลาเราแบ่งคนไข้ในการศึกษาเป็นสองกลุ่มนะครับ กลุ่มนึงกินยาจริง อีกกลุ่มให้กิน placebo แน่นอนว่าเพื่อให้การทดลองนี้มันถูกต้อง เราก็ต้องสุ่ม (randomize) ให้แต่ละคนว่าเขาจะไปอยู่กลุ่มไหนใช่ไหมครับ (จะด้วยวิธีจับสลาก, ให้คอมพิวเตอร์รันให้ หรือโยนหัวก้อยก็แล้วแต่ -- มีคนทำจริงๆ นะ แบ่งคนไข้ด้วยการโยนหัวก้อยเนี่ย) ที่เราต้องพยายามสุ่มให้คนไข้ไปทั้งสองกลุ่มเพราะเรากลัวว่ามันจะมีลักษณะบางอย่าง ที่ทำให้คนที่กินยา แตกต่างจากคนที่กิน placebo เช่นถ้าเราไม่สุ่ม คนที่อารมณ์ดีหมอคุยด้วยแล้วรู้สึกดี หมอก็อาจจะจับเขาไปอยู่กลุ่มยา อีกคนนึงอารมณ์เสีย บ่นเยอะ จับไปอยู่กลุ่ม placebo เป็นต้น อันนี้คือเรื่องของการ randomization เพื่อให้แต่ละคนที่เข้าการทดลอง มีโอกาสไปอยู่กลุ่มที่ได้ยา = 0.5 (50%) และมีโอกาสไปอยู่กลุ่มที่ได้ placebo = 0.5 เท่าๆ กัน

แต่ในความเป็นจริง คนกลุ่มที่ได้ยากลับไปบ้านเขาอาจจะไปแลกยากับคนไข้ที่เป็นกลุ่ม placebo ก็ได้ หรือที่เลวร้ายกว่านั้นคนไข้ที่ได้ยาอาจเบื่อ ไม่อยากกินยาเลยก็ได้ (ซึ่งถ้าคิดแล้วมันก็คือไม่ได้กินอะไร ก็คล้ายๆ กับการกิน placebo) พอทีนี้วิธีการคำนวณเมื่อการทดลองจบมันก็จะมีสองแบบ

แบบแรก คิดตามสิ่งที่ทำลงไปจริงๆ คือเอาคนที่ยอมรับว่ากินยา อยู่ในกลุ่มกินยา เอาคนที่ได้กินยาแต่ดันไม่กิน ไปอยู่กลุ่ม placebo อันนี้เราเรียกว่าวิเคราะห์แบบ per protocol

แบบที่สอง คิดตามสิ่งที่เราตั้งใจจะให้เขาทำตั้งแต่แรก ก็คือไม่ว่าคุณจะเอายากลับไปกินหรือไม่กิน เราก็จะถือว่าคุณอยู่ในกลุ่มยา เรียกว่าแบบ intention-to-treat

ข้อที่ดีกว่าเป็นอย่างมากของแบบที่สองนี้คือว่ามันยังรักษาความที่มันเกลี่ย ลักษณะที่เรา random ไว้ตั้งแต่แรกไว้ด้วยครับ ดังนั้นหากไม่มี intention to treat แล้วจริงๆ ก็ไม่รู้ว่าจะ randomize ไปทำไม ทำให้ขาดความน่าเชื่อถือไปเป็นอย่างมากครับ ซึ่งโดยส่วนใหญ่เดี๋ยวนี้ผู้วิจัยก็รู้กันและจะทำการวิเคราะห์แบบ intention-to-treat อยู่แล้ว ยกเว้นผู้วิจัยกลุ่มเล็กๆ ที่ยังไม่เคยรู้จัก EBM ครับ

ถ้าอยากลองอ่านเพิ่มเติมเรื่อง Intention-to-treat ลองอ่านได้จาก Article นี้ ใน CMAJ ครับ

2. ARR, RR, OR หมายถึงอะไร

อันนี้ต้องย้อนมาถึงตารางที่นักระบาดใช้อยู่บ่อยๆ นั่นคือตารางขนาดสองด้านด้านละสองช่อง (2x2 contingency table).. อย่าเพิ่งยี้นะครับ.. ตารางนี้มีไว้เพื่อให้เราเห็นภาพชัดขึ้นของคนไข้ทั้งหมดเมื่อแยกสองแบบ เช่นผมทำการศึกษาเกี่ยวกับคนไข้ ที่นอนกรน เมื่อเทียบกับความอ้วน ได้ผลออกมาคือ

Table1

สังเกตว่า ตารางนี้จริงๆ มันมีแถว “ทั้งหมด” ด้วย แต่จริงๆ ในแถว “ทั้งหมด” นั้นมันก็คำนวณมาจากสี่ช่อง (2x2) นั่นแหละครับไม่ต้องกังวล ถ้ามีสี่ช่องก็จะหาช่องที่เหลือได้หมด

ถ้ามีคนถามว่า ถ้าเป็นคนอ้วน โอกาสนอนกรนจะเป็นเท่าไหร่ ก็ให้ลองคิดแบบนี้ คือปิดเอาคนที่ไม่อ้วนออกไป เอาแต่คนอ้วนไว้ นั่นก็คือจะเหลือเพียงแถวแรก

Table2

ก็ตอบเขาได้ง่ายนิดเดียวว่า คนอ้วน มีโอกาสนอนกรน 30 ใน 40 (30/40 = 3/4 = 0.75) ใช่ไหมครับ แต่ถ้าอย่างนี้แล้วเราอาจพูดอีกอย่างได้ว่า โอกาสเสี่ยงของคนอ้วนที่จะนอนกรน = 0.75 ได้เหมือนกัน (The risk of snoring in obese patients is 0.75.) นั่นคือคำแรก คำว่า “Risk”

งั้นเราลองมาหาอีกดีกว่า ถ้าเขาถามว่าคนที่ไม่อ้วน โอกาสนอนกรนจะเป็นเท่าไหร่ (What’s the risk of  snoring in non-obese patients?) ทำแบบเดียวกัน (ลองคิดเองก่อนด้วยนะครับ)

Table3

เฉลย ก็คือ 20/60 = 0.33 นั่นเองครับ

สรุปว่า Risk = จำนวนที่เป็นโรค / จำนวนคนทั้งหมด

ต่อมาก็คือคำว่า “Relative Risk” (หรือ Risk Ratio ซึ่งเป็นคำที่มีความหมายเดียวกัน) อันนี้เพิ่มมาอีกเพียงนิดเดียว คือเป็นการเปรียบเทียบระหว่างคนสองกลุ่ม ในที่นี้ก็คือคนอ้วน กับคนไม่อ้วนนั่นเอง ถ้าผมถามว่าคนอ้วนนี้มีโอกาสนอนกรนเป็นกี่เท่าของคนไม่อ้วน ก็เหมือนกันกับว่า

(โอกาสกรนของคนอ้วน) = (? เท่า) x (โอกาสกรนของคนไม่อ้วน)

แทนค่าตามสมการ ก็จะได้เป็น

0.75 = (? เท่า) x 0.33

หรือจำนวนเท่านี่ก็คือ = 0.75/0.33 = 2.27 นั่นเองครับ เย่ๆ นี่ไง Relative Risk ถ้าพูดก็คือ คนอ้วนมีโอกาสกรนเป็น 2.27 เท่าของคนไม่อ้วน (Relative risk of snoring in obese patient is 2.27. หรือ Obese patients’ risk of snore is 2.27 times of that non-obese patients’.) คำว่า Relative คือเมื่อเทียบเคียงกันเป็นสัดส่วนนั่นเอง กลายเป็นสมการได้คือ

Relative Risk = Risk (A) / Risk (B)

ผ่านไปสองคำ มึนหรือยังครับ? มีต่อนิดนึง

Absolute Risk Reduction (ARR) (หรือ Risk Difference (RD) ซึ่งเป็นคำที่มีความหมายเดียวกัน) ก็คล้ายกันครับ ในที่นี้ก็คือจะมองว่า Risk ของคนอ้วนนั้นมากกว่าคนไม่อ้วนเท่าไหร่ แต่ไม่เอาเป็นเท่า เอาค่าจริงๆ (ค่า Absolute) มาเลย นั่นก็คือ Risk คนอ้วน – Risk คนไม่อ้วน = 0.75 – 0.33 = 0.42 นั่นเองครับ

Absolute Risk Reduction = Risk (A) – Risk (B)

ข้อดีของอันนี้คือเอามาคิดเป็น Number needed to treat (NNT) ได้ครับ คือ

Number Needed to Treat = 1/Absolute Risk Reduction

ในที่นี้คือ = 1/0.42 = 2.38 มันหมายความว่าไง หมายความว่าถ้าเราเปลี่ยนจากคนอ้วนให้เป็นคนไม่อ้วนได้ทุกๆ 2.38 คนเราจะลดการนอนกรนได้ 1 คน -- แต่ส่วนมากเขาจะใช้ในเรื่องการกินยามากกว่าเพราะเรามักจะเปลี่ยนลักษณะเฉพาะเช่นความอ้วนของคนลำบาก

คำสุดท้ายคือคำว่า Odds Ratio ซึ่งต้องมาทำความเข้าใจกันใหม่ตั้งแต่แรกนะครับ

วิธีการคิดของ Odds นั้นไม่เหมือน Risk ครับ ของ Risk นั้นเราเอาคนที่กรน หารด้วยคนทั้งหมดใช่ไหมครับ แต่สำหรับ Odds นั้นเราเอาเป็นแต้มต่อกันครับ นั่นคือ

Table4

Odds การกรนของคนอ้วน = คนอ้วนที่กรน / คนอ้วนที่ไม่กรน = 30/10

ลองทำดูสำหรับคนไม่อ้วนนะครับได้ Odds การกรนของคนไม่อ้วนเท่าไหร่

Table5

เฉลย คือ 20/40 ครับ

ทีนี้ก็ง่ายแล้วคือ Odds ratio ก็คือการเปรียบเทียบระหว่างคนสองกลุ่มคล้าย Relative Risk นั่นเอง! เอา Odds ของคนอ้วน / Odds คนไม่อ้วนเลยครับ

Odds ratio = Odds (A) / Odds (B)

= (30/10) / (20/40)

= 6

Table7

เมื่อกลับข้างกันเรียบร้อยจะสังเกตได้ว่า มันก็คือการคูณไขว้แนวทแยง แล้วหารกันนั้นเอง!(30*40 / 20*10) ซึ่งหลายคนชอบใช้สูตรนี้ แต่ผมว่าจริงๆ ถ้าเข้าใจได้แบบที่เขียนไว้ก็ไม่น่ามีปัญหา

ถามว่าแปลผลอย่างไร จะบอกว่าแปลผลเป็นแบบเดียวกันกับ Relative Risk ได้เลยครับ คือคนอ้วนมีโอกาสกรนเป็น 6 เท่าของคนไม่อ้วน

จะเห็นได้ว่ามันค่ามันต่างจาก Relative Risk พอควร เพราะตัวอย่างที่ผมให้ดูนี้คนที่นอนกรนมันเย๊อะๆๆ ครับ ถ้าผมลองให้ตารางใหม่ดู จากตารางนี้ลองคิด RR และ OR ดูก่อนเฉลยนะครับ

Table8

เฉลย

Relative Risk = Risk (อ้วน) / Risk (ไม่อ้วน) = (10/510) / (5/605) = 2.37

Odds Ratio = Odds (อ้วน) / Odds (ไม่อ้วน) = (10/500) / (5/600) = 2.4

เห็นไหมครับ พอการนอนกรนเป็นสิ่งที่ไม่ค่อยมีคนเป็น (ภาษาระบาดเรียกว่า prevalence มันน้อย) แล้ว OR กับ RR เกือบเท่ากันเลย! การใช้ Odds Ratio นี้จึงนิยมในเหตุการณ์ที่เราไม่รู้ว่าจริงๆ แล้วในช่อง “ทั้งหมด” นั้นเป็นซักเท่าไหร่กันแน่ แต่เรารู้ว่าไอ้ช่อง ไม่เป็นโรคนั้นมันเยอะๆ เช่นการศึกษาแบบ Case Control เป็นต้นครับ

3. RCT,  Metaanalysis, Systemic review คืออะไร

อันนี้ต้องรู้เกี่ยวกับว่า งานวิจัยที่ทำแต่ละอย่างคืออะไรครับ การศึกษาทางระบาด แบ่งเป็นสองประเภทใหญ่ๆ คือ Observational study และ Experimental Study

  • Observation คือการศึกษาแบบที่ผู้วิจัยไม่ได้ไปวุ่นวายอะไรกับคนไข้เลย แค่ถามคำถามคนไข้ เก็บข้อมูล เก็บเลือด ฯลฯ จากคนไข้เท่านั้น
  • Experimental คือเป็นการศึกษาที่ผู้วิจัยลงไม้ลงมือ ให้ยาคนไข้กิน ทำการผ่าตัดกับคนไข้นั่นเองครับ

ซึ่งจริงๆ แล้ว Observational นั้นแบ่งอีกย่อยๆ เป็น Cross sectional, Cohort และ Case-Control แต่เดี่ยววันนี้จะมึนซะก่อน ผมขอตอบที่คำถามตรงๆ เลยดีกว่า

การศึกษาแบบ Experimental นั้นส่วนใหญ่หมายถึง Randomized Controlled Trial นั้นคือเป็น การศึกษา (Trial) ที่มีกลุ่มทดลองและกลุ่มควบคุม (Controlled) โดยที่การจัดกลุ่มผู้ถูกวิจัยนั้นเป็นไปในแบบสุ่ม (Randomized) นั่นเอง บางคนก็เลยเรียกย่อว่า RCT จริงๆ แล้วยังมี Trial ที่ไม่ได้มีกลุ่มควบคุม หรือไม่ได้ random อีกครับ

สำหรับบางครั้งแล้วการศึกษาในเรื่องเดียวกันก็อาจจะมีหลายๆ สถาบันเป็นคนทำ เช่นทำที่สหรัฐ ทำในไทย ทำที่ญี่ปุ่น ทีนี้ถ้าเป็นเรื่องเดียวกัน การเอามาสรุปรวมกันอย่างมีหลักการ เราจะเรียกการสรุปนี้ว่า “Systematic Review” ครับ (ที่น้องเขียนมานั้นไม่ถูกนะครับ ไม่มี systemic review มีแต่ systematic review ครับ)

เมื่อมีการมาสรุปรวมกันแล้วก็จะต้องมีการใช้หลักทางสถิติเพื่อรวมเจ้า Relative Risk หรือ Odds Ratio จากหลายๆ study มารวมกัน หลักการนี้เรียกว่า meta-analysis นั่นเองครับ

จะเห็นได้ว่างานวิจัยที่เป็นการรวมกันส่วนใหญ๋จะทำทั้งเอามารวมรวมอย่างเป็นระบบ (Systematic Review) และวิเคราะห์แบบ Meta-analysis ไปเลยครับ

มึนหรือยังครับ วันนี้เอาแค่นี้ก่อนละกันนะครับ ถ้าสงสัยกรุณา comment หรืออีเมลมาถามได้นะครับ ขอให้โชคดีครับ

02 มกราคม 2552

Box Plot

วันนี้ขอเสนอเรื่องแนวสถิติง่ายๆ บ้างละกันนะครับ บางท่านอาจทราบแล้ว แต่ผมเชื่อว่าอีกหลายท่านยังไม่ทราบ นั่นคือเรื่องเกี่ยวกับกราฟที่เรียกว่า Boxplot...

BoxPlot คืออะไร BoxPlot นั้นคือกราฟชนิดหนึ่ง คิดค้นขึ้นเมื่อปี 1977 โดยนักสถิติชาวอังกฤษชื่อ N A Sheldon

ถามว่ามันแตกต่างยังไงกับการพล็อตกราฟธรรมดาๆ คือกราฟธรรมดาสมมติว่าผมมีข้อมูลของระยะเวลาของคนที่เสียเวลาไปกับแชคผ่านอินเทอร์เน็ตใน 1 วันเป็นดังนี้

Table

หลายคนอาจจะไม่คิดอะไร แหม ง่ายๆ ก็เอามาพล็อตเป็นกราฟแท่ง หรือไม่ก็กราฟจุดๆ สิ ก็จะออกมาเป็นแบบนี้ครับ

graph

ถามว่าใช้ได้หรือไม่ ก็ต้องตอบว่าใช้ได้ แต่การแสดงกราฟแบบนี้ จะไม่บอกอะไรเราเลย คนดูแล้วก็จะเออ แต่ละคนใช้เวลาในเน็ตไปแบบนี้ๆ นะ ไม่รู้จะจับจุดอะไรจากกราฟนี้ดี เนื่องจากเราไม่ได้สรุปอะไรให้เขาเลย

การสรุปข้อมูลจากสิ่งที่เรามีอยู่ เราควรจะสรุปให้เขารู้อย่างน้อยๆ สองอย่าง ว่า

  1. ส่วนใหญ่คนที่เรามีอยู่น่ะมันอยู่ตรงไหนกัน อันนี้คงนึกออกว่ามันก็คือ "ค่ากลางของข้อมูล" ซึ่งอาจจะเป็น Mean หรือ Median ก็ได้ แต่ถ้าเราใช้ Mean มันจะไม่เหมาะสมสำหรับข้อมูลที่ไม่เบ้ ในขณะที่ถ้าเราใช้ Median มันจะใช้ได้ทั้งตอนที่เบ้ และตอนที่ไม่เบ้ (เพราะ Median มันเท่ากับ Mean ถ้าข้อมูลมันไม่เบ้)
  2. บอกว่าข้อมูลที่กระจายอออกไปจากตรงกลางนี้น่ะ มันกระจายออกไปด้านข้างซักประมาณไหนกัน (ศัพท์ทางสถิติเขาใช้คำว่า Dispersion ครับ) ซึ่งมีหลายวิธี เช่น บอกเป็น ค่าต่ำสุด-ค่าสูงสุด (พิสัยหรือ Range), บอกเป็น Standard Deviation

สำหรับ Box Plot นี้เราจะได้บอกทั้งสองอย่าง นอกจากนี้ยังบอกถึงค่าที่มันกระโดดจากกลุ่ม (ศัพท์สถิติเรียกว่า Outliers หรือพวกนอกคอก) ได้เป็นของแถมด้วยครับ เราลองมาดูกันเลยดีกว่าว่าถ้าผมเอาข้อมูลชุดดังกล่าวมาปรับปรุงเป็นแบบนี้ครับ

Boxplot

หลายคนอาจจะงง ว่ามันหมายถึงอะไร ลองดูวิธีการพล็อตของเขาก่อนนะครับ

  1. ก่อนอื่นเขาก็จะเอาข้อมูลทั้งหมดมาเรียงจากน้อยที่สุดไปหามากที่สุด
  2. ลากสี่เหลี่ยมตรงกลาง โดยให้จุดกลางของสี่เหลี่ยมนั้นคือ Median คือข้อมูลอันดับที่ 50 ของเรานั้นอยู่ตรงนั้นครับ
  3. ส่วนด้านบนและด้านล่างของสี่เหลี่ยมนั้นก็คือข้อมูลลำดับที่ 25 (25th percentile หรือถ้าแบ่งข้อมูลเป็นสี่ส่วนก็คือ 1st Quatile นั่นเอง) และ 75 (3rd Quatile) ตามลำดับ
  4. หลังจากลากรั้ว (fence) ที่เกิดขึ้นเพื่อจะบอกว่าข้อมูลไหนจะอยู่ในคอกหรือนอกคอก โดยรั้วที่เกิดขึ้นนั้นไม่ใช่เส้นขีดๆ ที่อยู่ในกราฟตอนสุดท้ายนะครับ แต่เป็นรั้วที่มองไม่เห็น ซึ่งลากขึ้นเหนือจาก Q3 เป็นความยาว = 1.5 เท่าของ Q3-Q1
  5. จากนั้นให้ลากหนวด (whisker) จากสี่เหลี่ยมไปหาจุดที่มากที่สุดที่ยังอยู่ในรั้ว
  6. ทำเช่นเดียวกันกับจุดที่น้อยที่สุดที่ยังอยู่ในรั้ว
  7. จุดนอกรั้วก็ปล่อยไว้ตามเดิม

เราสามารถสรุปได้คร่าวๆ ตามนี้ครับ:

Boxplotanalyse

ก็ลองแปลความหมายกันดูนะครับ บางคนเพื่อให้เข้าใจง่ายก็อาจจะเหมือนเรามอง Histogram จากด้านบนก็เป็นไปได้

comparewithhistogram

ถ้ายังสงสัยอะไร ลองไปอ่านเพิ่มเติมได้ที่ Wikipedia หัวข้อ Box Plot นะครับมีเขียนไว้ละเอียดดี