Basic Data Science : Odds ratio

Odds คือ numerical expression นิยมเขียนในรูปของ pair of numbers [2]
Odds ratio (OR) [1] คือสัดส่วนระหว่าง Odds ของเหตุการณ์ที่เกิดในตัวอย่างสองกลุ่มที่อยู่ประชากรเดียวกัน  เช่น การเป็นคนดื่มไวน์ของหญิงกับชายในเมืองเดียวกัน

\( \large OR = \frac{probability of presence of a character}{probability of abesence of a character}\)


\( \large OR  = \frac{p}{1-p} \dashrightarrow(3) \) 


\(\large logit(p) = \ln (\frac{p}{1-p}) \dashrightarrow(4) \)

where \( \large p \) is probability of "success"

การคำนวณ


Outcome status
DiseasedHealthy
Exposure statusExposedDEHE
Not nexposedDNHN

\( \large OR = \frac{\frac{D_E}{H_E}}{\frac{D_N}{H_N}} \)
หรือ
\( \large OR = \frac{D_E \times H_N}{H_E \times D_N} \)
หรือ
\( \large OR = \frac{D_E}{D_N}\frac{H_N}{H_E} = \frac{\frac{D_E}{D_N}}{\frac{H_E}{H_N}} \)


ตัวอย่าง ตัวอย่างชาย 100 คน หญิงจำนวน 100 คน มีชายที่ดื่มไวน์ 90 คน ไม่ดื่ม 10 คน ส่วนผู้หญิงดื่มไวน์ 20 คน ไม่ดื่ม 80 คน

ชายหญิง
ดื่มไวน์9020
ไม่ดื่มไวน์1080

\( \large OR = \frac{ \frac{90}{10}}{ \frac{20}{80}} = 36\)

ค่า OR บอกว่าถ้าคนหนึ่งคนเป็นผู้ชายแล้วมีโอกาสที่คนนั้นจะดื่มไวน์จะมากเป็น 36 เท่าถ้าคนนั้นเป็นหญิง ในขณะที่ถ้าเทียบสัดส่วนแล้วจะได้ตัวเลขน้อยกว่านี้มาก เช่น \( \large \frac{\frac{90}{100} }{\frac{20}{100}} = 4.5 \) เอง ซึ่งแสดงถึงความไวของ OR ด้วยเหตุนี้จึงนิยมใช้ค่า natural logarithm \( \ln(OR) \) แทน (\( \ln(36) = 3.5  \))






เอกสารอ้างอิง
[1] https://en.wikipedia.org/wiki/Odds_ratio
[2] https://en.wikipedia.org/wiki/Odds




ความคิดเห็น