Probability : Discrete Random Variable

Recap:

Random variable คือ function \( X \) ที่โยงจากเซตของ sample space (S) ไปยังเซตของจำนวนจริง \( \Re \)

\[ X: S \rightarrow \Re \]


The probability distribution


เนื้อหาในส่วนนี้จะกล่าวถึง Probability Distribution ซึ่งเป็นเรื่องสำคัญเรื่องหนึ่งที่โยงกับ random variable พิจารณาตัวอย่างต่อไปนี้


สมมุติบริษัท ABC ทำการสุ่มตรวจวัสถุดิบที่กำลังจะซื้อเพื่อตรวจสอบ ผลการตรวจจะมี 2 ทางคือ ผ่าน (P) กับ ไม่ผ่าน (F) ในการตรวจสอบ ใช้การสุ่มเลือกวัตถุดิบออกมา 100 ชิ้น แบ่งเป็น 10 ชุด (batches) ชุดละ 10 ชิ้น และทำการตรวจสอบทุกชิ้น ได้ผลดังตาราง


Batches 1 2 3 4 5 6 7 8 9 10
Number of defective 0 0 1 0 2 2 1 3 2 0

ให้ \(X\) แทนจำนวน defectives ที่พบได้ในแต่ละ batch จะได้ X คือ random variable ที่มีค่าที่เป็นไปได้คือ \( \{ 0,1,2,3 \} \) เมื่อทำการแจกแจงความถี่ของ X จะได้


Xfrequency
04
12
23
31
รวม10

กำหนดให้ \( p(0) \) คือ ความน่าจะเป็นของ X เมื่อ X มีค่าเท่ากับ 0 คำนวณค่าของ \( p(0) = p(\text{X มีค่าเป็น 0}) = \frac{4}{10} = 0.4 \)

ทำนองเดียวกัน เราจะได้ \[ \begin{align*} p(1) &= \frac{2}{10} = 0.2 \\ p(2) &= \frac{3}{10} = 0.3 \\ p(3) &= \frac{1}{10} = 0.1 \\ \end{align*} \]


สามารถเขียน \(p(x) \) อีกรูปแบบคือ \( P(X =x) \) เช่น

\(p(0) \text{ เขียนเป็น } P(X =0)\)

\(p(10) \text{ เขียนเป็น } P(X = 10)\)


ที่ \(p(0) = 0.4 \) หมายถึง ความค่าจะเป็นหรือโอกาสที่ X จะมีค่าเป็น 0 คือ 0.4 หรือ 0.4 จะถูกแจก (distributed) ให้กับ \(X\) เมื่อ \(X = 0\)


สิ่งที่คำนวณได้ทำให้เราทราบค่าความน่าจะเป็นของ \(X\) เมื่อค่าเปลี่ยนไป เรียกว่า Probability Distribution หรืออีกความหมายหนึ่ง probability distribution ทำหน้าที่เป็นฟังก์ชั่นที่มี domain เป็นเซตของค่า random variable และ range คือเซตของจำนวนจริงที่อยู่ระหว่าง 0.0 - 1.0 ดังนั้น probability distribution อาจถูกเรียกว่า probability mass function (PMF) ก็ได้


Probability distribution อาจเรียกเป็น Probability Mass Function (PMF)


ลองนำเอาตัวเลข probability distribution ของ \( X \) มา plot กราฟดูจะได้ดังรูปที่ 1 จะเห็นว่ามีรูปแบบที่ไม่ต่อเนื่อง เรียก distribution แบบนี้ว่า discrete probability distribution หากพิจารณาดูจากค่าของ random variable \(X\)ก็มีลักษณะเป็นเลขโดด ไม่ต่อเนื่อง เช่นกัน ทำนองเดียวกันหาก \(X\) มีลักษณะเป็นแบบต่อเนื่อง continuous random variable การแจกแจงก็จะออกมาเป็นแบบ continuous ด้วยเช่นกัน


รูปที่ 1

ผลรวมของค่าความน่าจะเป็นใน probability distribution มีค่าเป็น 1.0



Cumulative distribution function (CDF)

Cumulative distribution function เป็นวิธีการพรรณาถึง probability distribution เหมือนกับ PMF ต่างกันตรงที่ CDF ใช้ค่าความน่าจะเป็นสะสมของค่าที่เป็นช่วงของ \(X\)


Cumulative distribution function (CDF) ของ random variable \(X \)

\[ F(X) = P(X \leqslant x) = \sum_{k \leqslant x}p(k) \]

ตัวอย่าง ให้ \(X \) เป็น discrete random variable ที่มี PMF เป็นดังนี้

\[ p(x) = \begin{cases} 0.1, & x = 2 \\ 0.2,& x =4 \\ 0.3,& x =5 \\ 0.2,& x =8 \\ 0.1,& x =10 \\ 0, & \text{ otherwise} \end{cases} \]

a) หา \(P( X \leqslant 5 ) \)

ปัญหานี้เป็นการหาความน่าจะเป็นรวมเมื่อค่าของ \( X \leqslant 5 \) (หรือมีค่าเป็น 2,4และ 5) ซึ่งมีค่าเป็น \(0.1+0.2+0.3 = 0.6 \)


b) หา \(P( 1.5 < X < 7.5 ) \)

ปัญหานี้เป็นการหาความน่าจะเป็นรวมเมื่อค่าของ \( X \) อยู่ระหว่าง 1.5 กับ 7.5 ซึ่งมีค่าเป็น \(0.1+0.2+0.3 = 0.6 \)



The expectation value (mean value)


สมมุติว่าในสถาบันการศึกษาแห่งหนึ่ง มีการสำรวจ โดยให้ \( X \) เป็น random variable แทนจำนวนวิชาที่นักศึกษาแต่ละคนได้ลงทะเบียนเรียน ได้ผลการสำรวจดังนี้

X1234567รวม
จำนวนนักศึกษา1504501,9503,7505,8502,55030015,000
\( p(x) \)0.010.030.130.250.390.170.021.0

ถ้าต้องการทราบค่าของจำนวนวิชาที่ลงทะเบียนต่อนักศึกษา (จำนวนวิชาที่นึกศึกษาลงทะเบียนโดยเฉลี่ย) ต้องหาให้ได้ว่ามีจำนวนวิชาที่ถูกนักศึกษาลงทะเบียนมีทั้งหมดกี่วิชาแล้วนำมาหารด้วยจำนวนนักศึกษาที่ใช้สำรวจครั้งนี้ ดังนี้

\[ \begin{align*} \text{จำนวนวิชาต่อนักศึกษา} &= \frac{(1 \times 150) + (2 \times 450) + (3 \times 1950) + (4 \times 3750) + (5 \times 5850) +(6 \times 2550 ) + (7 \times 300)}{15000} \\ \\ &= \frac{1 \times 150}{15000} + \frac{2 \times 450}{15000} +\frac{3 \times 1950}{15000}+\frac{4 \times 3750}{15000}+\frac{5 \times 5850}{15000}+\frac{6 \times 2550}{15000} + \frac{7 \times 300}{15000} \tag{1.0}\\ \end{align*} \]

จาก (1) ขอให้สังเกตุว่า \( \frac{150}{15000}, \frac{450}{15000} ,\frac{1950}{15000},\frac{3750}{15000},\frac{5850}{15000},\frac{2550}{15000} , \frac{ 300}{15000}\) คือการหา probability หรือ \( p(x) \) และ 1,2,3,4,5,6,7 คือค่าของ random variable \(X\) ดังนั้นเราจึงสามารถเขียน (1.0) ใหม่ได้เป็น


\[ \begin{align*} \text{จำนวนวิชาต่อนักศึกษา} &= (1 \times p(1)) + (2 \times p(2)) +(3 \times p(3))+(4 \times p(4))+(5 \times p(5))+(6 \times p(6)) + (7 \times p(7)) \tag{1.1}\\ &= (1 \times 0.01) + (2 \times 0.03) +(3 \times 0.13)+(4 \times 0.25)+(5 \times 0.39)+(6 \times 0.17) + (7 \times 0.02) \tag{1.2}\\ \end{align*} \]

จาก (1.1) นำไปสู่ข้อสรุปว่าการคำนวณหาค่าเฉลี่ยของ random variable เมื่อทราบ probability distribution สามารถหาได้จาก


\[ E(X) = \sum_{ x \in D} {x} p(x) \tag{2.0} \]

เมื่อ

D คือเซตของค่าที่เป็นไปได้ของ random variable X

\( E(X) \) คือค่าฉลี่ย (expectation value) ของ random variable \( X \)

\( x \) คือ ค่าของ random variable \( X \)

\(p(x) \) คือ probability ของ \(x \)


\( E(X) \) สามารถเขียนแทนด้วย \( \mu \)


ตัวอย่าง ทารกแรกคลอดจะมีการประเมินสภาพเรียกว่า Apgar scale (score) ผลการประเมินจะถูกเทียบเป็นตัวเลข 0,1,2,3,...,10 ถ้าในการทดลองครั้งหนึ่ง สุ่มเลือก Apgar scale จากทารกกลุ่มหนึ่ง ถ้าให้ random variable \(X\) แทน Apgar scale ได้ proability distribution ดังตาราง


Apgar scale (X)012345678910
\( p(x) \)0.0020.0010.0020.0050.020.040.180.370.250.120.01

ค่า expectation value ของ Apgar scale หาได้จาก

\[ \begin{align*} E(X) &= \sum {x} p(x) \\ &= 0 \times 0.002 + 1 \times 0.001 + 2 \times 0.002 + 3 \times 0.005 + 4 \times 0.02 + 5 \times 0.04 + 6 \times 0.18 + 7 \times 0.37 + 8 \times 0.25 + 9 \times 0.12 + 10 \times 0.01 \\ &=7.15 \end{align*} \]

เพื่อให้เข้าใจเรื่องค่า expectation ง่ายขึ้น ลองจินตนาการถึงการพยายามเลี้ยง (balancing) แท่งไม้ด้วยนิ้วมือ จุดที่ท่อนไม้อยู่นิ่งโดยไม่ตกนั่นคือจุดที่เรียกว่า center of gravity ซึ่งอาจจะไม่ใช่ตำแหน่งตรงกลางของแท่งไม้ก็ได้ ขึ้นกับการกระจายตัว (distribution)ของน้ำหนักตลอดแท่งไม้นั้น ค่า expectation ทำหน้าที่เหมือนกับ center of gravity ทำให้น้ำหนักทั้งสองข้างมีค่าเท่ากัน


The variance


พิจารณา PMF ของ random variable X,Y

\[ \begin{align*} P(X) &= \begin{cases} 0.20,& x = -100\\ 0.30,& x = -10 \\ 0.30,& x = 10\\ 0.20,& x = 100\\ \end{cases} \\\\ P(Y) &= \begin{cases} 1.0,& y = 0\\ 0.0,& otherwise \\ \end{cases} \\ \end{align*} \]

คำนวณหาค่า expectation ของทั้ง \(X,Y\) จะมีค่าเท่ากันคือ 0.0 แต่หากสังเกตุดูจะพบว่าค่าที่เป็นไปได้ของ \(X\) มีการกระจายตัวมากกว่า \(Y\) แม้จะมีค่า expectation เท่ากันก็ตาม หมายความว่าค่า expectation ไม่สามารถบอกถึงลักษณะของการกระจายตัวของค่าที่เป็นไปได้ของ random variable ซึ่งทำให้เห็นภาพความต่างระหว่าง \( X \) กับ \( Y \) ได้ จึงต้องมีค่าสถิติอีกตัวเพื่อใช้บอกคุณสมบัติดังกล่าวเรียกว่า variance


ค่า variance ของ random variable \( X \) ที่มีค่า expectation \( \mu \) คือ

\[ \begin{align*} \sigma^2 = Var(X) &= E[(X - \mu)^2] \tag{3.0} \\\\ \sigma^2 = Var(X) &= \sum_{i=1}^n(x_i - \mu)^2p(x_i) \tag{3.1} \\\\ \end{align*} \]

บางครั้งจะพบการคำนวณหาค่า variance จากสูตรข้างล่าง ซึ่งจะใช้ในกรณีที่ไม่ทราบ PMF แต่ทราบค่าของ \( X \)

\[ \sigma^2 = \frac{\sum_{i=1}^n(x_i - \bar{x})}{N} \]

จากนิยาม 3.0,3.1 จะเห็นว่า variance คือค่า expectation หรือค่าเฉลี่ยของ \( (X - \mu)^2 \) และค่า \( (X - \mu) \) ก็คือระยะทางระหว่างค่าของ \( X \) กับ \( \mu \) ดังนั้น อาจกล่าวได้ว่า variance คือ ค่าเฉลี่ยของกำลังสองของระยะทางระหว่าง \(X\) กับ \( \mu \) อธิบายว่าทำไม variance จึงบอกถึงการกระจายตัวของ \( X\) ได้


Variance คือ ค่าเฉลี่ยของกำลังสองของระยะทางระหว่าง \(X\) กับ \( \mu \)


กลับไปคำนวณค่า variance ของ \(X,Y \)

\[ \begin{align*} Var(X) &= (-100 - 0)^2 (0.2) + (-10 - 0)^2 (0.3) + (10 - 0)^2 (0.3) + (100 - 0)^2 (0.2) \\ Var(X) &= 4060 \\\\ Var(Y) &= 0 \end{align*} \]

ค่า variance บอกเราว่า random variable \( X \) มีการกระจายตัวมากกว่า random variable \( Y \) (Var(Y) มีค่าเป็น 0 เพราะค่าของ y จะมีเพียงค่าเดียวคือ 0 ดังนั้นจะไม่มีการกระจายตัว)


ค่าของ variance มักเป็นตัวเลขที่สูง ดังนั้นจึงมีการใช้ค่าสถิติอีกค่าหนึ่งคือ standard deviation (SD) โดยที่

\[ SD = \sqrt{\sigma^2} \]

ตัวอย่าง discrete random variable ที่มีความสำคัญ


The Bernoulli random variable


กลับไปดูตัวอย่างกรณีบริษัท ABC อีกครั้ง ก่อนหน้านี้ \( \{0,1,2,3 \} \) คือค่าของ random variable หากนิยาม random variable ใหม่เป็นว่า ถ้าตรวจสอบแล้วพบว่าวัตถุดิบชิ้นใดไม่ผ่าน ค่าของ random variable จะเป็น 0 หากผ่านจะมีค่าเป็น 1 ค่าที่เป็นไปได้ของ random variable จะมีได้เพียง 2 ค่าคือ \( \{ 0,1 \} \) เรียก random variable แบบนี้ว่า Bernoulli random variable

\[ Y = \begin{cases} 0, & \text{ if fail} \\ 1, & \text{ if pass} \end{cases} \]

การหา PMF : กำหนดให้ \( p \) เป็นค่าความน่าจะเป็นเมื่อ \( Y = 1 \) ตาม Complement rule แล้วจะได้ \( 1- p \) คือค่าความน่าจะเป็นเมื่อ \( Y = 0 \)

\[ p(y) = P(Y = y) = \begin{cases} p , &\text{when y = 1} \\ 1 - p, &\text{when y = 0} \end{cases} \]

ข้อมูลจากบริษัท ABC ทราบว่ามี defectives จำนวน 10 ชิ้น จากจำนวนที่นำมาทดสอบทั้งหมด 100 ชิ้น ดังนั้นที่เหลือ 90 ชิ้นเป็นชิ้นที่ใช้ได้ คำนวณ PMF ของผลการทดสอบในกรณีใช้ Bernoulli random variable จะได้

\[ p(y) = \begin{cases} 0.9 , &\text{ผ่านการทดสอบ} \\ 0.1, &\text{ไม่ผ่านการทดสอบ} \end{cases} \]

Bernoulli randomvariable เป็น discrete random variable ที่มีความสำคัญพบได้บ่อย เช่น

 ♦ การวินิจฉัยโรคว่า "ป่วย" หรือ "ไม่ป่วย" ภายใต้อาการที่ตรวจพบ

 ♦ การทำประชาวิจารณ์ว่า "รับ" หรือ "ไม่รับ"

 ♦ การสำรวจข่ายงานจราจร "ว่าง" หรือ "ไม่ว่าง"

 ♦ ฯลฯ


Bernoulli random variable มีค่าได้เพียง \( \{0,1 \} \) มี PMF เป็น \[ p(y) = P(Y = y) = \begin{cases} p , &\text{when y = 1} \\ 1 - p, &\text{when y = 0} \end{cases} \]


ตัวอย่าง การตรวจสอบเครื่องจักร ถ้ากำหนดให้ X จะมีค่าเป็น 0 เมื่อพบว่าอะหลั่ยของเครื่องจักรต้องการการซ่อมบำรุง ในทางตรงข้ามมีค่าเป็น 1 ในกรณีนี้ X คือ Bernoulli random variable ถ้ากำหนดให้ \( P(X = 1) = p \) จะได้ \( P(X = 0) = 1-p \) การคำนวณหา expectation value ของ random variable X จะได้

\[ \begin{align*} E(X) &= (1) p + (0)(1-p) \\ &= p + 0 \\ &= p \end{align*} \]

นั่นคือ expectation value ของ Bernoulli random varible มีค่าเป็น \( p \)


Expectation value of Bernoulli random variable มีค่าเป็น p ( \(P(X = 1) \))



The Binomial random variable


เป็น discrete random variable ที่มีลักษณะพิเศษดังนี้


 1. มีการกำหนดจำนวน trial ที่แน่นอน (sample size คงที่)

 2. event ที่สนใจมีสถานะได้ 2 สถานะคือ "เกิด" หรือ "ไม่เกิด"

 3. ค่าความน่าจะเป็นของการ "เกิด" หรือ "ไม่เกิด" มีค่าคงที่เท่ากันทุก trial

 4. แต่ละ trial เป็นอิสระต่อกัน


PMF หาได้จากสูตร


\[ p(k) = P(X=k) = \frac{n!}{k!(n-k)!}p^k (1-p)^{n-k}, k = 0,1,2,3,..,n \]

n คือ จำนวน trail และ p คือ probability ของ event ที่สนใจ


ตัวอย่างเช่น การตอบคำถามที่ให้เลือกตอบ "ถูก" หรือ "ผิด" จำนวน 50 ข้อ แบบเดาสุ่ม ให้ X คือ random variable แทนจำนวนข้อที่ใช้คำตอบ "ถูก"

 1. มีจำนวน trial คือ 50

 2. ค่าความน่าจะเป็นของการตอบ "ถูก" หรือ "ผิด" มีค่าเท่ากันทุกข้อคือ 0.5

 3. การตอบแต่ละคำถามเป็นอิสระต่อกัน


ถ้าให้ n คือจำนวน trial (จำนวนคำถาม) จะได้ n = 50

ถ้าให้ p คือ probability ของการเกิดขึ้นคำตอบ "ถูก" ของแต่ละข้อ ได้ \( p = 0.5 \)

จะได้ PMF คือ

\[ \begin{align*} p(0) &= \frac{50!}{0!(50-0)!}(0.5)^0 (0.5)^{50-0} \\ p(1) &= \frac{50!}{1!(50-1)!}(0.5)^1 (0.5)^{50-1} \\ p(2) &= \frac{50!}{2!(50-2)!}(0.5)^2 (0.5)^{50-2} \\ ... \\ p(50) &= \frac{50!}{50!(50-50)!}(0.5)^{50} (0.5)^{50-50} \\ \end{align*} \]

ความคิดเห็น