Probability : Discrete Random Variable

Recap:

Random variable คือ function X ที่โยงจากเซตของ sample space (S) ไปยังเซตของจำนวนจริง

X:S


The probability distribution


เนื้อหาในส่วนนี้จะกล่าวถึง Probability Distribution ซึ่งเป็นเรื่องสำคัญเรื่องหนึ่งที่โยงกับ random variable พิจารณาตัวอย่างต่อไปนี้


สมมุติบริษัท ABC ทำการสุ่มตรวจวัสถุดิบที่กำลังจะซื้อเพื่อตรวจสอบ ผลการตรวจจะมี 2 ทางคือ ผ่าน (P) กับ ไม่ผ่าน (F) ในการตรวจสอบ ใช้การสุ่มเลือกวัตถุดิบออกมา 100 ชิ้น แบ่งเป็น 10 ชุด (batches) ชุดละ 10 ชิ้น และทำการตรวจสอบทุกชิ้น ได้ผลดังตาราง


Batches 1 2 3 4 5 6 7 8 9 10
Number of defective 0 0 1 0 2 2 1 3 2 0

ให้ X แทนจำนวน defectives ที่พบได้ในแต่ละ batch จะได้ X คือ random variable ที่มีค่าที่เป็นไปได้คือ {0,1,2,3} เมื่อทำการแจกแจงความถี่ของ X จะได้


Xfrequency
04
12
23
31
รวม10

กำหนดให้ p(0) คือ ความน่าจะเป็นของ X เมื่อ X มีค่าเท่ากับ 0 คำนวณค่าของ p(0)=p(X มีค่าเป็น 0)=410=0.4

ทำนองเดียวกัน เราจะได้ p(1)=210=0.2p(2)=310=0.3p(3)=110=0.1


สามารถเขียน p(x) อีกรูปแบบคือ P(X=x) เช่น

p(0) เขียนเป็น P(X=0)

p(10) เขียนเป็น P(X=10)


ที่ p(0)=0.4 หมายถึง ความค่าจะเป็นหรือโอกาสที่ X จะมีค่าเป็น 0 คือ 0.4 หรือ 0.4 จะถูกแจก (distributed) ให้กับ X เมื่อ X=0


สิ่งที่คำนวณได้ทำให้เราทราบค่าความน่าจะเป็นของ X เมื่อค่าเปลี่ยนไป เรียกว่า Probability Distribution หรืออีกความหมายหนึ่ง probability distribution ทำหน้าที่เป็นฟังก์ชั่นที่มี domain เป็นเซตของค่า random variable และ range คือเซตของจำนวนจริงที่อยู่ระหว่าง 0.0 - 1.0 ดังนั้น probability distribution อาจถูกเรียกว่า probability mass function (PMF) ก็ได้


Probability distribution อาจเรียกเป็น Probability Mass Function (PMF)


ลองนำเอาตัวเลข probability distribution ของ X มา plot กราฟดูจะได้ดังรูปที่ 1 จะเห็นว่ามีรูปแบบที่ไม่ต่อเนื่อง เรียก distribution แบบนี้ว่า discrete probability distribution หากพิจารณาดูจากค่าของ random variable Xก็มีลักษณะเป็นเลขโดด ไม่ต่อเนื่อง เช่นกัน ทำนองเดียวกันหาก X มีลักษณะเป็นแบบต่อเนื่อง continuous random variable การแจกแจงก็จะออกมาเป็นแบบ continuous ด้วยเช่นกัน


รูปที่ 1

ผลรวมของค่าความน่าจะเป็นใน probability distribution มีค่าเป็น 1.0



Cumulative distribution function (CDF)

Cumulative distribution function เป็นวิธีการพรรณาถึง probability distribution เหมือนกับ PMF ต่างกันตรงที่ CDF ใช้ค่าความน่าจะเป็นสะสมของค่าที่เป็นช่วงของ X


Cumulative distribution function (CDF) ของ random variable X

F(X)=P(Xx)=kxp(k)

ตัวอย่าง ให้ X เป็น discrete random variable ที่มี PMF เป็นดังนี้

p(x)={0.1,x=20.2,x=40.3,x=50.2,x=80.1,x=100, otherwise

a) หา P(X5)

ปัญหานี้เป็นการหาความน่าจะเป็นรวมเมื่อค่าของ X5 (หรือมีค่าเป็น 2,4และ 5) ซึ่งมีค่าเป็น 0.1+0.2+0.3=0.6


b) หา P(1.5<X<7.5)

ปัญหานี้เป็นการหาความน่าจะเป็นรวมเมื่อค่าของ X อยู่ระหว่าง 1.5 กับ 7.5 ซึ่งมีค่าเป็น 0.1+0.2+0.3=0.6



The expectation value (mean value)


สมมุติว่าในสถาบันการศึกษาแห่งหนึ่ง มีการสำรวจ โดยให้ X เป็น random variable แทนจำนวนวิชาที่นักศึกษาแต่ละคนได้ลงทะเบียนเรียน ได้ผลการสำรวจดังนี้

X1234567รวม
จำนวนนักศึกษา1504501,9503,7505,8502,55030015,000
p(x)0.010.030.130.250.390.170.021.0

ถ้าต้องการทราบค่าของจำนวนวิชาที่ลงทะเบียนต่อนักศึกษา (จำนวนวิชาที่นึกศึกษาลงทะเบียนโดยเฉลี่ย) ต้องหาให้ได้ว่ามีจำนวนวิชาที่ถูกนักศึกษาลงทะเบียนมีทั้งหมดกี่วิชาแล้วนำมาหารด้วยจำนวนนักศึกษาที่ใช้สำรวจครั้งนี้ ดังนี้

จำนวนวิชาต่อนักศึกษา=(1×150)+(2×450)+(3×1950)+(4×3750)+(5×5850)+(6×2550)+(7×300)15000(1.0)=1×15015000+2×45015000+3×195015000+4×375015000+5×585015000+6×255015000+7×30015000

จาก (1) ขอให้สังเกตุว่า 15015000,45015000,195015000,375015000,585015000,255015000,30015000 คือการหา probability หรือ p(x) และ 1,2,3,4,5,6,7 คือค่าของ random variable X ดังนั้นเราจึงสามารถเขียน (1.0) ใหม่ได้เป็น


(1.1)จำนวนวิชาต่อนักศึกษา=(1×p(1))+(2×p(2))+(3×p(3))+(4×p(4))+(5×p(5))+(6×p(6))+(7×p(7))(1.2)=(1×0.01)+(2×0.03)+(3×0.13)+(4×0.25)+(5×0.39)+(6×0.17)+(7×0.02)

จาก (1.1) นำไปสู่ข้อสรุปว่าการคำนวณหาค่าเฉลี่ยของ random variable เมื่อทราบ probability distribution สามารถหาได้จาก


(2.0)E(X)=xDxp(x)

เมื่อ

D คือเซตของค่าที่เป็นไปได้ของ random variable X

E(X) คือค่าฉลี่ย (expectation value) ของ random variable X

x คือ ค่าของ random variable X

p(x) คือ probability ของ x


E(X) สามารถเขียนแทนด้วย μ


ตัวอย่าง ทารกแรกคลอดจะมีการประเมินสภาพเรียกว่า Apgar scale (score) ผลการประเมินจะถูกเทียบเป็นตัวเลข 0,1,2,3,...,10 ถ้าในการทดลองครั้งหนึ่ง สุ่มเลือก Apgar scale จากทารกกลุ่มหนึ่ง ถ้าให้ random variable X แทน Apgar scale ได้ proability distribution ดังตาราง


Apgar scale (X)012345678910
p(x)0.0020.0010.0020.0050.020.040.180.370.250.120.01

ค่า expectation value ของ Apgar scale หาได้จาก

E(X)=xp(x)=0×0.002+1×0.001+2×0.002+3×0.005+4×0.02+5×0.04+6×0.18+7×0.37+8×0.25+9×0.12+10×0.01=7.15

เพื่อให้เข้าใจเรื่องค่า expectation ง่ายขึ้น ลองจินตนาการถึงการพยายามเลี้ยง (balancing) แท่งไม้ด้วยนิ้วมือ จุดที่ท่อนไม้อยู่นิ่งโดยไม่ตกนั่นคือจุดที่เรียกว่า center of gravity ซึ่งอาจจะไม่ใช่ตำแหน่งตรงกลางของแท่งไม้ก็ได้ ขึ้นกับการกระจายตัว (distribution)ของน้ำหนักตลอดแท่งไม้นั้น ค่า expectation ทำหน้าที่เหมือนกับ center of gravity ทำให้น้ำหนักทั้งสองข้างมีค่าเท่ากัน


The variance


พิจารณา PMF ของ random variable X,Y

P(X)={0.20,x=1000.30,x=100.30,x=100.20,x=100P(Y)={1.0,y=00.0,otherwise

คำนวณหาค่า expectation ของทั้ง X,Y จะมีค่าเท่ากันคือ 0.0 แต่หากสังเกตุดูจะพบว่าค่าที่เป็นไปได้ของ X มีการกระจายตัวมากกว่า Y แม้จะมีค่า expectation เท่ากันก็ตาม หมายความว่าค่า expectation ไม่สามารถบอกถึงลักษณะของการกระจายตัวของค่าที่เป็นไปได้ของ random variable ซึ่งทำให้เห็นภาพความต่างระหว่าง X กับ Y ได้ จึงต้องมีค่าสถิติอีกตัวเพื่อใช้บอกคุณสมบัติดังกล่าวเรียกว่า variance


ค่า variance ของ random variable X ที่มีค่า expectation μ คือ

(3.0)σ2=Var(X)=E[(Xμ)2](3.1)σ2=Var(X)=i=1n(xiμ)2p(xi)

บางครั้งจะพบการคำนวณหาค่า variance จากสูตรข้างล่าง ซึ่งจะใช้ในกรณีที่ไม่ทราบ PMF แต่ทราบค่าของ X

σ2=i=1n(xix¯)N

จากนิยาม 3.0,3.1 จะเห็นว่า variance คือค่า expectation หรือค่าเฉลี่ยของ (Xμ)2 และค่า (Xμ) ก็คือระยะทางระหว่างค่าของ X กับ μ ดังนั้น อาจกล่าวได้ว่า variance คือ ค่าเฉลี่ยของกำลังสองของระยะทางระหว่าง X กับ μ อธิบายว่าทำไม variance จึงบอกถึงการกระจายตัวของ X ได้


Variance คือ ค่าเฉลี่ยของกำลังสองของระยะทางระหว่าง X กับ μ


กลับไปคำนวณค่า variance ของ X,Y

Var(X)=(1000)2(0.2)+(100)2(0.3)+(100)2(0.3)+(1000)2(0.2)Var(X)=4060Var(Y)=0

ค่า variance บอกเราว่า random variable X มีการกระจายตัวมากกว่า random variable Y (Var(Y) มีค่าเป็น 0 เพราะค่าของ y จะมีเพียงค่าเดียวคือ 0 ดังนั้นจะไม่มีการกระจายตัว)


ค่าของ variance มักเป็นตัวเลขที่สูง ดังนั้นจึงมีการใช้ค่าสถิติอีกค่าหนึ่งคือ standard deviation (SD) โดยที่

SD=σ2

ตัวอย่าง discrete random variable ที่มีความสำคัญ


The Bernoulli random variable


กลับไปดูตัวอย่างกรณีบริษัท ABC อีกครั้ง ก่อนหน้านี้ {0,1,2,3} คือค่าของ random variable หากนิยาม random variable ใหม่เป็นว่า ถ้าตรวจสอบแล้วพบว่าวัตถุดิบชิ้นใดไม่ผ่าน ค่าของ random variable จะเป็น 0 หากผ่านจะมีค่าเป็น 1 ค่าที่เป็นไปได้ของ random variable จะมีได้เพียง 2 ค่าคือ {0,1} เรียก random variable แบบนี้ว่า Bernoulli random variable

Y={0, if fail1, if pass

การหา PMF : กำหนดให้ p เป็นค่าความน่าจะเป็นเมื่อ Y=1 ตาม Complement rule แล้วจะได้ 1p คือค่าความน่าจะเป็นเมื่อ Y=0

p(y)=P(Y=y)={p,when y = 11p,when y = 0

ข้อมูลจากบริษัท ABC ทราบว่ามี defectives จำนวน 10 ชิ้น จากจำนวนที่นำมาทดสอบทั้งหมด 100 ชิ้น ดังนั้นที่เหลือ 90 ชิ้นเป็นชิ้นที่ใช้ได้ คำนวณ PMF ของผลการทดสอบในกรณีใช้ Bernoulli random variable จะได้

p(y)={0.9,ผ่านการทดสอบ0.1,ไม่ผ่านการทดสอบ

Bernoulli randomvariable เป็น discrete random variable ที่มีความสำคัญพบได้บ่อย เช่น

 ♦ การวินิจฉัยโรคว่า "ป่วย" หรือ "ไม่ป่วย" ภายใต้อาการที่ตรวจพบ

 ♦ การทำประชาวิจารณ์ว่า "รับ" หรือ "ไม่รับ"

 ♦ การสำรวจข่ายงานจราจร "ว่าง" หรือ "ไม่ว่าง"

 ♦ ฯลฯ


Bernoulli random variable มีค่าได้เพียง {0,1} มี PMF เป็น p(y)=P(Y=y)={p,when y = 11p,when y = 0


ตัวอย่าง การตรวจสอบเครื่องจักร ถ้ากำหนดให้ X จะมีค่าเป็น 0 เมื่อพบว่าอะหลั่ยของเครื่องจักรต้องการการซ่อมบำรุง ในทางตรงข้ามมีค่าเป็น 1 ในกรณีนี้ X คือ Bernoulli random variable ถ้ากำหนดให้ P(X=1)=p จะได้ P(X=0)=1p การคำนวณหา expectation value ของ random variable X จะได้

E(X)=(1)p+(0)(1p)=p+0=p

นั่นคือ expectation value ของ Bernoulli random varible มีค่าเป็น p


Expectation value of Bernoulli random variable มีค่าเป็น p ( P(X=1))



The Binomial random variable


เป็น discrete random variable ที่มีลักษณะพิเศษดังนี้


 1. มีการกำหนดจำนวน trial ที่แน่นอน (sample size คงที่)

 2. event ที่สนใจมีสถานะได้ 2 สถานะคือ "เกิด" หรือ "ไม่เกิด"

 3. ค่าความน่าจะเป็นของการ "เกิด" หรือ "ไม่เกิด" มีค่าคงที่เท่ากันทุก trial

 4. แต่ละ trial เป็นอิสระต่อกัน


PMF หาได้จากสูตร


p(k)=P(X=k)=n!k!(nk)!pk(1p)nk,k=0,1,2,3,..,n

n คือ จำนวน trail และ p คือ probability ของ event ที่สนใจ


ตัวอย่างเช่น การตอบคำถามที่ให้เลือกตอบ "ถูก" หรือ "ผิด" จำนวน 50 ข้อ แบบเดาสุ่ม ให้ X คือ random variable แทนจำนวนข้อที่ใช้คำตอบ "ถูก"

 1. มีจำนวน trial คือ 50

 2. ค่าความน่าจะเป็นของการตอบ "ถูก" หรือ "ผิด" มีค่าเท่ากันทุกข้อคือ 0.5

 3. การตอบแต่ละคำถามเป็นอิสระต่อกัน


ถ้าให้ n คือจำนวน trial (จำนวนคำถาม) จะได้ n = 50

ถ้าให้ p คือ probability ของการเกิดขึ้นคำตอบ "ถูก" ของแต่ละข้อ ได้ p=0.5

จะได้ PMF คือ

p(0)=50!0!(500)!(0.5)0(0.5)500p(1)=50!1!(501)!(0.5)1(0.5)501p(2)=50!2!(502)!(0.5)2(0.5)502...p(50)=50!50!(5050)!(0.5)50(0.5)5050

ความคิดเห็น