Recap:
Random variable คือ function
หัวข้อ
♦ The probability distribution
♦ Cumulative distribution function
♦ Variance
The probability distribution
เนื้อหาในส่วนนี้จะกล่าวถึง Probability Distribution ซึ่งเป็นเรื่องสำคัญเรื่องหนึ่งที่โยงกับ random variable พิจารณาตัวอย่างต่อไปนี้
สมมุติบริษัท ABC ทำการสุ่มตรวจวัสถุดิบที่กำลังจะซื้อเพื่อตรวจสอบ ผลการตรวจจะมี 2 ทางคือ ผ่าน (P) กับ ไม่ผ่าน (F) ในการตรวจสอบ ใช้การสุ่มเลือกวัตถุดิบออกมา 100 ชิ้น แบ่งเป็น 10 ชุด (batches) ชุดละ 10 ชิ้น และทำการตรวจสอบทุกชิ้น ได้ผลดังตาราง
Batches | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|
Number of defective | 0 | 0 | 1 | 0 | 2 | 2 | 1 | 3 | 2 | 0 |
ให้
X | frequency |
---|---|
0 | 4 |
1 | 2 |
2 | 3 |
3 | 1 |
รวม | 10 |
กำหนดให้
ทำนองเดียวกัน เราจะได้
สามารถเขียน
ที่
สิ่งที่คำนวณได้ทำให้เราทราบค่าความน่าจะเป็นของ
Probability distribution อาจเรียกเป็น Probability Mass Function (PMF)
ลองนำเอาตัวเลข probability distribution ของ
![]() |
รูปที่ 1 |
ผลรวมของค่าความน่าจะเป็นใน probability distribution มีค่าเป็น 1.0
Cumulative distribution function (CDF)
Cumulative distribution function เป็นวิธีการพรรณาถึง probability distribution เหมือนกับ PMF ต่างกันตรงที่ CDF ใช้ค่าความน่าจะเป็นสะสมของค่าที่เป็นช่วงของ
Cumulative distribution function (CDF) ของ random variable
ตัวอย่าง ให้
a) หา
ปัญหานี้เป็นการหาความน่าจะเป็นรวมเมื่อค่าของ
b) หา
ปัญหานี้เป็นการหาความน่าจะเป็นรวมเมื่อค่าของ
The expectation value (mean value)
สมมุติว่าในสถาบันการศึกษาแห่งหนึ่ง มีการสำรวจ โดยให้
X | 1 | 2 | 3 | 4 | 5 | 6 | 7 | รวม |
---|---|---|---|---|---|---|---|---|
จำนวนนักศึกษา | 150 | 450 | 1,950 | 3,750 | 5,850 | 2,550 | 300 | 15,000 |
0.01 | 0.03 | 0.13 | 0.25 | 0.39 | 0.17 | 0.02 | 1.0 |
ถ้าต้องการทราบค่าของจำนวนวิชาที่ลงทะเบียนต่อนักศึกษา (จำนวนวิชาที่นึกศึกษาลงทะเบียนโดยเฉลี่ย) ต้องหาให้ได้ว่ามีจำนวนวิชาที่ถูกนักศึกษาลงทะเบียนมีทั้งหมดกี่วิชาแล้วนำมาหารด้วยจำนวนนักศึกษาที่ใช้สำรวจครั้งนี้ ดังนี้
จาก (1) ขอให้สังเกตุว่า
จาก (1.1) นำไปสู่ข้อสรุปว่าการคำนวณหาค่าเฉลี่ยของ random variable เมื่อทราบ probability distribution สามารถหาได้จาก
เมื่อ
D คือเซตของค่าที่เป็นไปได้ของ random variable X
ตัวอย่าง ทารกแรกคลอดจะมีการประเมินสภาพเรียกว่า Apgar scale (score) ผลการประเมินจะถูกเทียบเป็นตัวเลข 0,1,2,3,...,10 ถ้าในการทดลองครั้งหนึ่ง สุ่มเลือก Apgar scale จากทารกกลุ่มหนึ่ง ถ้าให้ random variable
Apgar scale (X) | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|---|
0.002 | 0.001 | 0.002 | 0.005 | 0.02 | 0.04 | 0.18 | 0.37 | 0.25 | 0.12 | 0.01 |
ค่า expectation value ของ Apgar scale หาได้จาก
เพื่อให้เข้าใจเรื่องค่า expectation ง่ายขึ้น ลองจินตนาการถึงการพยายามเลี้ยง (balancing) แท่งไม้ด้วยนิ้วมือ จุดที่ท่อนไม้อยู่นิ่งโดยไม่ตกนั่นคือจุดที่เรียกว่า center of gravity ซึ่งอาจจะไม่ใช่ตำแหน่งตรงกลางของแท่งไม้ก็ได้ ขึ้นกับการกระจายตัว (distribution)ของน้ำหนักตลอดแท่งไม้นั้น ค่า expectation ทำหน้าที่เหมือนกับ center of gravity ทำให้น้ำหนักทั้งสองข้างมีค่าเท่ากัน
![]() |
The variance
พิจารณา PMF ของ random variable X,Y
คำนวณหาค่า expectation ของทั้ง
ค่า variance ของ random variable
บางครั้งจะพบการคำนวณหาค่า variance จากสูตรข้างล่าง ซึ่งจะใช้ในกรณีที่ไม่ทราบ PMF แต่ทราบค่าของ
จากนิยาม 3.0,3.1 จะเห็นว่า variance คือค่า expectation หรือค่าเฉลี่ยของ
Variance คือ ค่าเฉลี่ยของกำลังสองของระยะทางระหว่าง
กลับไปคำนวณค่า variance ของ
ค่า variance บอกเราว่า random variable
ค่าของ variance มักเป็นตัวเลขที่สูง ดังนั้นจึงมีการใช้ค่าสถิติอีกค่าหนึ่งคือ standard deviation (SD) โดยที่
ตัวอย่าง discrete random variable ที่มีความสำคัญ
The Bernoulli random variable
กลับไปดูตัวอย่างกรณีบริษัท ABC อีกครั้ง ก่อนหน้านี้
การหา PMF : กำหนดให้
ข้อมูลจากบริษัท ABC ทราบว่ามี defectives จำนวน 10 ชิ้น จากจำนวนที่นำมาทดสอบทั้งหมด 100 ชิ้น ดังนั้นที่เหลือ 90 ชิ้นเป็นชิ้นที่ใช้ได้ คำนวณ PMF ของผลการทดสอบในกรณีใช้ Bernoulli random variable จะได้
Bernoulli randomvariable เป็น discrete random variable ที่มีความสำคัญพบได้บ่อย เช่น
♦ การวินิจฉัยโรคว่า "ป่วย" หรือ "ไม่ป่วย" ภายใต้อาการที่ตรวจพบ
♦ การทำประชาวิจารณ์ว่า "รับ" หรือ "ไม่รับ"
♦ การสำรวจข่ายงานจราจร "ว่าง" หรือ "ไม่ว่าง"
♦ ฯลฯ
Bernoulli random variable มีค่าได้เพียง
ตัวอย่าง การตรวจสอบเครื่องจักร ถ้ากำหนดให้ X จะมีค่าเป็น 0 เมื่อพบว่าอะหลั่ยของเครื่องจักรต้องการการซ่อมบำรุง ในทางตรงข้ามมีค่าเป็น 1 ในกรณีนี้ X คือ Bernoulli random variable ถ้ากำหนดให้
นั่นคือ expectation value ของ Bernoulli random varible มีค่าเป็น
Expectation value of Bernoulli random variable มีค่าเป็น p (
The Binomial random variable
เป็น discrete random variable ที่มีลักษณะพิเศษดังนี้
1. มีการกำหนดจำนวน trial ที่แน่นอน (sample size คงที่)
2. event ที่สนใจมีสถานะได้ 2 สถานะคือ "เกิด" หรือ "ไม่เกิด"
3. ค่าความน่าจะเป็นของการ "เกิด" หรือ "ไม่เกิด" มีค่าคงที่เท่ากันทุก trial
4. แต่ละ trial เป็นอิสระต่อกัน
PMF หาได้จากสูตร
n คือ จำนวน trail และ p คือ probability ของ event ที่สนใจ
ตัวอย่างเช่น การตอบคำถามที่ให้เลือกตอบ "ถูก" หรือ "ผิด" จำนวน 50 ข้อ แบบเดาสุ่ม ให้ X คือ random variable แทนจำนวนข้อที่ใช้คำตอบ "ถูก"
1. มีจำนวน trial คือ 50
2. ค่าความน่าจะเป็นของการตอบ "ถูก" หรือ "ผิด" มีค่าเท่ากันทุกข้อคือ 0.5
3. การตอบแต่ละคำถามเป็นอิสระต่อกัน
ถ้าให้ n คือจำนวน trial (จำนวนคำถาม) จะได้ n = 50
ถ้าให้ p คือ probability ของการเกิดขึ้นคำตอบ "ถูก" ของแต่ละข้อ ได้
จะได้ PMF คือ
ความคิดเห็น
แสดงความคิดเห็น