Probability : Normal Distribution

Recap :


  ♦ Probability density function (PDF) คือ function ที่ใช้ระบุ probability ของ continuous random variable ที่อยู่ระหว่างช่วงที่กำหนด [a,b]

  ♦ Cumulative distribution function (CDF) คือ function ที่ใช้ระบุ probability รวมของ continuous random variable ที่มีค่าน้อยกว่าค่าที่กำหนด (,a]


Normal distribution หรือ Guassian distribution เป็น probability distribution ที่มีความสำคัญมากที่สุด พบได้ในชีวิตจริงเป็นส่วนใหญ่ มีความเชื่อมโยงกับ central limit theorem ทำให้ยอมรับว่า distribution ของข้อมูลที่จัดเก็บมาหากมีจำนวนมากพอก็อนุมานว่าเป็น normal distribution ได้ ตัวอย่างข้อมูลจากสัมภาษณ์ผู้ป่วยใน Sylhet Diabetes Hospital in Sylhet, Bangladesh ถึงความเสี่ยงต่อการเป็นโรคเบาหวานในระยะแรกแยกตามอายุ


รูปที่ 1

PDF ของ normal distribution คือ


(1.0)f(x)=eu2πσ

เมื่อ

u=(xμ)22σ2

และ e คือ Euler's number มีค่าประมาณ 2.71828 , π=227


Histogram ของ normal distribution มีลักษณะเป็นรูประฆังคว่ำและสมมาตร (symmetry bell shape) เทียบกับรูปที่ 1 ซึ่งเป็นข้อมูลที่เก็บมาภาคสนามจะเห็นว่ามีรูปทรงใกล้เคียงกันมาก

รูปที่ 2 Histogram ของ Normal distribution

ค่า expectation และ variance ของ normal distribution :

E(X)=μVar(X)=σ2

สัญลักษณ์ที่ใช้บอกว่า random variable X มีการแจกแจงแบบ normal distribution คือ XN(μ,σ) อ่านว่า "X is normal distribution with parameter μ and σ "


ค่าของ μ,σ ส่งผลต่อรูปแบบของ histogram ถ้ามี sample spance 3 ชุด มี σ1=σ2=σ3 เท่ากัน แต่ μ1<μ2<mu3 ทำให้ได้ histogram ดังรูปที่ 3 หาก μ1=μ2=mu3 แต่ σ1<σ2<sigma3 จะได้ดังรูปที่ 4


รูปที่ 3

รูปที่ 4


Standard normal distribution


Linear transformation ของ Normal distribution

ถ้า XN(μ,σ) และ a,b เป็นค่าคงที่ หาก

Y=aX+b

จะได้ว่า Y มีการแจกแจงแบบ normal distribution ด้วย โดย

E(Y)=aμ+bVar(Y)=a2σ2

ถ้าให้ a = 1σ และ b = μσ แล้วทำ linear transform จาก XZ

Z=1σXμσ(1.1)Z=Xμσ

จากคุณสมบัติของการถ่ายทอดผ่าน linear transformation ทำให้ Z มีการแจกแจงแจงแบบ normal distribution และ

E(Z)=1σμμσE(Z)=0Var(Z)=(1σσ)2Var(Z)=1

นั่นคือ ZN(0,1) เรียก normal distribution ที่ μ=0,σ=1 ว่า standard normal distribution และขั้นตอนการทำ linear transform XZ เรียกว่า standardization (1.8)

การมี μ=0,σ=1 ทำให้ standard normal distribution มี PDF ที่ดูง่ายขึ้น คือ

(1.3)f(z)=12πe12z2
รูปที่ 5

  ♦ Standard normal distribution คือ normal distribution ที่มี μ=0 และ σ=1


ข้อดีของการมี standard normal distribution คือช่วยในการคำนวณ probability ของ random variable ได้ง่ายขึ้น เพราะมีการสร้างตารางเพื่อใช้หา CDF ไว้แล้ว แล้วอาศัยหลักการที่ว่า normal distribution มีการถ่ายทอดทาง linear transformation ทำให้เราสามารถเทียบ probability ของ standard normal distribution กับ normal distribution อื่นได้


P(Xx)=P(Xμσxμσ)P(Xx)=P(Zz)CDF(X)=CDF(Z)

ตัวอย่างสมมุติว่าค่าปริมาณน้ำฝนที่ตกลงมาต่อปีของเมือง A มีค่าเฉลี่ย (μ) เป็น 60 มม. มีค่าเบี่ยงเบนมาตรฐาน (σ) คือ 20 มม. ถ้าปริมาณน้ำฝนต่อปีมีการแจกแจงแบบ normal distribution จงหา probability ที่ปีนี้จะมีค่าปริมาณน้ำฝนต่อปีมากกว่า 80 มม.


แนวคิด : หา probability ที่ปริมาณน้ำฝนต่อปี 80 มม. แล้วนำไปลบออกจาก 1.0


Standardization : เปลี่ยนค่า X=80Z

Z=XμσZ=806020=1

เราทราบว่า P(X80)=P(Z1 ไปดูในตาราง standard normal table เพื่อหาค่า P(Z1 ได้เป็น 0.84134


ดังนั้น probability ที่ปริมาณน้ำฝนของปีนี้จะมากกว่า 80 มม. คือ 1.00.84134=0.1587


ความคิดเห็น