Recap:
Continuous Random variable คือ random variable ที่มีคุณสมบัติ
1 ค่าที่เป็นไปได้อยู่ในรูปแบบของช่วงตัวเลข ไม่ใช่เลขโดด
2 ค่าความน่าจะเป็นของ variable ต้องหาเป็นช่วงของตัวเลข
2 ค่าความน่าจะเป็นของ X ที่ค่าใดๆ มีค่าเป็น 0 \( P(X=x) = 0\)
ถ้า A และ B เป็นเซตแล้ว function จาก A ไปยัง B เขียนแทนด้วย \( f : A \rightarrow B \) คือ กฏ (rule) ที่ใช้โยงสมาชิกของ A ไปยัง B แบบ many to one relation ship
ตัวอย่างของ random variable ที่ค่าตัวเลขที่เป็นช่วง ได้แก่
♦ สุ่มขุดตัวอย่างดินจากที่ต่างๆมาวัดค่า PH ของดิน ค่าของ ph ที่เป็นไปได้จะเป็นช่วงของตัวเลขระหว่าง 0.0 - 14.0
♦ สุ่มเก็บตัวอย่างอากาศจากที่ต่างๆเพื่อวัด Air Quality Index (AQI) ค่าที่เป็นไปได้จะเป็นช่วงของตัวเลขที่มีค่าเป็น 0 หรือมากกว่า
ฯลฯ
Random variable ที่
Probability Distribution
ดูตัวอย่างคะแนนสอบคณิตศาสตร์จากการวัดผลครั้งหนึ่ง ให้ random variable \( X \) คือคะแนนสอบของผู้เข้าสอบแต่ละคนที่ทำได้ ค่าที่เป็นไปได้ของ \( X \) จะเป็นช่วงของตัวเลขระหว่าง 0 -100 ซึ่งมีลักษณะของ continuous random variable คะแนนสอบส่วนหนึ่งแสดงในตารางที่ 1
Scores | Number of students | Probabilities |
---|---|---|
0 - 10 | 0 | 0.00 |
11 - 20 | 0 | 0.00 |
21 - 30 | 1 | 0.02 |
31 - 40 | 2 | 0.04 |
41 - 50 | 2 | 0.04 |
51 - 60 | 18 | 0.32 |
61 - 70 | 12 | 0.21 |
71 - 80 | 15 | 0.27 |
81 - 90 | 6 | 0.11 |
91 - 100 | 0 | 0.00 |
นำข้อมูลจากตารางไปสร้าง histogram (แผนภาพที่ทำให้เห็นการแจกแจงข้อมูล) ระหว่างค่าของ \( X \) กับค่า probability จะได้ดังรูปที่ 1
รูปที่ 1 |
หากทำการเพิ่มข้อมูลให้มากขึ้น ค่าของ \( X\) ก็จะมีความละเอียดมากขึ้น เมื่อนำไปสร้าง histogram จะได้ผลดังรูปที่ 2 จะเห็นได้ว่าขนาดของแท่งกราฟจะแคบลง แต่ยังคงแสดงแนวโน้มแบบเดิม และหากเพิ่มข้อมูลมากขึ้นไปอีก ค่าของ \( X\) ก็จะยิ่งมีความละเอียดมากขึ้น แท่งกราฟที่ออกมาจะแคบมากจนอนุมานได้ว่ามีความกว้างเพียง 1 หน่วย คราวนี้จะเห็นเป็นลักษณะของกราฟเชิงเส้นแทนกราฟแท่ง ดังแสดงในรูปที่ 3
รูปที่ 2 |
รูปที่ 3 |
จากรูปที่ 3 ความสูงของแท่งกราฟแทนค่า probability เราจะอนุมานว่าความกว้างของแท่งกราฟมีค่าเป็น 1 หน่วย (หมายถึงเล็กมาก) ดังนั้นพื้นที่ใต้กราฟ ( \( 1 \times p(x) \)) ของกราฟแต่ละแท่งจะมีค่าเท่ากับ probability ของแต่ละช่วงค่าของ \( X \) และผลรวมของพื้นที่ใต้กราฟทั้งหมดจะมีค่าเป็น 1.0 (ดูเรื่อง discrete random variable) หมายความว่า หากเราต้องการทราบค่า probability ของ \(X\) ในช่วง [a,b] ใดๆ ก็คือการหาพื้นที่ใต้กราฟของ histogram ในช่วง [a,b] (ดูรูปที่ 4)
รูปที่ 4 |
Probability distribution ของ continuous random variable \(X\) สำหรับช่วงระหว่าง a,b [1]
\[ P(a \leqslant X \leqslant b) = \int_a^bf(x) \,dx \tag{1.0} \]\( f(x) \) เรียกว่า density function
ต่างจาก discrete random variable ที่ไม่สามารถหาค่าความน่าจะเป็นเมื่อ \( X \) มีค่าเป็นค่าใดค่าหนึ่งได้ ต้องหาจากช่วงของตั่วเลข หรืออาจมองว่าเป็นการหาความหนาแน่น (density) ของค่าความน่าจะเป็นก็ได้ ดังนั้น probability distribution สำหรับ continuous random variable จึงมักถูกเรียกว่า Probability Density Function (PDF) ซึ่งเห็นได้จาก PDF ของ continuous random variable อยู่ในรูปของ integral ไม่ใช่ summation แบบ PMF ของ discrete random variable
เนื่องจาก continuous random variable สามารถละจุด end point ได้
คุณสมบัติสำคัญของ PDF ของ continuous random variable \(X\)
1. Density function เป็น non-negative function , \( f(x) \geqslant 0 \)
2. พื้นที่ใต้กราฟรวมมีค่าเท่ากับ 1, \(\int_{-\infty}^{\infty}f(x) \,dx =1 \)
ตัวอย่าง ถ้าให้กำหนดให้ density function ของ continuous random variable \(X \) เป็นดังนี้
\[ f(x) = \begin{cases} x, & 0.0 \leqslant x < 1.0\\ 1-x, & 1.0 \leqslant x < 2.0 \\ 0.0 ,& otherwise \end{cases} \]หา \(P(0.1 \leqslant X \leqslant 1.5 )\)
เนื่องจาก density function แบ่งเป็นส่วนๆ เมื่อพิจารณาช่วงค่าของ \(X\) ที่ต้องการหาค่าความน่าจะเป็น ก็จะเห็นว่าสามารถแบ่งออกเป็น 2 ช่วงดังนี้
\[ P(0.1 \leqslant X \leqslant 1.5 ) = \int_{0.1}^1 f(x) \,dx + \int_{1}^{1.5} f(x) \,dx\]แทน \(f(x) \)ด้วย density function ที่กำหนดมา
\[ \begin{align*} P(0.1 \leqslant X \leqslant 1.5 ) &= \int_{0.1}^1 x \,dx + \int_{1}^{1.5} (1-x) \,dx \\\\ P(0.1 \leqslant X \leqslant 1.5 ) &= \frac{x^2}{2}\Biggr|_{0.1}^{1.0} + (x-\frac{x^2}{2})\Biggr|_{1.0}^{1.5} \\\\ &=\frac{1.0^2}{2} - \frac{0.1^2}{2} + [(1.5 - \frac{1.5^2}{2}) - (1.0 - \frac{1.0^2}{2})] \\\\ &= \frac{1-0.01}{2} + \frac{3-2.25}{2} - \frac{2-1}{2}\\\\ &= \frac{0.99}{2} + \frac{0.75}{2} - \frac{1}{2} \\\\ \therefore P(0.1 \leqslant X \leqslant 1.5 ) &= \frac{0.74}{2} = 0.37 \end{align*} \]ถ้า X เป็น continuous random variable แล้ว PDF เป็น function ที่ใช้คำนวณหา probability ของ X
Cumulative distribution function (CDF)
CDF เป็นค่าความน่าจะเป็นรวมของ random variable X ที่น้อยกว่าค่าที่กำหนด ถ้าให้ a เป็นค่าของ random variable X ที่สนใจ จะได้
\[ \begin{align*} CDF(a) &= P(X \leqslant a) \\\\ \therefore CDF(a) &= \int_{-\infty}^a p(x)\,dx \end{align*} \]Cumulative distribution function ของ continuous random variable \(X\) ที่มีค่าน้อยกว่า a
\[ CDF(a) = \int_{-\infty}^af(x) \,dx \tag{1.1} \]สำหรับช่วง [a,b]
\[ \begin{align*} PDF(a \leqslant X \leqslant b) = CDF(b) - CDF(a) \end{align*} \]Expectation value
เราทราบจากเนื้อหาเรื่อง discrete random variable ว่า expectation value คือผลรวมของ \( p(x)\cdot x\) ในเรื่องของ continuous random variable ก็เป็นเช่นเดียวกัน นันคือ
Expectation value ของ continuous random variable \( X \)
\[ \mu = E(X) = \int_{a}^{b} x\cdot f(x) dx \tag{1.2} \]เมื่อ f(x) คือ Probability distribution function (PDF) ของ X
[a,b] คือช่วงค่าของ X โดยทั่วไปหากไม่กำหนดไว้จะถือว่าเป็น \((-\infty,\infty )\)
ตัวอย่าง หาค่า expectatiion เมื่อ pdf = \( \frac{3}{2}(1-x^2) \) เมื่อ random variable X อยู่ในช่วง [0,1]
จาก (1.2) สิ่งที่ต้องหาคือ
\[ E(X) = \int_0^1 x \cdot \frac{3}{2}(1-x^2) dx \]ใช้เทคนิค integration by parts เพื่อแก้ปัญหานี้
ให้ u = x และ \( dv = \frac{3}{2}(1-x^2) dx \)
\[ \begin{align*} \frac{du}{dx} &= 1 \\ \therefore du &= dx \\\\\\ \int dv &= \int \frac{3}{2}(1-x^2) dx\\\\ v &= \frac{3}{2}[ \int1 dx - \int x^2) dx]\\\\ \therefore v &= \frac{3}{2}[ x - \frac{x^3}{3}] = \frac{3}{2}x - \frac{1}{2}x^3\\\\ \end{align*} \]จาก integration by part formula จะได้ว่า
\[ \begin{align*} \int_0^1 x \cdot \frac{3}{2}(1-x^2) dx &= x[\frac{3}{2}x - \frac{1}{2}x^3] \bigg|_0^1- \int_0^1 [\frac{3}{2}x - \frac{1}{2}x^3 ]dx\\\\ &= [\frac{3}{2}x^2 - \frac{3}{4}x^2]\bigg|_0^1 + [\frac{1}{8}x^4 - \frac{1}{2}x^4]\bigg|_0^1\\\\ &= (\frac{3}{4}x^2 - \frac{3}{8}x^4)\bigg|_0^1 \\\\ &= \frac{3}{4} - \frac{3}{8}\\\\ \therefore E(X) &= \frac{3}{8}, \text{x = [0,1]} \end{align*} \]Variance
ความหมายของ variance เป็นเช่นเดียวกับ discrete random variable
Variance ของ continuous random variable \( X \)
\[ \sigma^2 = Var(X) = \int_{a}^{b} x^2\cdot f(x) dx - \mu^2 \tag{1.3} \]เมื่อ f(x) คือ Probability distribution function (PDF) ของ X
[a,b] คือช่วงค่าของ X โดยทั่วไปหากไม่กำหนดไว้จะถือว่าเป็น \((-\infty,\infty )\)
ตัวอย่าง ให้ X เป็น continuous random variable ที่มี pdf ดังนี้ \[ f(x) = \begin{cases} \frac{3}{x^4},& x \geqslant 1\\ 0 , & \text{ otherwise} \end{cases} \] จงหาค่า Var(X)
การแก้ปัญหาข้อนี้จะพิจารณาแต่ช่วงที่ \( x \geqslant 1 \) เท่านั้น เพราะช่วงอื่นไม่มีค่าความน่าจะเป็นจึงไม่มี Variance นั่นคือ
\[ Var(X) = \int_{1}^{\infty} x^2\cdot \frac{3}{x^4} dx - \mu^2 \]หาค่าของ \(\mu \)
\[ \begin{align*} \mu &= \int_{1}^{\infty} x\cdot \frac{3}{x^4} dx \\ &= \int_{1}^{\infty} 3x{-3} dx \\ &= -\frac{3}{2}x^{-2} \bigg|_1^{\infty} \\ &= 0 - (-\frac{3}{2}) = \frac{3}{2} \end{align*} \]แทนค่า \(\mu \) เพื่อหา Var(X)
\[ \begin{align*} Var(X) &= \int_{1}^{\infty} x^2\cdot \frac{3}{x^4} dx - \mu^2 \\ &= \int_{1}^{\infty} \frac{3}{x^2} dx - (\frac{3}{2})^2 \\ &= -\frac{3}{x} \bigg|_1^\infty - \frac{9}{4}\\ &= 3 - \frac{9}{4} = \frac{3}{4} \end{align*} \]
ความคิดเห็น
แสดงความคิดเห็น