Expectation
ค่า expectation ของ random variable ใด คือ arithmetic mean ของ random variable นั้น เขียนแทนด้วย E(X) หรือ
Discrete :
Continuous :
Expectation rules
, a คือค่าคงที่ , a คือค่าคงที่ , a คือค่าคงที่ , a,b คือค่าคงที่ , X,Y คือ random variables , X,Y คือ independent random variables
เมื่อ
Variance
ใช้บอกระดับการกระจายตัวของข้อมูล (spread out) โดยวัดจากความห่างของ data point กับค่ากลาง (expectation,
นิยามโดย ถ้า X เป็น random variable แล้ว
Variance rule
, a คือค่าคงที่ , a คือค่าคงที่ , a,b คือค่าคงที่ , X,Y คือ independent random variables , (COV(X,Y) จะกล่าวถึงภายหลัง)
Covariance
ใช้บอกทิศทางความสัมพันธ์ระหว่าง random variable 2 ตัว (X,Y) ค่าของ covariance มีได้ทั้งบวกและลบ ค่าที่เป็นบวกแสดงว่า random variable มีความสัมพันธ์ในทิศทาง ทางเดียวกัน ถ้าเป็นลบก็จะตรงกันข้าม หากเป็น 0 หมายความว่าไม่มีความสัมพันธ์ต่อกัน
นิยามโดย ถ้าให้ X,Y เป็น random variables
Correlation
ใช้บอกความสัมพันธ์เชิงเส้น (linear association) ระหว่าง random variable 2 ตัว (X,Y) อาจเรียก correlation coefficient ก็ได้ ค่าของ correlation จะมีค่าระหว่าง [-1,1]
นิยามโดย ถ้าให้ X,Y เป็น random variables
การตีความค่าของ Corr(X,Y) จะคล้ายกับ Cov(X,Y) ที่ต่างคือถ้า Corr มีค่าเข้าใกล้ 1 หรือ -1 หมายถึงความสัมพันธ์เชิงเส้นตรงระหว่าง X,Y จะมากขึ้นเท่านั้น (
ตัวอย่าง : ให้ X เป็น continuous random variable ที่มี p.d.f ดังนี้
เนื่องจาก p.d.f ของ x ช่วงอื่นมีค่าเป็น 0 นอกจาก [1,2] ดังนั้น
จาก
หา
ดูตัวอย่างข้อมูลความสูง (inches) และ นำ้หนัก (pounds) ของผู้ชายจำนวน 100 คนที่นำมาแสดงด้วย scatter plot (รูปที่ 1) ดูแล้วเหมือนกับว่าจะมีความสัมพันธ์กันอยู่ โดยที่เมื่อค่าความสูงมากขึ้น ค่าของน้ำหนักก็จะเพิ่มตาม
![]() |
รูปที่ 1 |
การคำนวณ :
ให้ X แทนข้อมูลความสูง Y แทนข้อมูลน้ำหนัก
ค่า Cov(X,Y) เป็นบวกสอดคล้องกับ scatter plot บอกว่าความสูงและน้ำหนักของผู้ชายมีความสัมพันธ์ไปทางเดียวกัน
หาค่า correlation :
ค่า correlation มีค่ามากกว่า 0 แสดงถึงความสัมพันธ์ทางบวกต่อกันระหว่างความสูงและน้ำหนักแต่ยังไม่กับเป็น linear ที่ชัดเจน
เอกสารอ้างอิง
ความคิดเห็น
แสดงความคิดเห็น