แนวคิด (Basic idea)
เป้าหมายของ Bayes classifier คือการประมาณค่าความน่าจะเป็นของเหตการณ์ y ภายใต้เงื่อนไขการเกิดขึ้นของเหตุการณ์ x จากเรื่อง conditional probability เราทราบว่า
ตัวอย่างข้อมูลของสายพันธุ์ดอก Iris (รูปที่ 1)
![]() |
รูปที่ 1 ตัวอย่างข้อมูลการแบ่งกลุ่มดอก Iris |
![]() |
รูปที่ 2 คุณลักษณะของดอก Iris ที่นำไปใช้ในการแบ่งสายพันธุ์ |
ถ้าให้ y แทนเหตุการณ์ที่ข้อมูลในแต่ละแถวจะเป็นสายพันธุ์ (class) ของดอก ค่าที่เป็นไปได้ของ y คือ ["setosa", "vericolor" , "verginica" ]
- ถ้า
แล้ว y เป็น 'setosa' หรือ - ถ้า
แล้ว y เป็น 'verginica'
หมายความว่า ถ้าเราทราบการแจกแจงค่าความน่าจะเป็นของ
หมายเหตุ เราอาจเขียน (
จาก (1.1) เป็นการประมาณค่าความน่าจะเป็นของ y เมื่อทราบเงื่อนไข
ในทางปฏิบ้ติมีข้อคำนึงอยู่คือ
- เราสามารถหาค่าของ
ได้โดยการแจงนับจากข้อมูลตัวอย่างที่เก็บมา -
นั้นไม่สามารถทำได้โดยตรงจากการแจงนับ ต้องมีการตั้งสมมุติฐานขึ้นมาก่อนเพื่อให้สามารถใช้กฏของความน่าจะเป็นได้เพื่อประมาณค่าได้ - เพื่อการ predict เราอาจละการทำ scaling หรือ การหารด้วย
ออกไปได้ เพราะไม่ได้ทำให้ความหมายเปลี่ยนแปลงในเชิงเปรียบเทียบ เช่น เราทราบว่า เป็นจริง ในทำนองเดียวกันหากทำ scale ด้วย 3 , ก็ยังเป็นจริงอยู่ ดังนั้น
สมมุติฐาน (Naive Assumption)
1. Independent : ภายใต้สมมุติฐานข้อนี้ให้ถือว่า
2. Equal : ภายใต้สมมุติฐานข้อนี้ให้ถือว่า
หมายเหตุ บางครั้งจะเห็นเรียกสมมุติฐาน 2 ข้อนี้ว่า naive Bayes assumption สมมุติฐานนี้ตั้งขึ้นเพื่อให้ง่ายต่อการคำนวณ ซึ่งอาจไม่ได้ผลในโลกความจริง
Conditional dependency
จากสมมุติฐานข้างต้นว่า การหาค่า
เมื่อ
นำ (1.4) ไปแทนใน (1.3) จะได้
ในความเป็นจริงแล้ว
เมื่อ
![]() |
รูปที่ 4 |
ความคิดเห็น
แสดงความคิดเห็น