Hyperplane คือ subspace ที่มีจำนวน dimension น้อยกว่าสภาพแวดล้อมอยู่ 1 dimension
รูปแบบทั่วไปของสมการเส้นตรงในวิชาพีชคณิตที่มองเส้นตรงในรูปแบบของความสัมพันธ์ระหว่างตัวแปร คือ
ถ้าใน calculus จะมองในรูปแบบของฟังก์ชั่น จะเขียนในรูปแบบคือ
จาก (1) เราสามารถเขียนในรูปแบบที่ไม่มีตัวแปร y อยู่ได้ โดยแทน y ด้วย และ x แทนที่ด้วย จะได้เป็น
และถ้ากำหนดให้ แล้ว เราอาจเขียนสมการเส้นตรงในรูปแบบของ Matrix ได้แบบนี้
พิจารณาอีกครั้ง ถ้ากำหนดให้ แล้วนำแทนใน (5) จะได้
และถ้ากำหนดให้
ข้อดีของการเขียนสมการเส้นตรงในรูปแบบ (5) คือ สามารถกำหนดจำนวน dimension ให้กับ Matrix ได้ตามที่ต้องการ
พิจารณาอีกครั้ง ถ้ากำหนดให้
เมื่อนำไปเทียบกับ
ดูตัวอย่าง ถ้าเรามีข้อมูลคู่อันดับอยู่ชุดหนึ่งดังนี้
นำไป plot จะได้ดังรูปที่ 1
![]() |
รูปที่ 1 |
พิจารณาด้วยสายตาเห็นได้ว่าข้อมูลมีแนวโน้มของการรวมกลุ่มกันเป็นสองกลุ่ม หากเราทดลองลากเส้นตรงหนึ่งเส้นเพื่อแบ่งกลุ่มข้อมูล อาจได้ดังรูปที่ 2
![]() |
รูปที่ 2 |
คำนวณหาสมการเส้นตรงได้เป็น
นำไปเทียบกับ (6) จะได้
ในการแยกกลุ่มข้อมูล เพื่อให้รู้ว่าข้อมูลแต่ละชิ้นจะไปอยู่ในกลุ่มไหน เราจำเป็นต้องกำหนด function ขึ้นมาใหม่อีกหนึ่ง เรียกว่า hypothesis function โดยที่
จะเห็นได้ว่าเรากำหนดค่าของ
ขั้นตอนต่อไป เอาค่าของข้อมูลที่มีอยู่ (มองดูแล้วจะเห็นว่าข้อมูลอยู่ในรูป coordinate หรือ vector) มาแทนค่าลงในสมการเส้นตรง แล้วพิจารณาผลของ hypothesis function (h)
จากที่กล่าวมา จะเห็นได้ว่าการรวมกันระหว่าง linear equation กับ hypothesis function สามารถนำมาเพื่อแบ่งกลุ่มข้อมูล โดยที่เราจะเรียก hypothesis function ว่าเป็น Linear classifier เรียก linear equation ว่าเป็น Hyperplane equation
เพื่อลดความสับสนเราจะเติม 1 เข้าไปในข้างหน้าหรือท้ายของ ซึ่งจะกลายเป็น หรือ เปลี่ยนสัญญลักษณ์เป็น
และเติม b เข้าไปใน ในตำแหน่งเดียวกับ 1 ได้เป็น หรือ เปลี่ยนสัญญลักษณ์เป็น
การเติมสมาชิกเข้าไปในลักษณะนี้ทำให้ค่าคงที่ในรูปแบบสมการ (1) นั้นหายไป ได้รูปใหม่ของสมการเป็น
และ hypothesis function :
Data | ||
---|---|---|
[1 3] | -5.6 | -1 |
[2 5] | -3.2 | -1 |
[2 7] | -1.2 | -1 |
[4 4] | -3.4 | -1 |
[4 6] | -1.4 | -1 |
[7 5] | -1.2 | -1 |
[8 3] | -2.8 | -1 |
[4 8] | 0.6 | 1 |
[ 4 10] | 2.6 | 1 |
[ 7 10] | 3.8 | 1 |
[7 9] | 2.8 | 1 |
[8 8] | 2.2 | 1 |
[9 7] | 1.6 | 1 |
[10 10] | 5.0 | 1 |
จากที่กล่าวมา จะเห็นได้ว่าการรวมกันระหว่าง linear equation กับ hypothesis function สามารถนำมาเพื่อแบ่งกลุ่มข้อมูล โดยที่เราจะเรียก hypothesis function ว่าเป็น Linear classifier เรียก linear equation ว่าเป็น Hyperplane equation
เพื่อลดความสับสนเราจะเติม 1 เข้าไปในข้างหน้าหรือท้ายของ
และเติม b เข้าไปใน
การเติมสมาชิกเข้าไปในลักษณะนี้ทำให้ค่าคงที่ในรูปแบบสมการ (1) นั้นหายไป ได้รูปใหม่ของสมการเป็น
และ hypothesis function :
ความคิดเห็น
แสดงความคิดเห็น