เหตุใดค่า R-Squared จึงไม่ได้บ่งบอกอะไรเกี่ยวกับสาเหตุ

เหตุใดค่า R-Squared จึงไม่ได้บ่งบอกอะไรเกี่ยวกับสาเหตุ
Anonim

ตอบ:

R-squared เป็นการระบุว่าข้อมูลที่ตรวจพบนั้นเหมาะสมกับข้อมูลที่คาดหวังได้ดีเพียงใด แต่ให้ข้อมูลเกี่ยวกับสหสัมพันธ์เท่านั้น

คำอธิบาย:

ค่า R-squared ระบุว่าข้อมูลที่คุณตรวจพบหรือข้อมูลที่คุณเก็บรวบรวมนั้นเหมาะสมกับแนวโน้มที่คาดหวังมากเพียงใด ค่านี้จะบอกคุณถึงความแข็งแกร่งของความสัมพันธ์ แต่เช่นเดียวกับการทดสอบทางสถิติทั้งหมดไม่มีสิ่งใดที่จะบอกสาเหตุของความสัมพันธ์หรือจุดแข็งของคุณ

ในตัวอย่างด้านล่างเราจะเห็นกราฟทางด้านซ้ายไม่มีความสัมพันธ์ตามที่ระบุโดยค่า R-squared ต่ำ กราฟทางด้านขวามีความสัมพันธ์ที่แข็งแกร่งมากดังที่แสดงโดยค่า R-squared ที่ 1 ในกราฟที่เราไม่สามารถบอกได้ว่าอะไรเป็นสาเหตุของความสัมพันธ์นี้ในที่สุด

ความสัมพันธ์ไม่ได้หมายถึงสาเหตุ ค่า X ของคุณอาจส่งผลกระทบต่อค่า Y ของคุณได้เป็นอย่างดี แต่อาจมีปัจจัยอื่น ๆ ที่กำลังเล่นอยู่หรือความสัมพันธ์อาจเนื่องมาจากโอกาส คุณสามารถ สรุป สาเหตุ แต่นี่คือการตีความของคุณและไม่สามารถพิสูจน์ได้จากการทดสอบทางสถิติ การมีค่า R-squared สูงยังคงบอกเพียงแค่ความแข็งแกร่งของความสัมพันธ์ แต่ไม่ใช่สาเหตุ

เพื่อพิสูจน์สาเหตุเป็นงานที่มีขนาดใหญ่มาก ถ้าคุณต้องการที่จะเข้าใจสาเหตุที่เป็นทางออกที่ดีที่สุดของคุณคือผ่านการทดลอง