เศรษฐศาสตร์ภาษางูเหลือม ตอนที่ 1 การวิเคราะห์ข้อมูลเศรษฐกิจและธุรกิจด้วย Python
Student blog — 07/03/2025

จากรูปที่ 1 ทางผู้เขียนได้เขียนคำสั่งผ่าน JupyterLab โดยเริ่มจากการ import คำสั่ง pandas เข้ามาก่อน แล้วจึงดึงข้อมูลจากไฟล์ excel ที่เตรียมเอาไว้ หลังจากนั้นสร้างตารางข้อมูลด้วยคำสั่ง df และรันข้อมูลออกมาจะได้ผลลัพธ์ตามรูปที่ 2
จากรูปที่ 2 ที่แสดงตารางรายได้และหนี้สินของคนในอเมริกาจำนวน 6,015 คน ซึ่งเป็นข้อมูลที่มากมาย แต่ค่อนข้างดูยาก นำข้อมูลเหล่านี้มาตัดสินใจได้ยาก ดังนั้นเราต้องจัดเรียงข้อมูลให้ดูง่ายขึ้นด้วยวิธีการเรียงข้อมูลจากมากไปน้อย ในตัวอย่างนี้ผู้สอนนำข้อมูลหนี้สินมาเรียงจากมากไปน้อย
ข้อมูลที่ถูกเรียงทำให้เราสามารถอ่านข้อมูลง่ายขึ้น แต่ข้อมูลมีจำนวนมากและวิเคราะห์ยาก ดังนั้นเราจะสร้างกราฟเพื่อดูการกระจากของข้อมูลด้วย Scatter Plot


จากรูปที่ 5 จะเห็นการกระจายของข้อมูล สามารถสรุปข้อมูลเบื้องต้นได้ว่าผู้ที่มีรายได้น้อยจะมีหนี้สินอยู่มากในขณะที่ผู้ที่มีรายได้มากมีหนี้สินน้อย หลังจากนั้นเรามาสร้างตารางค่าสัมประสิทธิ์สหสัมพันธ์
ค่าสัมประสิทธิ์สหสัมพันธ์ (Correlation Coefficient) ใช้สำหรับวัดความสัมพันธ์ระหว่างตัวแปรสองตัว โดยค่าจะอยู่ระหว่าง -1 ถึง 1
1 หมายถึง มีความสัมพันธ์เชิงบวกสูงมาก (ถ้าตัวแปรหนึ่งเพิ่ม อีกตัวก็เพิ่ม)
0 หมายถึง ไม่มีความสัมพันธ์
-1 หมายถึง มีความสัมพันธ์เชิงลบสูงมาก (ถ้าตัวแปรหนึ่งเพิ่ม อีกตัวจะลด)
ค่าสัมประสิทธิ์สหสัมพันธ์ของหนี้สินและรายได้อยู่ระหว่าง 0.05 นั่นหมายความว่ามีความสัมพันธ์เชิงบวกแต่ไม่สูงสูงมาก
ผู้เขียน: อาจารย์ กิตติวัฒน์ สุวรรณลี