บทที่
1
สถิติและข้อมูล
1.1
ประเภทของสถิติ
สถิติสามารถจำแนกออกได้เป็น
2 ประเภท ได้แก่
1)
สถิติพรรณนา (descriptive
statistics) สถิติที่กล่าวถึงวิธีการที่จะบรรยายลักษณะของข้อมูลที่เก็บรวบรวมมาได้ ดังนั้นสถิติพรรณนาจะไม่ใช้ผลที่คำนวณได้ไปอ้างอิงกับข้อมูลของกลุ่มอื่นๆ
2)
สถิติอนุมาน
(inferential statistics or analytical statistics)เป็นสถิติที่กล่าวถึงการนำข้อมูลที่ได้จากตัวอย่าง
ไปอ้างอิงลักษณะของประชากร
1.2
ประเภทของข้อมูล
ข้อมูลที่ใช้ในทางเศรษฐศาสตร์
แบ่งออกเป็น 2 วิธี
คือ
1.2.1 แบ่งประเภทข้อมูลตามแหล่งที่มาที่ใช้ในการเก็บข้อมูล
(1) ข้อมูลปฐมภูมิ
(Primary Data) คือข้อมูลใดๆ
ที่ผู้ศึกษาต้องเก็บขึ้นมาใหม่เพื่อวัตถุประสงค์ โดยเฉพาะ การสำรวจภาคสนาม การสัมภาษณ์ การสังเกต การใช้แบบสอบถาม และการทดลอง
(2) ข้อมูลทุติยภูมิ (Secondary Data) คือข้อมูลต่าง ๆ
ที่มีอยู่แล้ว
ซึ่งอาจจะจัดอยู่ในรูปข้อมูลเบื้องต้นที่ผู้ได้มีผู้อื่นรวบรวมไว้แล้ว
1.2.2 การแบ่งประเภทของข้อมูลตามคุณสมบัติการวัด
(1) ข้อมูลเชิงคุณภาพ (Qualitative
Data) เป็นข้อมูลที่ไม่สามารถทำการวัดหรือให้ค่าที่เป็น
ตัวเลขได้
(2) ข้อมูลเชิงปริมาณ (Quantitative
Data) คือข้อมูลที่วัดออกมาเป็นตัวเลขแล้วผู้ศึกษาสามารถนำไปใช้ในการวิเคราะห์ทางสถิติต่อไปได้
1.3 มาตรวัดของข้อมูล
เนื่องจากตัวแปรที่ศึกษาจะมีระดับของการวัดที่แตกต่างกัน
ดังนั้นจึงต้องมีกฎเกณฑ์ที่เป็นระบบเพื่อใช้ในการวัดข้อมูล กฎเกณฑ์ดังกล่าวเรียกว่า “มาตรวัดของข้อมูล”
มาตรวัดของข้อมูลมีองค์ประกอบที่สำคัญ
3 ประการ คือ
1.3.1 ขนาด หมายถึง ความมากหรือน้อย
1.3.2 ความเท่ากันของช่วงคะแนน หมายถึง
ความหมายของตัวเลขแต่ละช่วงมีความหมายเหมือนกัน
หรือค่าของคะแนนแต่ละช่วงมีความเท่ากัน
1.3.3 ความมีศูนย์สมบูรณ์ หมายถึง
ตัวแปรมีหรือไม่มีศูนย์สมบูรณ์ เช่น ตัวแปรอัตราดอกเบี้ย 0% บ่งบอกว่า
ผลตอบแทนเป็นศูนย์
แสดงว่าตัวแปรอัตราดอกเบี้ยมีศูนย์สมบูรณ์
ตัวแปรเกรดของนักศึกษา 4
3 2 1 และ 0 ถ้านักศึกษาได้เกรด 0 เกรด 0 หมายถึงเป็นศูนย์สมมติ
1.4 ระดับการวัดข้อมูล
1.4.1 มาตรานามบัญญัติ (Nominal Scale)
เป็นตัวแปรที่ไม่มีขนาด
ไม่มีความเท่ากันของช่วง และไม่มีศูนย์สมบูรณ์ โดยเป็นระดับการวัดที่จำแนกความแตกต่างของสิ่งที่
ต้องการวัดออกเป็นกลุ่ม เช่น วัตถุประสงค์ของการเดินทาง แบ่งออกเป็น 1 แทนการท่องเที่ยวและพักผ่อน
2 แทนไปราชการ 3 แทนประชุมสัมมนาและฝึกอบรม
4 แทนเยี่ยมญาติและเพื่อน และ 5 แทนอื่นๆ เป็นต้น
ตัวเลขที่ใช้แทนกลุ่มต่างๆ เป็นตัวเลขที่ใช้จำแนกความแตกต่างของกลุ่มที่มีอยู่ในตัวแปร
ไม่สามารถนำมาคำนวณทางคณิตศาสตร์ได้ สำหรับสถิติพื้นฐานที่ใช้ในการวิเคราะห์ตัวแปรที่มีมาตราวัด
แบบนี้ ได้แก่ ค่าความถี่ ค่าร้อยละ และค่าฐานนิยม และหากต้องการนำตัวแปรประเภทนี้มาใช้ใน
แบบจำลองทางสถิติและเศรษฐมิตินั้น ส่วนใหญ่จะกำหนดตัวแปรประเภทนี้ให้อยู่ในลักษณะของตัวแปรหุ่น
(Dummy variables) ที่มีค่าเพียง 0 กับ
1 เท่านั้น โดยทั่วไปกำหนดให้ 1 แทนคุณลักษณะของข้อมูล
(เช่น ท่องเที่ยวและพักผ่อน) และ 0 คือ อื่นๆ
ตัวอย่างข้อมูลที่ได้จากการวัดโดยใช้มาตรานามบัญญัติ
(Nominal
scale)
1.
เพศ ¨ ชาย ¨ หญิง
2.
เชื้อชาติ
¨ ไทย ¨ จีน
3.
ศาสนา ¨ พุทธ ¨ คริสต์
¨ อิสลาม
4.
อาชีพ ¨ หมอ ¨ นักเรียน ¨ ครู
5.
หมายเลขโทรศัพท์ .........................
ฯลฯ
1.4.2
มาตราเรียงอันดับ (Ordinal
Scale)
เป็นตัวแปรที่มีการจัดลำดับข้อมูลจากมากไปน้อย
หรือจากน้อยไปมากได้ แต่ไม่ได้บอกถึงปริมาณแต่ละอันดับว่ามากน้อยเท่าใด
ไม่มีความเท่ากันของช่วงคะแนน และไม่มีศูนย์สมบูรณ์ ทั้งนี้จะเป็นการใช้ในการจัดอันดับหรือตำแหน่งของสิ่งที่ต้องการวัด
เช่น ระดับความพึงพอใจที่มีต่อการรับบริการ แบ่งออกเป็น 5 ระดับ คือ 1=พึงพอใจน้อยที่สุด
2=พึงพอใจน้อย 3=พึงพอใจปานกลาง 4=พึงพอใจมาก และ 5=พึงพอใจมากที่สุด หรืออาจจะเป็นลักษณะตัวเลขที่ใช้แทนอันดับ ของสิ่งที่ต้องการวัดเป็นตัวเลขที่ให้ความหมายในลักษณะที่แตกต่างกันจากน้อยไปหามาก
ตัวเลขในระดับนี้ สามารถนำมาคำนวณทางคณิตศาสตร์ได้เพียงบวกหรือลบเท่านั้น (แต่ในบางแง่มุมอาจไม่สามารถนำข้อมูล ดังกล่าวมาบวกหรือลบได้) สำหรับสถิติพื้นฐานที่นิยมใช้ในการวิเคราะห์ตัวแปรที่มีมาตราวัดในลักษณะนี้
ได้แก่ ค่าความถี่ ค่าร้อยละ ค่าเฉลี่ย และค่าเฉลี่ยแบบถ่วงน้ำหนัก
ตัวอย่างข้อมูลที่ได้จากการวัดโดยใช้มาตรอันดับ (Ordinal
scale)
1. กิจกรรมที่นิยมทำในวันหยุด (เรียงลำดับมากที่สุดเป็นลำดับ 1)
......... ดูหนัง
.......... ฟังเพลง
......... เล่นกีฬา
. ........ ดูโทรทัศน์
2. ระดับความพึงพอใจต่ออาหารประเภท fast food ดังแสดงในตารางที่ 1.1
ตารางที่ 1.1 ตัวอย่างคำถามลักษณะของข้อมูลโดยใช้มาตรอันดับ
พาหนะที่เหมาะสมในเดินทางเพื่อไปศึกษาดูงาน
|
ระดับความคิดเห็น
|
||||
เห็นด้วยอย่างยิ่ง
|
เห็นด้วย
|
เฉยๆ
|
ไม่เห
|
ไม่ชอบอย่างมาก
|
|
รถยนต์ส่วนตัว
|
|||||
รถบัสปรับอากาศ
|
|||||
รถตู้
|
|
ฯลฯ
1.4.3 มาตราอันตรภาค (Interval
Scale)
Interval
Scale สามารถบอกระยะห่างของตัวเลข 2 ตัว
ว่ามีความแตกต่างกันมากน้อยเท่าใด มีเกณฑ์อยู่กับสิ่งที่เรียกว่าศูนย์สมมติ
ทั้งนี้ Interval Scale เป็นระดับที่กำหนดค่าตัวเลขให้มีช่วงห่างระหว่าง
ตัวเลขเท่าๆ กัน เช่น ระดับคะแนนสอบของวิชาเศรษฐศาสตร์ เป็นต้น ตัวเลขในมาตราวัดแบบนี้
สามารถนำมาคำนวณทางคณิตศาสตร์และเปรียบเทียบความแตกต่างได้ แต่ไม่สามารถนำไปเปรียบเทียบในลักษณะที่ว่าแตกต่างกันกี่เท่า
เพราะ มาตราวัดระดับนี้ไม่มีศูนย์แท้ มีแต่ค่าศูนย์ กล่าวคือ จากกรณี ตัวอย่างหากมีนักศึกษาคนหนึ่งได้คะแนน 0 ในการสอบวิชาเศรษฐศาสตร์ ไม่ได้หมายความว่า นักศึกษาคนดังกล่าวไม่มีความรู้ในวิชาเศรษฐศาสตร์เพียงแต่ไม่สามารถทำข้อสอบที่เป็น
ตัวแทนของความรู้ทั้งหมดได้ เป็นต้น ดังนั้นจึงสามารถนำตัวเลขดังกล่าวมาบวก ลบ คูณ
หรือหารได้ สำหรับสถิติพื้นฐานที่ใช้ในการวิเคราะห์ตัวแปรที่มีมาตราวัดในลักษณะนี้มีหลากหลาย
เช่น ค่าเฉลี่ย ค่าความแปรปรวน การทดสอบการแจกแจง เป็นต้น
ตัวอย่างข้อมูลที่ได้จากการวัดโดยใช้มาตรอันดับ (Interval
scale)
1.
อุณหภูมิ………เซลเซียส์
2.
คะแนนสอบ……….คะแนน
3.
ระดับความพึงพอใจต่ออาหารประเภท
fast food ในลักษณะ Rating Scale ดังแสดงในตารางที่ 1.2
ตารางที่ 1.2 ตัวอย่างคำถามลักษณะของข้อมูลโดยใช้มาตรอันตรภาค
อาหาร
|
ระดับความพึงพอใจ
|
||||
ชอบมากที่สุด
|
ชอบมาก
|
ปานกลาง
|
ไม่ชอบ
|
ไม่ชอบอย่างมาก
|
|
พิซซ่า
|
|||||
ไก่ทอด
|
|||||
โดนัท
|
อย่างไรก็ตามในโปรแกรมสำเร็จรูปการวิเคราะห์ข้อมูลทางสถิตินั้น
มิได้แบ่งมาตราอัตร-ภาคชั้นไว้
หากแต่มีการแบ่งออกเป็นอย่างประเภทอัตราส่วน ดังนั้นในการวิเคราะห์ข้อมูลทางสถิติจึงจัดอยู่ในกลุ่มเดียวกัน
โดยรายละเอียดมาตราวัดแบบอัตราส่วนจะกล่าวในลำดับถัดไป
1.4.4 มาตราอัตราส่วน (Ratio
Scale)
มาตราอัตราส่วนเป็นตัวแปรที่มีระดับการวัดเหมือนมาตราอันตรภาค
และมีศูนย์สมบูรณ์ ข้อมูลที่เป็นอัตราส่วนสามารถนำมาบวก
ลบ คูณ หาร ได้ และสามารถใช้ได้กับสถิติทุกประเภท เช่น รายได้ของนักท่องเที่ยว
การใช้จ่ายของผู้บริโภค เป็นต้น ตัวเลขในระดับนี้สามารถนำมาบวก ลบ คูณ หารในทางคณิตศาสตร์ได้
และสามารถนำมาหาอัตราส่วนได้ ดังนั้นตัวแปรที่มีมาตราวัดในลักษณะนี้ จึงสามารถใช้สถิติได้เกือบทุกประเภทในการวิเคราะห์
ตัวอย่างข้อมูลที่ได้จากการวัดโดยใช้มาตราอัตราส่วน (Ratio scale) เป็นข้อมูลที่มีลักษณะจำแนกกลุ่ม เรียงอันดับ
แบ่งเป็นช่วงเท่า ๆ กัน
และมีศูนย์แท้ สามารถเปรียบเทียบในเชิงอัตราส่วนได้ เช่น
1. รายได้ต่อเดือน บาท.................
2. อายุ ปี......................
3. ค่าใช้จ่าย
บาท......................
4. หนี้สิน .................บาท คิดเป็น .....% ของรายได้
5. สัดส่วนการถือครองที่ดิน
....................ไร่
ฯลฯ
จากที่กล่าวมาถึงประเภทของข้อมูล
สามารถสรุปประเภทของข้อมูลจำแนกตามมาตราวัดได้ดังตารางที่ 1.3 และ
1.4
ตารางที่
1.3 คุณสมบัติของประเภทข้อมูล
มาตรา
|
คุณสมบัติ
|
นามบัญญัติ (Nominal Scale)
เรียงลำดับ (Ordinal Scale)
อันตรภาค (Interval Scale)
อัตราส่วน (Ratio Scale)
|
ความแตกต่างกัน
ความแตกต่างกัน + ทิศทาง
ความแตกต่างกัน + ทิศทาง + ช่วงเท่ากัน + ศูนย์สมมุติ
ความแตกต่างกัน + ทิศทาง + ช่วงเท่ากัน + ศูนย์แท้
|
ตารางที่ 1.4 ลักษณะของข้อมูลสถิติสำหรับตัวแปรเดียว
ลักษณะของข้อมูล
|
สถิติที่ใช้
|
การนำเสนอข้อมูล
|
1. สเกลนามบัญญัติ
(Nominal Scale)
|
ความถี่
อัตราส่วนร้อยละ
|
ตารางแจกแจงความถี่
ร้อยละ สัดส่วน
|
2. สเกลอันดับ (Ordinal
Scale)
|
ความถี่
อัตราส่วนร้อยละ เปอร์เซ็นต์ไทล์
|
ตารางแจกแจงความถี่
ร้อยละ สัดส่วน
|
3. สเกลอันตรภาค
และ อัตราส่วน (Interval
and Ratio Scale)
|
ความถี่
อัตราส่วนร้อยละ ส่วนเบี่ยงเบนมาตรฐาน ความแปรปรวน พิสัย เปอร์เซ็นต์ไทล์ ค่าเฉลี่ย
|
ตารางแจกแจงความถี่
ค่าความเบ้ ค่าความโด่ง
|
1.5 ประชากรและกลุ่มตัวอย่าง
1.5.1 ประชากร (Population)
ประชากร หมายถึง หน่วยทุกหน่วย (ซึ่งอาจมีชีวิตหรือไม่มีชีวิตก็ได้) ที่เรา สนใจเช่น จำนวนคนไทยที่เป็นเพศชาย
ประชากรคือคนไทยทุกคนที่เป็นเพศชาย จำนวนรถยนต์ในจังหวัดหนองคาย ประชากรคือ
รถยนต์ทุกคันที่อยู่ในจังหวัดหนองคาย ฯลฯ
1.5.2 ตัวอย่าง (Sample)
ตัวอย่าง หรือ
กลุ่มตัวอย่าง หมายถึง หน่วยย่อย หรือตัวแทนของประชากรที่เราสนใจ ในการศึกษาหรือวิเคราะห์
เช่น จำนวนเกษตรกรในจังหวัดหนองคายซึ่งไม่สามารถจัดเก็บได้ทุกคน จึงต้องใช้ตัวอย่างซึ่งตัวอย่างจะต้องเป็นตัวแทนเกษตรกรในจังหวัดหนองคายที่สามารถสอบถามข้อมูลได้
ฯลฯ
1.6 โครงสร้างของข้อมูลทางสถิติเศรษฐศาสตร์
เนื่องจากข้อมูลทางเศรษฐกิจมีหลายประเภทซึ่งวิธีการทางสถิติและเศรษฐมิตินั้น
ในการวิเคราะห์ข้อมูลจึงควรทราบโครงสร้างของข้อมูลที่เราจะทำการศึกษา ทั้งนี้
ข้อมูลที่ทำการศึกษาแบ่งออกได้เป็น 4
ประเภทดังนี้
1.6.1
ข้อมูลตัดขวางตามเวลา (Cross-sectional data)
ข้อมูลตัดขวางตามเวลา หรือ
ข้อมูลภาคตัดขวาง เป็นข้อมูลที่รวบรวม ณ เวลาใดเวลาหนึ่ง เช่น ค่าใช้จ่ายของนักท่องเที่ยวต่อครั้งในการเดินทางมาประเทศไทย
ความพึงพอใจต่อการใช้บริการ ณ สถานที่บริการแห่งหนึ่ง เป็นต้น (ตัวอย่างแสดงไว้ในตารางที่ 1.5)
ตารางที่ 1.5 ตัวอย่างข้อมูลภาคตัดขวง
เลขที่แบบสอบถาม
|
เพศ
|
ระดับการศึกษา
|
รายได้
|
ค่าใช้จ่าย
|
1
2
3
.
.
.
n
|
ชาย
หญิง
ชาย
.
.
.
หญิง
|
ประถมศึกษา
ปริญญาตรี
มัธยมศึกษา
.
.
.
ประถมศึกษา
|
50,000
60,000
120,000
.
.
.
50,000
|
30,000
60,000
238,000
.
.
.
35,000
|
1.6.2
ข้อมูลอนุกรมเวลา (Time Series data)
เป็นข้อมูลที่รวบรวมตามระยะเวลาที่มีการกำหนด
ช่วงระยะเวลาของข้อมูลที่ชัดเจน เช่น จำนวนและรายรับที่ได้รับจากนักท่องเที่ยว ต่างชาติของไทยระหว่างปี
พ.ศ. 2546-2550 เป็นต้น ข้อมูลประเภทนี้มีความถี่แตกต่างกันหลายรูปแบบ
เช่น ข้อมูลรายวัน (Daily data) ข้อมูลรายสัปดาห์
(Weekly data) ข้อมูลรายไตรมาส (Quarterly data) ข้อมูลรายเดือน (Monthly data) ข้อมูลรายปี
(Annual data) เป็นต้น ทั้งนี้ตัวอย่างของข้อมูลอนุกรมเวลาแสดงไว้ในตารางที่
1.6
ตารางที่ 1.6 ตัวอย่างข้อมูลอนุกรมเวลา
ปี
|
ยอดขาย
|
จำนวนสาขา
|
รายรับรวม
|
ค่าใช้จ่าย
|
2540
2541
2542
.
.
.
2555
|
50,000
60,000
120,000
.
.
.
500,000
|
18
19
21
.
.
.
29
|
150,000
160,000
220,000
.
.
.
750,000
|
130,000
150,000
238,000
.
.
.
350,000
|
1.6.3 ข้อมูลผสม (Pooled
cross sections)
ข้อมูลผสม
เป็นข้อมูลที่มีลักษณะที่ผสมระหว่างข้อมูลตัดขวางและข้อมูลอนุกรมเวลาตัวอย่างเช่น
การสำรวจข้อมูลตัดขวางตามเวลา 2
ชุดต่างเวลากัน ชุดแรกสำรวจในปี1985 อีกชุดหนึ่งสำรวจในปี1990
ในปี1985 สุ่มสำรวจข้อมูลครัวเรือนมีตัวแปรคือ
รายได้ การออม ขนาดครอบครัว และในปี 1990
ทำสุมสำรวจครัวเรือนใหม่โดยมีตัวแปรเหมือนกัน
เราเรียกข้อมูลประเภทนี้ว่าเป็น Pool
cross section ข้อมูลผสมนี้บ่อยครั้งใช้ในการวิเคราะห์ผลของนโยบายรัฐบาลโดยเก็บข้อมูลก่อนใช้นโยบายและหลังใช้นโยบาย ความสำคัญของการวิเคราะห์ข้อมูลผสมเป็นการวิเคราะห์การเปลี่ยนแปลงของตัวแปรระหว่างเวลา
(ตัวอย่างแสดงในตารางที่ 1.7)
1.6.4
ข้อมูลตัดภาคขวางทางยาว (Panel or Longitudinal data)
Panel
data เป็นข้อมูลที่ประกอบด้วยอนุกรมเวลาของแต่ละข้อมูลตัดขวางตามเวลา ตัวอย่างเช่น เรามีข้อมูล ค่าจ้าง การศึกษา การจ้างงานของบุคคลหนึ่งจำนวน10ปี
หรือเราเก็บข้อมูลของธุรกิจ เช่น การลงทุน การเงิน ของธุรกิจเดิมจำนวน 5 ปี Panel
data แตกต่างจาก ข้อมูลผสมคือ panel
data ใช้ตัวอย่างเดิมแต่เวลาเปลี่ยนไปเช่น บุคคล ธุรกิจ ประเทศ ส่วนข้อมูลผสมใช้ตัวอย่างแบบสุ่มซึ่งตัวอย่างจะเปลี่ยนไป
(ตัวอย่างข้อมูลประเภทนี้แสดงในตารางที่ 1.8)
ตารางที่ 1.7 ตัวอย่างข้อมูลผสม
ปี
|
หมายเลขสาขา
|
จำนวนครั้งเฉลี่ยในการเยี่ยมชม
|
รายรับขั้นต่ำ
ต่อวัน
|
ค่าใช้จ่ายเฉลี่ยของพนักงาน
|
2540
2541
2542
2540
2541
2542
|
A
A
A
B
B
B
|
5
6
12
16
17
11
|
150,000
160,000
220,000
150,000
160,000
220,000
|
130,000
150,000
238,000
130,000
150,000
238,000
|
ตารางที่ 1.8 ตัวอย่างข้อมูลภาคขวางทางยาว
ปี
|
หมายเลขสาขา
|
จำนวนพนักงาน
|
รายรับของสาขา
|
ค่าใช้จ่ายของสาขา
|
2540
2541
2542
2540
2541
2542
|
A
A
A
B
B
B
|
5
6
12
16
17
11
|
150,000
160,000
220,000
150,000
160,000
220,000
|
130,000
150,000
238,000
130,000
150,000
238,000
|
สำหรับในการศึกษาในรายวิชานี้ จะมุ่งเน้นในการพิจารณาข้อมูลภาคตัดขวาง
และข้อมูลอนุกรมเวลาเบื้องต้น สำหรับการพยากรณ์เบื้องต้นเท่านั้น
ไม่มีความคิดเห็น:
แสดงความคิดเห็น