การเลือกสถิติวิเคราะห์ข้อมูลเป็นขั้นตอนที่สำคัญขั้นตอนหนึ่งของการวิจัย หลังจากที่ผู้วิจัยเก็บรวบรวมข้อมูลและตรวจสอบความถูกต้องของข้อมูลเพื่อ เตรียมนำไปทำการวิเคราะห์ ในขั้นตอนของการวิเคราะห์ข้อมูลผู้วิจัยจะต้องพิจารณาตัดสินใจเลือกใช้สถิติ ที่เหมาะสมสำหรับงานวิจัยนั้นโดยข้อสำคัญที่ช่วยให้สามารถเลือกใช้สถิติที่ เหมาะสมได้ ผู้วิจัยต้องวิเคราะห์งานวิจัยที่วางแผนไว้ให้เข้าใจอย่างถ่องแท้ถึงวัตถุ ประสงค์ สมมติฐาน ตัวแปรที่ศึกษาวิจัย และประโยชน์ของการนำข้อมูลไปใช้ รวมทั้งต้องมีความเข้าใจเทคนิคการวิเคราะห์ของสถิติประเภทต่างๆ ก่อนการตัดสินใจเลือกใช้สถิติตัวใดสำหรับวิเคราะห์ข้อมูลการวิจัยเรื่อง นั้นๆ
ประเภทของสถิติที่ใช้วิเคราะห์ข้อมูลการวิจัย
สถิติวิเคราะห์ข้อมูลการวิจัยพฤติกรรมสุขภาพ โดยทั่วไป อาจแบ่งเป็น 2 ประเภทหลักๆ คือ
1. สถิติพรรณา (Descriptive Statistics) เป็นสถิติเบื้องต้นที่ใช้วิเคราะห์เพื่อบรรยายสรุปลักษณะของประชากรหรือตัว อย่างที่ศึกษา ตามข้อมูลที่รวบรวมได้จากตัวแปรที่กำหนด ซึ่งส่วนใหญ่จะใช้การแจกแจงความถี่ (Frequencies) ของกลุ่มย่อยในแต่ละตัวแปร ค่าเฉลี่ย (mean) ค่ามัธยฐาน (median) หรือ ค่าเบี่ยงเบนมาตรฐาน (Standard deviation) เป็นต้น
2. สถิติวิเคราะห์ (Analytical Statistics) เป็นสถิติที่ใช้ในการทดสอบสมมติฐานการวิจัย เพื่ออธิบายข้อพิสูจน์หรือข้อค้นพบที่ได้จากการวิจัย สถิติวิเคราะห์ที่ใช้ในการวิจัยพฤติกรมสุขภาพส่วนใหญ่ เป็นสถิติที่ใช้เพื่อทดสอบความสัมพันธ์ระหว่างตัวแปร ทดสอบความแตกต่างของค่าเฉลี่ย สถิติที่ใช้เพื่ออธิบายตัวแปรที่ศึกษา เช่น สถิติ t-test, F-test, ANOVA เป็นต้น ซึ่งจะได้กล่าวถึงการเลือกใช้สถิติแต่ละประเภทต่อไป
จำนวนตัวแปรและระดับการวัด
ตัวแปร (Variables) คือ คุณสมบัติของประชากรที่ศึกษา เช่น ตัวแปรด้านคุณลักษณะประชากร ได้แก่ เพศ อายุ การศึกษา อาชีพ เป็นต้น หรือตัวแปรด้านพฤติกรรมสุขภาพได้แก่ ความรู้ทางสุขภาพ การรับรู้ทางสุขภาพและความเชื่อและค่านิยมเกี่ยวกับสุขภาพ หรือการปฏิบัติพฤติกรรมสุขภาพด้านต่างๆ เป็นต้น
การวิเคราะห์ข้อมูลในงานวิจัยพฤติกรรมสุขภาพ ควรจะทำการวิเคราะห์เป็นขั้นๆ ตามลำดับตั้งแต่การวิเคราะห์ตัวแปรครั้งละ 1 ตัวแปร (Univariate Analysis) การวิเคราะห์ตัวแปรครั้งละ 2 ตัว (Bivariate Analysis) และการวิเคราะห์ตัวแปรมากกว่า 2 ตัวแปร ขึ้นไป (Multivariate Analysis)
การวิเคราะห์ตัวแปรครั้งละ 1 ตัวแปร จะทำให้ทราบลักษณะทั่วๆไปของตัวแปรนั้นๆ เช่น การกระจาย ค่าเฉลี่ย, ค่าเบี่ยงเบนมาตรฐานเป็นต้น การที่ทราบลักษณะเบื้องต้นของตัวแปรแต่ละตัวโดยเฉพาะอย่างยิ่งการกระจายของ ข้อมูลจะทำให้การจัดกระทำข้อมูลและการวิเคราะห์ข้อมูลในขั้นตอนต่อๆไปถูก ต้องเหมาะสมยิ่งขึ้น ส่วนการวิเคราะห์ตัวแปรครั้งละ 2 ตัวแปรจะเป็นการวิเคราะห์เพื่อพิจารณาความแตกต่างหรือความสัมพันธ์ระหว่าง ตัวแปรทั้งสอง อย่างไรก็ตามในงานวิจัยพฤติกรรมสุขภาพจะมีตัวแปรหรือปัจจัยที่เกี่ยวข้อง สัมพันธ์กับพฤติกรรมาสุขภาพมากกว่า 1 ตัวแปรขึ้นไป ดังนั้นการวิเคราะห์ข้อมูลเชิงพหุหรือ Multivariate Analysis จึงมีความหมายและมีความสำคัญต่อการวิจัยเป็นอย่างมาก แต่ทั้งนี้ไม่ได้หมายความว่า การวิเคราะห์ตัวแปรครั้งละ 1 หรือ 2 ตัวแปรไม่มีความสำคัญเพราะการวิเคราะห์ดังกล่าวจะช่วยให้เข้าใจลักษณะตัวแปร และเป็นพื้นฐานในการวิเคราะห์เชิงพหุต่อไป
ข้อสำคัญอีกประการหนึ่งที่นักวิจัยทางพฤติกรรมสุขภาพต้องทำความเข้าใจ วางแผนตั้งแต่ขั้นตอนแรกๆก่อนที่จะสร้างเครื่องมือรวบรวมข้อมูลตามตัวแปร คือ ระดับการวัดของตัวแปรซึ่งมีความแตกต่างกันและเป็นปัจจัยสำคัญในการเลือก สถิติวิเคราะห์ข้อมูล เพราะสถิติทุกตัวมีข้อจำกัดเกี่ยวกับระดับการวัดของตัวแปรทั้งสิ้น อย่างไรก็ตามสถิติบางตัวก็มีความยืดหยุ่นในเรื่องการวัดระดับของตัวแปร แต่สถิติบางตัวมีความเข้มงวดมาก
ระดับการวัดของตัวแปร แบ่งได้เป็น 4 กลุ่มดังนี้
1) การวัดระดับกลุ่ม (Categorical / Nominal scale) การวัดในระดับนี้เป็นคุณสมบัติที่ต่ำที่สุดในการวัดทางคณิตศาสตร์ผู้วิจัย เพียงแต่พิจารณาคุณสมบัติของตัวแปรและแบ่งเป็นประเภทย่อยๆตามคุณลักษณะที่ แตกต่างหรือเหมือนกัน เช่น ตัวแปรเพศ แบ่งได้เป็นสองกลุ่ม คือ ชาย และหญิง สถานภาพสมรส แบ่งเป็น โสด คู่ ม่าย/หย่า/แยก เป็นต้น
2) การวัดระดับอันดับ (Ordinal scale) เป็นระดับการวัดที่สูงขึ้นกว่าระดับกลุ่ม กล่าวคือ นอกจากจะสามารถระบุความแตกต่าง/ความเหมือนกันของตัวแปรได้แล้ว ยังสามารถจัดเรียงอันดับที่ต่อเนื่องกันได้อย่างมีเหตุผล เช่น คะแนนความรู้ จาก 20 คะแนน อาจแบ่งเป็น 1-5, 6-10, 11-15, และ 16-20 คะแนน เป็นต้น
3) การวัดระดับช่วง (Interval scale) เป็นระดับการวัดที่บอกค่าของสิ่งที่วัดได้ละเอียดขึ้น สามารถบอกปริมาณความแตกต่างได้ เช่น อุณหภูมิ คะแนนความรู้ในเรื่องต่างๆ คะแนนทัศนคติ เป็นต้น (โดยที่คะแนนการวัดในด้านต่างๆ เป็นคะแนนจริงที่ยังไม่ได้นำไปจัดอันดับ หรือแบ่งเกรดยกตัวอย่างเช่น คนๆหนึ่งได้คะแนนความรู้เรื่องโรคเอดส์ 12 จาก 20 คะแนน)
4) การวัดอัตราส่วน (Ratio scale) เป็นระดับการวัดที่สามารถวัดได้ละเอียดที่สุดที่มีค่าจากจุดเริ่มต้นที่เป็น ศูนย์แท้ คือ ถ้าการวัดนั้นมีค่าตัวเลขที่ได้เป็นศูนย์ แสดงว่าสิ่งที่วัดนั้นมีค่าเป็นศูนย์เช่นกัน นอกจากนี้การวัดอัตราส่วนยังบอกความแตกต่างของสิ่งที่วัดได้เช่นเดียวกับการ วัดระดับช่วงตัวแปรที่มีการวัดในระดับนี้เช่น น้ำหนัก ความเร็ว ความสูง เป็นต้น
หลักในการเลือกใช้สถิติที่เหมาะสม
นักวิจัยบางท่านอาจมีคำถามว่าจะเลือกใช้สถิติอะไรในการวิเคราะห์ข้อมูลจึงจะ ถูกต้องเหมาะสม หลายท่านนำข้อมูลที่รวบรวมได้ไปปรึกษาผู้เชี่ยวชาญหรือนักสถิติว่าจะใช้ สถิติอะไรดี เพราะผู้วิจัยไม่ได้วางแผนการวิเคราะห์ข้อมูลไว้ตั้งแต่ต้น ซึ่งนักสถิติเองก็คงตอบไม่ได้จนกว่าจะทราบรายละเอียดของเป้าหมาย วัตถุประสงค์และสมมติฐานของการวิจัยที่ท่านทำ รวมทั้งทราบรายละเอียดของข้อมูลที่รวบรวม ลักษณะการวัดของตัวแปรว่าเป็นอย่างไร จึงสามารถให้คำแนะนำได้
อย่างไรก็ตาม ผู้วิจัยควรจะวางแผนการใช้สถิติวิเคราะห์ข้อมูล โดยอาจพิจารณาเลือกสถิติจากการตอบคำถามต่อไปนี้ให้ได้อย่างชัดแจ้ง
1. ท่านต้องการวิเคราะห์ตัวแปรครั้งละกี่ตัว
2. ข้อมูลที่รวบรวมได้นั้นเป็นข้อมูลที่ได้จากการวัดตัวแปรในระดับใด พิจารณาจากระดับการวัดของตัวแปรตามที่ได้กล่าวมาข้างต้น เนื่องจากข้อมูลที่ได้จากการวัดในระดับที่แตกต่างกัน จะต้องใช้สถิติที่อยู่ในระดับไม่เกินของระดับการวัดนั้นๆ เช่น
ถ้า คำตอบ คือ | กลุ่มสถิติที่ใช้ ได้แก่ |
- 1 ตัว | Univariate Analysis Statistics |
- 2 ตัว | Bivariate Analysis Statistics |
- 3 ตัว | Multivariate Analysis Statistics |
A. Univeriate Analysis (การวิเคราะห์ตัวแปรครั้งละ 1 ตัวแปร) สถิติที่ใช้จะเป็นสถิติพรรณา เช่น การวัดการกระจาย การวัดแนวโน้มเข้าสู่ส่วนกลาง เป็นต้น
Scale of Measurement (ระดับการวัดตัวแปร) | Statistics (สถิติ) | ||
Measures of central Tendency (การวัดแนวโน้มเข้าสู่ส่วนกลาง) | Measures of Descripsion (การวัดระดับการกระจาย) | Frequencies (การแจกแจงความถี่) (ค่าร้อยละ) | |
Categorical Nominal scale (การวัดระดับกลุ่ม) | Mode ฐานนิยม | Relative frequency of model value (ค่าความถี่ของฐานนิยม) | - Relative frequencies e.q. percentages |
Ordinal scale (การวัดระดับอันดับ) | Median ค่ามัธยฐาน | Inter-quartile deviation ( ส่วนเบี่ยงเบนควอไทล์) | - Relative frequencies e.q. percentages |
Interval scale* (การวัดระดับช่วง) | Mean ** ค่าเฉลี่ย | -(standard deviation) (ค่าเบี่ยงเบนมาตรฐาน) | - Relative frequencies e.q. percentages |
* นอกจากนี้ยังมีสถิติเกี่ยวกับ Symmetry Peakedness, Normality
* * ในกรณีที่ข้อมูลมีการกระจายในลักษณะโค้ง เบ้มาก ควรใช้ Median แทนหรือไม่รวม Case ที่มีค่าต่ำสุด หรือสูงสุดที่ห่างจากกลุ่ม เป็นต้น
B. Bivariate Analysis (การวิเคราะห์ตัวแปรครั้งละ 2 ตัวแปร)
ในกรณีที่ทำการวิเคราะห์ตัวแปรครั้งละ 2 ตัวแปร หรือมากกว่า จะต้องตอบคำถามต่อไปนี้ คือ
1) ในการวิจัยครั้งนี้ แผนการวิเคราะห์ได้กำหนดไว้อย่างชัดเจนหรือไม่ว่าตัวแปรใดเป็นตัวแปรอิสระ และตัวแปรใดเป็นตัวแปรตาม เนื่องจากจะมีกลุ่มสถิติแยกออกเป็นสองกลุ่มใหญ่ๆ คือ Symmetric Analysis เป็นกลุ่มสถิติสำหรับวิเคราะห์ในกรณีที่ไม่กำหนดว่าตัวแปรใดเป็นตัวแปรอิสระ และตัวแปรใดเป็นตัวแปรตาม ส่วน Asymmetric Analysis ควรจะใช้สถิติสำหรับการวิเคราะห์ เมื่อกำหนดตัวแปรอิสระและตัวแปรตามการพิจารณาว่าตัวแปรใดเป็นตัวแปรอิสระ หรือตัวแปรตามนั้น อาจพิจารณาได้จากสมมติฐานของการวิจัย หรือกรอบแนวคิดในการวิจัย
2) จะต้องตอบคำถามว่า ต้องการจะวิเคราะห์อะไร ซึ่งได้แก่ Test of Significance เช่น ความแตกต่างของค่าเฉลี่ยหรือ Strength of Relationship เช่น ความสัมพันธ์ระหว่างตัวแปรดังได้กล่าวมาแล้ว ตัวอย่างสถิติที่ใช้มีข้อสังเกตเบื้องต้นว่าสถิติแต่ละตัวที่จะนำมาใช้ในการ วิเคราะห์นั้นมีข้อบ่งใช้หรือข้อตกลงเบื้องต้นหรือพูดง่ายๆว่า ข้อจำกัดในการใช้อยู่ด้วย ดังนั้น จึงต้องแน่ใจว่าในการวิเคราะห์ข้อมูลโดยใช้สถิติแต่ละตัวไม่ขัดกับข้อตกลง เบื้องต้นของสถิตินั้นๆ มิฉะนั้นแล้วจะทำให้ผลที่ได้จากการวิเคราะห์ผิดพลาดหรือมีความเที่ยงลดลง ตัวอย่างเช่น ข้อมูลที่มีความสัมพันธ์เชิงเส้นโค้งสูงเมื่อทำการวิเคราะห์ด้วยสถิติ Regression เชิงเส้นตรงจะไม่พบความสัมพันธ์กันเป็นต้น สถิติหลายตัวที่ใช้วิเคราะห์ข้อมูลต้องมาจากกลุ่มประชากรที่มีการกระจายแบบ โค้งปกติ (Observations are drawn from a population normally distributed on the interval scaled variables)
ตัวอย่าง
1. ในกรณีที่ตัวแปรทั้งสองตัว ที่นำมาวิเคราะห์ในระดับ Interval
1) เมื่อตัวแปรหนึ่งเป็นตัวแปรอิสระและอีกตัวแปรเป็นตัวแปรตาม (Asymmetric analysis) จะมีสถิติที่สำคัญ คือ
1.1 ) Regression coefficient ใช้วิเคราะห์ความสำคัญของตัวแปรอิสระที่มีต่อตัวแปรตาม โดยพิจารณาจากค่า Beta ซึ่งมีข้อตกลงเบื้องต้นว่าความสัมพันธ์ของตัวแปรทั้ง 2 จะต้องเป็นความสัมพันธ์แบบเส้นตรงถ้าทดสอบลักษณะของความสัมพันธ์แล้วพบว่า เป็นแบบเส้นโค้งควรใช้สถิติในข้อที่ 2 คือ
1.2 ) Coefficient from Curvilinear Regression
2. ถ้าหากการวิจัยนั้นไม่ได้กำหนดว่าตัวแปรใดเป็นตัวแปรอิสระและตัวแปรใดเป็นตัวแปรตาม (Symmetric Analysis) พิจารณาจาก
2.1) ถ้าต้องการทดสอบความแตกต่างของค่าเฉลี่ย ควรใช้สถิติ t-test for paired observations (Samples paired t-test)
2.2) ถ้าต้องการวิเคราะห์ความสัมพันธ์ของตัวแปร โดยที่ความสัมพันธ์มีลักษณะเป็นเส้นตรง ควรใช้สถิติในกลุ่ม Correlation คือ
- Pearson's product moment correlation
- Biserial correlation ในกรณีที่ตัวแปรหนึ่งวัดในระดับ Interval แต่ได้จัดกระทำข้อมูลใหม่ให้เหลือเพียง 2 คำ คือ 1 กับ 0 (dichotomous variable) และต้องการคาดคะเนความสัมพันธ์ของตัวแปรในระดับ Interval (ก่อนมีการจัดกระทำข้อมูล)
- Tetrachoric correlation มีลักษณะคล้าย Biserial correlation โดยที่ตัวแปรทั้งสองมีการจัดกระทำให้อยู่ในลักษณะ dichotomous
2. ตัวแปรหนึ่งวัดในระดับ Interval อีกตัวแปรวัดในระดับ Nominal
1) ตัวแปรที่วัดในระดับ Interval เป็นตัวแปรตาม
1.1 ) ต้องการทดสอบความแตกต่างของค่าเฉลี่ยใช้ Analysis of Variance (F-test) ถ้าตัวแปรที่วัดในระดับ Nominal แบ่งเป็น 2 กลุ่ม ใช้ Student' s t-test แต่ถ้าต้องการทดสอบความแตกต่างของความแปรปรวนใช้สถิติ ANOVA (Bartlett's t-test)
1.2) ถ้าต้องการประเมิน Strength of relationship ระหว่างตัวแปรทั้งสองใช้พิจารณาจาก Etan2 หรือ Omega2 ซึ่งได้จากการวิเคราะห์ ANOVA
2) ในกรณีที่ตัวแปรที่วัดในระดับ Interval เป็นตัวแปรอิสระและตัวแปรตาม Nominal เป็น two-point variable ให้อนุโลมใช้สถิติในข้อ 1) ได้
3. ตัวแปรทั้ง 2 ตัว วัดในระดับ Ordinal
1) ตัวแปรหนึ่งเป็นตัวแปรอิสระและอีกตัวแปรเป็นตัวแปรตาม สถิติที่เหมาะสม คือ Somern' d ซึ่งเป็นการวัดความสัมพันธ์ระหว่างตัวแปร 2 ตัว ที่วัดในระดับ Ordinal
2) ไม่กำหนดว่าตัวแปรใดเป็นตัวแปรอิสระ และตัวแปรใดเป็นตัวแปรตาม
2.1) ถ้าต้องการพิจารณาอันดับของข้อมูลคล้ายการวัดในระดับ Interval ใช้สถิติ Spearman' s rho ซึ่งไม่สามารถใช้ได้อย่างเหมาะสมหลายกรณี
2.2) สถิติที่เหมาะสมกว่า Spearman' s rho คือ
- Kendall, s tau a , Kendall's tau หรือ Kendall, s tau c
- Goodman and Kruskal, s gamma
- Kim' s d เป็นต้น
4. ตัวแปรหนึ่งวัดในระดับ Ordinal และอีกตัวแปรวัดในระดับ Nominal
1) ตัวแปรที่วัดในระดับ Ordinal เป็นตัวแปรตามและตัวแปรที่วัดในระดับ Nominal เป็น two-point variable อนุโลมให้ใช้ Somer' s d ได้ นอกจากนี้ในการทดสอบความแตกต่างอาจใช้ Median test , Mann-Whitney U test เป็นต้น อย่างไรก็ตามถ้าการทดลองเป็นลักษณะ "Matched samples" ซึ่งหมายถึงตัวอย่างในกลุ่มหนึ่ง Match กับอีกกลุ่มหนึ่งของลักษณะของตัวแปรที่วัดในระดับ Nominal ควรใช้ Sign test หรือ Wilcoxon signed rank test
2) ในกรณีที่ไม่ได้กำหนดว่าตัวแปรใดเป็นตัวแปรอิสระและตัวแปรใดเป็นตัวแปรตาม แล้ว จะพบว่ายังไม่มีสถิติที่เหมาะสมกับการวัดในระดับนี้ ผู้วิจัยจะต้องตัดสินใจเลือกใช้สถิติในระดับที่สูงกว่าหรือต่ำกว่าต่อไป ในทางปฏิบัติอาจเลือกใช้สถิติในระดับที่ต่ำกว่า เช่น ในระดับ Nominal ทั้งตัวแปร เช่นในกรณีตัวอย่างในข้อ 5 ต่อไปนี้
5. ตัวแปรทั้ง 2 ตัวแปรวัดในระดับ Nominal
1) มีการกำหนดว่าตัวแปรใดเป็นตัวแปรอิสระและตัวแปรใดเป็นตัวแปรตาม ซึ่งมีสถิติที่เหมาะสมคือ
- Goodman and Kendall' s tau b และ
- Asymmetric lambda
2) ไม่มีการกำหนดว่าตัวแปรใดเป็นตัวแปรอิสระหรือตัวแปรตาม สถิติที่เหมาะสมได้แก่
- Symmetric lambda
- Cramer' d
- Contingency Coefficient ซึ่งไม่นิยมใช้เนื่องจากค่า Coefficient ที่ได้อาจมีค่าสูงสุด (Upper limit) น้อยกว่า 1 ได้ ทำให้แปรผลยากเมื่อต้องการเปรียบเทียบกับงานวิจัยอื่นๆ หรือสถิติอื่นๆที่มีค่าสูงสุดเท่ากับ 1
- Chi-square ใช้พิจารณานัยสำคัญทางสถิติของความสัมพันธ์ของตัวแปรที่ทำการวิเคราะห์ เป็นต้น
3) ในกรณีที่ตัวแปรทั้งสองตัว เป็น two-point scales variable และไม่กำหนดว่าตัวแปรใดเป็นตัวแปรอิสระและตัวแปรใดเป็นตัวแปรตาม การวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรควรใช้สถิติ
- Yule' s Q หรือ
- Phi เป็นต้น
C. Multivariate Analysis (การวิเคราะห์ตัวแปรมากกว่า 2 ตัวแปรขึ้นไป)
1. ในกรณีที่มีตัวแปรตามมากกว่า 1 ตัว วัดในระดับ Interval และตัวแปรอิสระมากกว่า 1 ตัววัดในระดับ Interval เช่นเดียวกัน สถิติที่ควรเลือกใช้ คือ
- Multiple regression หรือ
- Multiple curvilinear regression แล้วแต่กรณี
2. กรณีที่ไม่ได้กำหนดตัวแปรอิสระและตัวแปรตามควรใช้สถิติ
- Multiple correlation
3. อย่างไรก็ตามในการวิจัยพฤติกรรมสุขภาพหรือสุขศึกษา ตัวแปรอิสระส่วนมากจะวัดในระดับต่ำกว่า Interval ดังนั้นในกรณีที่ตัวแปรตาม 1 ตัว วัดในระดับ Interval และ ตัวแปรอิสระมากกว่า 1 ตัว วัดในระดับที่ต่ำกว่า Interval หรือวัดในระดับต่างๆกัน ควรใช้การสถิติวิเคราะห์ที่เรียกว่า Multiple Classification Analysis (MCA) หรือสถิติที่เหมาะสม
ปัญหาการใช้สถิติวิเคราะห์ข้อมูลในการวิจัยพฤติกรรมสุขภาพ
ปัญหาเกี่ยวกับการใช้สถิติวิเคราะห์ข้อมูลในการวิจัยพฤติกรรมสุขภาพ ที่มักพบเสมอมี ซึ่งนักวิจัยพึงระวัง คือ
1. ขาดการวางแผนการเลือกสถิติในการวิจัย และการวิเคราะห์ข้อมูลตั้งแต่ต้น ทำให้ผู้วิจัยสร้างแบบสอบถามที่ใช้ในการรวบรวมข้อมูลโดยไม่ได้คำนึงถึงการ แปลผลข้อมูลที่ได้ให้อยู่ในรูปของคะแนน โดยเฉพาะคำถามในส่วนของตัวแปรด้านพุทธิพิสัย เจตพิสัย และการปฏิบัติพฤติกรรมสุขภาพ ดังนั้นคำถามแต่ละข้อใน 1 หมวดตัวแปรดังกล่าวจึงพบว่ามีความหลากหลายในการตอบ ซึ่งทำให้เกิดปัญหาในการกำหนดคะแนนเพื่อนำไปวิเคราะห์ในขั้นตอนต่อไป
ตัวอย่าง การถามพฤติกรรมการปฏิบัติ บางข้อมีคำตอบให้เลือก 3 คำตอบคือ
1= ปฏิบัติทุกวัน 2=ปฏิบัติเป็นบางวัน 3=ไม่เคยปฏิบัติ
แต่คำถามบางข้อซึ่งอยู่ในการถามพฤติกรรมการปฏิบัติเช่นกัน มีคำตอบให้เลือก 4 คำตอบ คือ
1= ปฏิบัติบ่อยครั้ง 2= ปฏิบัตินานๆครั้ง 3= ปฏิบัติน้อยครั้ง 4= ไม่เคยปฏิบัติเลย เป็นต้น
ซึ่งปัญหาในลักษณะเช่นนี้พบบ่อยมาก ดังนั้นนักวิจัยจะต้องวางแผนการเลือกสถิติในการวิจัย และการวิเคราะห์ข้อมูลให้เหมาะสมกับสมมติฐานการวิจัยตั้งแต่ต้นและสร้างแบบ สอบถามการวิจัยอย่างรอบคอบโดยพิจารณาตัวแปรและระดับการวัดให้สอดคล้องกับ สถิติที่เลือกใช้ให้เหมาะสมก่อนที่จะนำแบบสอบถามไปใช้เก็บข้อมูลจริง
2. การเลือกใช้สถิติโดยไม่คำนึงถึงข้อตกลงเบื้องต้นของสถิตินั้นๆ เช่น การวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรอิสระกับตัวแปรตาม และใช้สถิติ X2-test โดยที่การกระจายของข้อมูลที่เป็นตัวแปรตามเบ้ไปทางซ้ายมาก ทำให้มี cell ใด cell หนึ่งหรืออาจมากกว่าไม่มีข้อมูลเลย หรือการใช้ Z-test โดยไม่ทราบความแปรปรวนของประชากร (Population Variance) การใช้การวิเคราะห์ความแปรปรวน (ANOVA) ของข้อมูลที่วัดเป็นความถี่ เป็นต้น ดังนี้การอ่านผลการวิเคราะห์จะไม่ถูกต้องและไม่น่าเชื่อถือ
3. ขาดความสอดคล้องกันระหว่างวัตถุประสงค์และสมมติฐานของการวิจัย กับสถิติที่ใช้ ทำให้ผลการวิเคราะห์จึงไม่สนองตอบต่อสมมติฐาน และคำถามการวิจัย เช่น ต้องการศึกษาปัจจัยต่างๆที่มีความสัมพันธ์กับพฤติกรรมการปฏิบัติเกี่ยวกับ สุขภาพ แต่ผู้วิจัยเลือกสถิติ ANOVA ทำให้การสรุปผลการวิจัยเกิดข้อผิดพลาดในการใช้ประโยชน์จากผลการวิจัยเป็นต้น
4. การวิเคราะห์เน้นเฉพาะประเด็นย่อยของตัวแปร โดยไม่วิเคราะห์ผลในภาพรวมของตัวแปร เช่น การเปรียบเทียบความแตกต่างระหว่างค่าเฉลี่ยของความรู้เป็นรายข้อ ใช้สถิติ t-test และไม่มีการวิเคราะห์ผลจากค่าเฉลี่ยรวมของความรู้ทุกข้อ หรือการเปรียบเทียบความแตกต่างระหว่างประชากรหลายกลุ่มตามตัวแปรอิสระทีละ ตัวโดยใช้การวิเคราะห์ความแปรปรวนทางเดียว (One-way ANOVA) แทนที่จะใช้การวิเคราะห์ความแปรปรวนแบบหลายทาง (Factorial ANOVA) ซึ่งสามารถศึกษาปฏิสัมพันธ์ร่วมระหว่างตัวแปรได้ด้วย หรือการเปรียบเทียบตามตัวแปรตามหลายตัว แต่ทำการแยกวิเคราะห์ทีละตัว (Univariate) แทนที่น่าจะใช้การเปรียบเทียบตัวแปรตามหลายตัวไปพร้อมกัน (Multivariate) เป็นต้น
โดยสรุปแล้วนักวิจัยทางพฤติกรรมสุขภาพ จะต้องวางแผนการเลือกใช้สถิติและการวิเคราะห์ข้อมูลให้เหมาะสมและถูกต้อง โดยการเลือกสถิติในการวิจัยเรื่องหนึ่งๆ จะต้องพิจารณากันให้สอดคล้องกันตั้งแต่ รูปแบบการวิจัย วัตถุประสงค์ สมมติฐานการวิจัยตัวแปรในการวิจัย ระดับการวัดตัวแปร และเครื่องมือในการรวบรวมข้อมูล เพราะในทุกขั้นตอนของการวิจัยจะมีความสัมพันธ์ต่อเนื่องกันทั้งสิ้น ดังนั้นในกรณีที่ผู้วิจัยไม่ทราบหรือไม่แน่ใจว่าจะใช้สถิติอะไรจึงจะเหมาะสม ก็ควรขอคำปรึกษาจากผู้เชี่ยวชาญ หรือนักสถิติเพื่อไม่ให้เกิดข้อผิดพลาดในการวิจัย
thank you so much:)
ตอบลบขอบคุณครับ ถ้าจะต่อยอช่วยกันlink ขยายความและยกตัวอย่างสถิติที่ยกมาด้วยจะขอบคุณมากครับ
ตอบลบ