++

...+

Theขี้ฝุ่นริมทาง

วันศุกร์ที่ 16 กันยายน พ.ศ. 2548

เทคนิคการเลือกสถิติวิเคราะห์ในงานวิจัยพฤติกรรมสุขภาพ

มณีรัตน์ ธีระวิวัฒน์. วารสารเพื่อนสุขภาพ ปีที่ 12 ฉบับที่ 1 พ.ศ. 2543

การเลือกสถิติวิเคราะห์ข้อมูลเป็นขั้นตอนที่สำคัญขั้นตอนหนึ่งของการวิจัย หลังจากที่ผู้วิจัยเก็บรวบรวมข้อมูลและตรวจสอบความถูกต้องของข้อมูลเพื่อ เตรียมนำไปทำการวิเคราะห์ ในขั้นตอนของการวิเคราะห์ข้อมูลผู้วิจัยจะต้องพิจารณาตัดสินใจเลือกใช้สถิติ ที่เหมาะสมสำหรับงานวิจัยนั้นโดยข้อสำคัญที่ช่วยให้สามารถเลือกใช้สถิติที่ เหมาะสมได้ ผู้วิจัยต้องวิเคราะห์งานวิจัยที่วางแผนไว้ให้เข้าใจอย่างถ่องแท้ถึงวัตถุ ประสงค์ สมมติฐาน ตัวแปรที่ศึกษาวิจัย และประโยชน์ของการนำข้อมูลไปใช้ รวมทั้งต้องมีความเข้าใจเทคนิคการวิเคราะห์ของสถิติประเภทต่างๆ ก่อนการตัดสินใจเลือกใช้สถิติตัวใดสำหรับวิเคราะห์ข้อมูลการวิจัยเรื่อง นั้นๆ

ประเภทของสถิติที่ใช้วิเคราะห์ข้อมูลการวิจัย
สถิติวิเคราะห์ข้อมูลการวิจัยพฤติกรรมสุขภาพ โดยทั่วไป อาจแบ่งเป็น 2 ประเภทหลักๆ คือ
1. สถิติพรรณา (Descriptive Statistics) เป็นสถิติเบื้องต้นที่ใช้วิเคราะห์เพื่อบรรยายสรุปลักษณะของประชากรหรือตัว อย่างที่ศึกษา ตามข้อมูลที่รวบรวมได้จากตัวแปรที่กำหนด ซึ่งส่วนใหญ่จะใช้การแจกแจงความถี่ (Frequencies) ของกลุ่มย่อยในแต่ละตัวแปร ค่าเฉลี่ย (mean) ค่ามัธยฐาน (median) หรือ ค่าเบี่ยงเบนมาตรฐาน (Standard deviation) เป็นต้น
2. สถิติวิเคราะห์ (Analytical Statistics) เป็นสถิติที่ใช้ในการทดสอบสมมติฐานการวิจัย เพื่ออธิบายข้อพิสูจน์หรือข้อค้นพบที่ได้จากการวิจัย สถิติวิเคราะห์ที่ใช้ในการวิจัยพฤติกรมสุขภาพส่วนใหญ่ เป็นสถิติที่ใช้เพื่อทดสอบความสัมพันธ์ระหว่างตัวแปร ทดสอบความแตกต่างของค่าเฉลี่ย สถิติที่ใช้เพื่ออธิบายตัวแปรที่ศึกษา เช่น สถิติ t-test, F-test, ANOVA เป็นต้น ซึ่งจะได้กล่าวถึงการเลือกใช้สถิติแต่ละประเภทต่อไป

จำนวนตัวแปรและระดับการวัด

ตัวแปร (Variables) คือ คุณสมบัติของประชากรที่ศึกษา เช่น ตัวแปรด้านคุณลักษณะประชากร ได้แก่ เพศ อายุ การศึกษา อาชีพ เป็นต้น หรือตัวแปรด้านพฤติกรรมสุขภาพได้แก่ ความรู้ทางสุขภาพ การรับรู้ทางสุขภาพและความเชื่อและค่านิยมเกี่ยวกับสุขภาพ หรือการปฏิบัติพฤติกรรมสุขภาพด้านต่างๆ เป็นต้น

การวิเคราะห์ข้อมูลในงานวิจัยพฤติกรรมสุขภาพ ควรจะทำการวิเคราะห์เป็นขั้นๆ ตามลำดับตั้งแต่การวิเคราะห์ตัวแปรครั้งละ 1 ตัวแปร (Univariate Analysis) การวิเคราะห์ตัวแปรครั้งละ 2 ตัว (Bivariate Analysis) และการวิเคราะห์ตัวแปรมากกว่า 2 ตัวแปร ขึ้นไป (Multivariate Analysis)

การวิเคราะห์ตัวแปรครั้งละ 1 ตัวแปร จะทำให้ทราบลักษณะทั่วๆไปของตัวแปรนั้นๆ เช่น การกระจาย ค่าเฉลี่ย, ค่าเบี่ยงเบนมาตรฐานเป็นต้น การที่ทราบลักษณะเบื้องต้นของตัวแปรแต่ละตัวโดยเฉพาะอย่างยิ่งการกระจายของ ข้อมูลจะทำให้การจัดกระทำข้อมูลและการวิเคราะห์ข้อมูลในขั้นตอนต่อๆไปถูก ต้องเหมาะสมยิ่งขึ้น ส่วนการวิเคราะห์ตัวแปรครั้งละ 2 ตัวแปรจะเป็นการวิเคราะห์เพื่อพิจารณาความแตกต่างหรือความสัมพันธ์ระหว่าง ตัวแปรทั้งสอง อย่างไรก็ตามในงานวิจัยพฤติกรรมสุขภาพจะมีตัวแปรหรือปัจจัยที่เกี่ยวข้อง สัมพันธ์กับพฤติกรรมาสุขภาพมากกว่า 1 ตัวแปรขึ้นไป ดังนั้นการวิเคราะห์ข้อมูลเชิงพหุหรือ Multivariate Analysis จึงมีความหมายและมีความสำคัญต่อการวิจัยเป็นอย่างมาก แต่ทั้งนี้ไม่ได้หมายความว่า การวิเคราะห์ตัวแปรครั้งละ 1 หรือ 2 ตัวแปรไม่มีความสำคัญเพราะการวิเคราะห์ดังกล่าวจะช่วยให้เข้าใจลักษณะตัวแปร และเป็นพื้นฐานในการวิเคราะห์เชิงพหุต่อไป

ข้อสำคัญอีกประการหนึ่งที่นักวิจัยทางพฤติกรรมสุขภาพต้องทำความเข้าใจ วางแผนตั้งแต่ขั้นตอนแรกๆก่อนที่จะสร้างเครื่องมือรวบรวมข้อมูลตามตัวแปร คือ ระดับการวัดของตัวแปรซึ่งมีความแตกต่างกันและเป็นปัจจัยสำคัญในการเลือก สถิติวิเคราะห์ข้อมูล เพราะสถิติทุกตัวมีข้อจำกัดเกี่ยวกับระดับการวัดของตัวแปรทั้งสิ้น อย่างไรก็ตามสถิติบางตัวก็มีความยืดหยุ่นในเรื่องการวัดระดับของตัวแปร แต่สถิติบางตัวมีความเข้มงวดมาก

ระดับการวัดของตัวแปร แบ่งได้เป็น 4 กลุ่มดังนี้

1) การวัดระดับกลุ่ม (Categorical / Nominal scale) การวัดในระดับนี้เป็นคุณสมบัติที่ต่ำที่สุดในการวัดทางคณิตศาสตร์ผู้วิจัย เพียงแต่พิจารณาคุณสมบัติของตัวแปรและแบ่งเป็นประเภทย่อยๆตามคุณลักษณะที่ แตกต่างหรือเหมือนกัน เช่น ตัวแปรเพศ แบ่งได้เป็นสองกลุ่ม คือ ชาย และหญิง สถานภาพสมรส แบ่งเป็น โสด คู่ ม่าย/หย่า/แยก เป็นต้น

2) การวัดระดับอันดับ (Ordinal scale) เป็นระดับการวัดที่สูงขึ้นกว่าระดับกลุ่ม กล่าวคือ นอกจากจะสามารถระบุความแตกต่าง/ความเหมือนกันของตัวแปรได้แล้ว ยังสามารถจัดเรียงอันดับที่ต่อเนื่องกันได้อย่างมีเหตุผล เช่น คะแนนความรู้ จาก 20 คะแนน อาจแบ่งเป็น 1-5, 6-10, 11-15, และ 16-20 คะแนน เป็นต้น

3) การวัดระดับช่วง (Interval scale) เป็นระดับการวัดที่บอกค่าของสิ่งที่วัดได้ละเอียดขึ้น สามารถบอกปริมาณความแตกต่างได้ เช่น อุณหภูมิ คะแนนความรู้ในเรื่องต่างๆ คะแนนทัศนคติ เป็นต้น (โดยที่คะแนนการวัดในด้านต่างๆ เป็นคะแนนจริงที่ยังไม่ได้นำไปจัดอันดับ หรือแบ่งเกรดยกตัวอย่างเช่น คนๆหนึ่งได้คะแนนความรู้เรื่องโรคเอดส์ 12 จาก 20 คะแนน)

4) การวัดอัตราส่วน (Ratio scale) เป็นระดับการวัดที่สามารถวัดได้ละเอียดที่สุดที่มีค่าจากจุดเริ่มต้นที่เป็น ศูนย์แท้ คือ ถ้าการวัดนั้นมีค่าตัวเลขที่ได้เป็นศูนย์ แสดงว่าสิ่งที่วัดนั้นมีค่าเป็นศูนย์เช่นกัน นอกจากนี้การวัดอัตราส่วนยังบอกความแตกต่างของสิ่งที่วัดได้เช่นเดียวกับการ วัดระดับช่วงตัวแปรที่มีการวัดในระดับนี้เช่น น้ำหนัก ความเร็ว ความสูง เป็นต้น

หลักในการเลือกใช้สถิติที่เหมาะสม
นักวิจัยบางท่านอาจมีคำถามว่าจะเลือกใช้สถิติอะไรในการวิเคราะห์ข้อมูลจึงจะ ถูกต้องเหมาะสม หลายท่านนำข้อมูลที่รวบรวมได้ไปปรึกษาผู้เชี่ยวชาญหรือนักสถิติว่าจะใช้ สถิติอะไรดี เพราะผู้วิจัยไม่ได้วางแผนการวิเคราะห์ข้อมูลไว้ตั้งแต่ต้น ซึ่งนักสถิติเองก็คงตอบไม่ได้จนกว่าจะทราบรายละเอียดของเป้าหมาย วัตถุประสงค์และสมมติฐานของการวิจัยที่ท่านทำ รวมทั้งทราบรายละเอียดของข้อมูลที่รวบรวม ลักษณะการวัดของตัวแปรว่าเป็นอย่างไร จึงสามารถให้คำแนะนำได้

อย่างไรก็ตาม ผู้วิจัยควรจะวางแผนการใช้สถิติวิเคราะห์ข้อมูล โดยอาจพิจารณาเลือกสถิติจากการตอบคำถามต่อไปนี้ให้ได้อย่างชัดแจ้ง
1. ท่านต้องการวิเคราะห์ตัวแปรครั้งละกี่ตัว
2. ข้อมูลที่รวบรวมได้นั้นเป็นข้อมูลที่ได้จากการวัดตัวแปรในระดับใด พิจารณาจากระดับการวัดของตัวแปรตามที่ได้กล่าวมาข้างต้น เนื่องจากข้อมูลที่ได้จากการวัดในระดับที่แตกต่างกัน จะต้องใช้สถิติที่อยู่ในระดับไม่เกินของระดับการวัดนั้นๆ เช่น

ถ้า คำตอบ คือ

กลุ่มสถิติที่ใช้ ได้แก่

- 1 ตัว

Univariate Analysis Statistics

- 2 ตัว

Bivariate Analysis Statistics

- 3 ตัว

Multivariate Analysis Statistics



A. Univeriate Analysis (การวิเคราะห์ตัวแปรครั้งละ 1 ตัวแปร) สถิติที่ใช้จะเป็นสถิติพรรณา เช่น การวัดการกระจาย การวัดแนวโน้มเข้าสู่ส่วนกลาง เป็นต้น

Scale of Measurement

(ระดับการวัดตัวแปร)

Statistics (สถิติ)

Measures of central Tendency

(การวัดแนวโน้มเข้าสู่ส่วนกลาง)

Measures of Descripsion

(การวัดระดับการกระจาย)

Frequencies

(การแจกแจงความถี่) (ค่าร้อยละ)

Categorical Nominal scale

(การวัดระดับกลุ่ม)

Mode

ฐานนิยม

Relative frequency of model value

(ค่าความถี่ของฐานนิยม)

- Relative frequencies

e.q. percentages

Ordinal scale

(การวัดระดับอันดับ)

Median

ค่ามัธยฐาน

Inter-quartile deviation

( ส่วนเบี่ยงเบนควอไทล์)

- Relative frequencies

e.q. percentages

Interval scale*

(การวัดระดับช่วง)

Mean **

ค่าเฉลี่ย

-(standard deviation)

(ค่าเบี่ยงเบนมาตรฐาน)

- Relative frequencies

e.q. percentages



* นอกจากนี้ยังมีสถิติเกี่ยวกับ Symmetry Peakedness, Normality
* * ในกรณีที่ข้อมูลมีการกระจายในลักษณะโค้ง เบ้มาก ควรใช้ Median แทนหรือไม่รวม Case ที่มีค่าต่ำสุด หรือสูงสุดที่ห่างจากกลุ่ม เป็นต้น

B. Bivariate Analysis (การวิเคราะห์ตัวแปรครั้งละ 2 ตัวแปร)

ในกรณีที่ทำการวิเคราะห์ตัวแปรครั้งละ 2 ตัวแปร หรือมากกว่า จะต้องตอบคำถามต่อไปนี้ คือ
1) ในการวิจัยครั้งนี้ แผนการวิเคราะห์ได้กำหนดไว้อย่างชัดเจนหรือไม่ว่าตัวแปรใดเป็นตัวแปรอิสระ และตัวแปรใดเป็นตัวแปรตาม เนื่องจากจะมีกลุ่มสถิติแยกออกเป็นสองกลุ่มใหญ่ๆ คือ Symmetric Analysis เป็นกลุ่มสถิติสำหรับวิเคราะห์ในกรณีที่ไม่กำหนดว่าตัวแปรใดเป็นตัวแปรอิสระ และตัวแปรใดเป็นตัวแปรตาม ส่วน Asymmetric Analysis ควรจะใช้สถิติสำหรับการวิเคราะห์ เมื่อกำหนดตัวแปรอิสระและตัวแปรตามการพิจารณาว่าตัวแปรใดเป็นตัวแปรอิสระ หรือตัวแปรตามนั้น อาจพิจารณาได้จากสมมติฐานของการวิจัย หรือกรอบแนวคิดในการวิจัย

2) จะต้องตอบคำถามว่า ต้องการจะวิเคราะห์อะไร ซึ่งได้แก่ Test of Significance เช่น ความแตกต่างของค่าเฉลี่ยหรือ Strength of Relationship เช่น ความสัมพันธ์ระหว่างตัวแปรดังได้กล่าวมาแล้ว ตัวอย่างสถิติที่ใช้มีข้อสังเกตเบื้องต้นว่าสถิติแต่ละตัวที่จะนำมาใช้ในการ วิเคราะห์นั้นมีข้อบ่งใช้หรือข้อตกลงเบื้องต้นหรือพูดง่ายๆว่า ข้อจำกัดในการใช้อยู่ด้วย ดังนั้น จึงต้องแน่ใจว่าในการวิเคราะห์ข้อมูลโดยใช้สถิติแต่ละตัวไม่ขัดกับข้อตกลง เบื้องต้นของสถิตินั้นๆ มิฉะนั้นแล้วจะทำให้ผลที่ได้จากการวิเคราะห์ผิดพลาดหรือมีความเที่ยงลดลง ตัวอย่างเช่น ข้อมูลที่มีความสัมพันธ์เชิงเส้นโค้งสูงเมื่อทำการวิเคราะห์ด้วยสถิติ Regression เชิงเส้นตรงจะไม่พบความสัมพันธ์กันเป็นต้น สถิติหลายตัวที่ใช้วิเคราะห์ข้อมูลต้องมาจากกลุ่มประชากรที่มีการกระจายแบบ โค้งปกติ (Observations are drawn from a population normally distributed on the interval scaled variables)

ตัวอย่าง
1. ในกรณีที่ตัวแปรทั้งสองตัว ที่นำมาวิเคราะห์ในระดับ Interval
1) เมื่อตัวแปรหนึ่งเป็นตัวแปรอิสระและอีกตัวแปรเป็นตัวแปรตาม (Asymmetric analysis) จะมีสถิติที่สำคัญ คือ
1.1 ) Regression coefficient ใช้วิเคราะห์ความสำคัญของตัวแปรอิสระที่มีต่อตัวแปรตาม โดยพิจารณาจากค่า Beta ซึ่งมีข้อตกลงเบื้องต้นว่าความสัมพันธ์ของตัวแปรทั้ง 2 จะต้องเป็นความสัมพันธ์แบบเส้นตรงถ้าทดสอบลักษณะของความสัมพันธ์แล้วพบว่า เป็นแบบเส้นโค้งควรใช้สถิติในข้อที่ 2 คือ
1.2 ) Coefficient from Curvilinear Regression
2. ถ้าหากการวิจัยนั้นไม่ได้กำหนดว่าตัวแปรใดเป็นตัวแปรอิสระและตัวแปรใดเป็นตัวแปรตาม (Symmetric Analysis) พิจารณาจาก
2.1) ถ้าต้องการทดสอบความแตกต่างของค่าเฉลี่ย ควรใช้สถิติ t-test for paired observations (Samples paired t-test)
2.2) ถ้าต้องการวิเคราะห์ความสัมพันธ์ของตัวแปร โดยที่ความสัมพันธ์มีลักษณะเป็นเส้นตรง ควรใช้สถิติในกลุ่ม Correlation คือ
- Pearson's product moment correlation
- Biserial correlation ในกรณีที่ตัวแปรหนึ่งวัดในระดับ Interval แต่ได้จัดกระทำข้อมูลใหม่ให้เหลือเพียง 2 คำ คือ 1 กับ 0 (dichotomous variable) และต้องการคาดคะเนความสัมพันธ์ของตัวแปรในระดับ Interval (ก่อนมีการจัดกระทำข้อมูล)
- Tetrachoric correlation มีลักษณะคล้าย Biserial correlation โดยที่ตัวแปรทั้งสองมีการจัดกระทำให้อยู่ในลักษณะ dichotomous
2. ตัวแปรหนึ่งวัดในระดับ Interval อีกตัวแปรวัดในระดับ Nominal
1) ตัวแปรที่วัดในระดับ Interval เป็นตัวแปรตาม
1.1 ) ต้องการทดสอบความแตกต่างของค่าเฉลี่ยใช้ Analysis of Variance (F-test) ถ้าตัวแปรที่วัดในระดับ Nominal แบ่งเป็น 2 กลุ่ม ใช้ Student' s t-test แต่ถ้าต้องการทดสอบความแตกต่างของความแปรปรวนใช้สถิติ ANOVA (Bartlett's t-test)
1.2) ถ้าต้องการประเมิน Strength of relationship ระหว่างตัวแปรทั้งสองใช้พิจารณาจาก Etan2 หรือ Omega2 ซึ่งได้จากการวิเคราะห์ ANOVA
2) ในกรณีที่ตัวแปรที่วัดในระดับ Interval เป็นตัวแปรอิสระและตัวแปรตาม Nominal เป็น two-point variable ให้อนุโลมใช้สถิติในข้อ 1) ได้
3. ตัวแปรทั้ง 2 ตัว วัดในระดับ Ordinal
1) ตัวแปรหนึ่งเป็นตัวแปรอิสระและอีกตัวแปรเป็นตัวแปรตาม สถิติที่เหมาะสม คือ Somern' d ซึ่งเป็นการวัดความสัมพันธ์ระหว่างตัวแปร 2 ตัว ที่วัดในระดับ Ordinal
2) ไม่กำหนดว่าตัวแปรใดเป็นตัวแปรอิสระ และตัวแปรใดเป็นตัวแปรตาม
2.1) ถ้าต้องการพิจารณาอันดับของข้อมูลคล้ายการวัดในระดับ Interval ใช้สถิติ Spearman' s rho ซึ่งไม่สามารถใช้ได้อย่างเหมาะสมหลายกรณี
2.2) สถิติที่เหมาะสมกว่า Spearman' s rho คือ
- Kendall, s tau a , Kendall's tau หรือ Kendall, s tau c
- Goodman and Kruskal, s gamma
- Kim' s d เป็นต้น

4. ตัวแปรหนึ่งวัดในระดับ Ordinal และอีกตัวแปรวัดในระดับ Nominal
1) ตัวแปรที่วัดในระดับ Ordinal เป็นตัวแปรตามและตัวแปรที่วัดในระดับ Nominal เป็น two-point variable อนุโลมให้ใช้ Somer' s d ได้ นอกจากนี้ในการทดสอบความแตกต่างอาจใช้ Median test , Mann-Whitney U test เป็นต้น อย่างไรก็ตามถ้าการทดลองเป็นลักษณะ "Matched samples" ซึ่งหมายถึงตัวอย่างในกลุ่มหนึ่ง Match กับอีกกลุ่มหนึ่งของลักษณะของตัวแปรที่วัดในระดับ Nominal ควรใช้ Sign test หรือ Wilcoxon signed rank test
2) ในกรณีที่ไม่ได้กำหนดว่าตัวแปรใดเป็นตัวแปรอิสระและตัวแปรใดเป็นตัวแปรตาม แล้ว จะพบว่ายังไม่มีสถิติที่เหมาะสมกับการวัดในระดับนี้ ผู้วิจัยจะต้องตัดสินใจเลือกใช้สถิติในระดับที่สูงกว่าหรือต่ำกว่าต่อไป ในทางปฏิบัติอาจเลือกใช้สถิติในระดับที่ต่ำกว่า เช่น ในระดับ Nominal ทั้งตัวแปร เช่นในกรณีตัวอย่างในข้อ 5 ต่อไปนี้
5. ตัวแปรทั้ง 2 ตัวแปรวัดในระดับ Nominal
1) มีการกำหนดว่าตัวแปรใดเป็นตัวแปรอิสระและตัวแปรใดเป็นตัวแปรตาม ซึ่งมีสถิติที่เหมาะสมคือ
- Goodman and Kendall' s tau b และ
- Asymmetric lambda

2) ไม่มีการกำหนดว่าตัวแปรใดเป็นตัวแปรอิสระหรือตัวแปรตาม สถิติที่เหมาะสมได้แก่
- Symmetric lambda
- Cramer' d
- Contingency Coefficient ซึ่งไม่นิยมใช้เนื่องจากค่า Coefficient ที่ได้อาจมีค่าสูงสุด (Upper limit) น้อยกว่า 1 ได้ ทำให้แปรผลยากเมื่อต้องการเปรียบเทียบกับงานวิจัยอื่นๆ หรือสถิติอื่นๆที่มีค่าสูงสุดเท่ากับ 1
- Chi-square ใช้พิจารณานัยสำคัญทางสถิติของความสัมพันธ์ของตัวแปรที่ทำการวิเคราะห์ เป็นต้น

3) ในกรณีที่ตัวแปรทั้งสองตัว เป็น two-point scales variable และไม่กำหนดว่าตัวแปรใดเป็นตัวแปรอิสระและตัวแปรใดเป็นตัวแปรตาม การวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรควรใช้สถิติ
- Yule' s Q หรือ
- Phi เป็นต้น

C. Multivariate Analysis (การวิเคราะห์ตัวแปรมากกว่า 2 ตัวแปรขึ้นไป)
1. ในกรณีที่มีตัวแปรตามมากกว่า 1 ตัว วัดในระดับ Interval และตัวแปรอิสระมากกว่า 1 ตัววัดในระดับ Interval เช่นเดียวกัน สถิติที่ควรเลือกใช้ คือ
- Multiple regression หรือ
- Multiple curvilinear regression แล้วแต่กรณี
2. กรณีที่ไม่ได้กำหนดตัวแปรอิสระและตัวแปรตามควรใช้สถิติ
- Multiple correlation
3. อย่างไรก็ตามในการวิจัยพฤติกรรมสุขภาพหรือสุขศึกษา ตัวแปรอิสระส่วนมากจะวัดในระดับต่ำกว่า Interval ดังนั้นในกรณีที่ตัวแปรตาม 1 ตัว วัดในระดับ Interval และ ตัวแปรอิสระมากกว่า 1 ตัว วัดในระดับที่ต่ำกว่า Interval หรือวัดในระดับต่างๆกัน ควรใช้การสถิติวิเคราะห์ที่เรียกว่า Multiple Classification Analysis (MCA) หรือสถิติที่เหมาะสม
ปัญหาการใช้สถิติวิเคราะห์ข้อมูลในการวิจัยพฤติกรรมสุขภาพ
ปัญหาเกี่ยวกับการใช้สถิติวิเคราะห์ข้อมูลในการวิจัยพฤติกรรมสุขภาพ ที่มักพบเสมอมี ซึ่งนักวิจัยพึงระวัง คือ
1. ขาดการวางแผนการเลือกสถิติในการวิจัย และการวิเคราะห์ข้อมูลตั้งแต่ต้น ทำให้ผู้วิจัยสร้างแบบสอบถามที่ใช้ในการรวบรวมข้อมูลโดยไม่ได้คำนึงถึงการ แปลผลข้อมูลที่ได้ให้อยู่ในรูปของคะแนน โดยเฉพาะคำถามในส่วนของตัวแปรด้านพุทธิพิสัย เจตพิสัย และการปฏิบัติพฤติกรรมสุขภาพ ดังนั้นคำถามแต่ละข้อใน 1 หมวดตัวแปรดังกล่าวจึงพบว่ามีความหลากหลายในการตอบ ซึ่งทำให้เกิดปัญหาในการกำหนดคะแนนเพื่อนำไปวิเคราะห์ในขั้นตอนต่อไป

ตัวอย่าง การถามพฤติกรรมการปฏิบัติ บางข้อมีคำตอบให้เลือก 3 คำตอบคือ
1= ปฏิบัติทุกวัน 2=ปฏิบัติเป็นบางวัน 3=ไม่เคยปฏิบัติ
แต่คำถามบางข้อซึ่งอยู่ในการถามพฤติกรรมการปฏิบัติเช่นกัน มีคำตอบให้เลือก 4 คำตอบ คือ
1= ปฏิบัติบ่อยครั้ง 2= ปฏิบัตินานๆครั้ง 3= ปฏิบัติน้อยครั้ง 4= ไม่เคยปฏิบัติเลย เป็นต้น
ซึ่งปัญหาในลักษณะเช่นนี้พบบ่อยมาก ดังนั้นนักวิจัยจะต้องวางแผนการเลือกสถิติในการวิจัย และการวิเคราะห์ข้อมูลให้เหมาะสมกับสมมติฐานการวิจัยตั้งแต่ต้นและสร้างแบบ สอบถามการวิจัยอย่างรอบคอบโดยพิจารณาตัวแปรและระดับการวัดให้สอดคล้องกับ สถิติที่เลือกใช้ให้เหมาะสมก่อนที่จะนำแบบสอบถามไปใช้เก็บข้อมูลจริง

2. การเลือกใช้สถิติโดยไม่คำนึงถึงข้อตกลงเบื้องต้นของสถิตินั้นๆ เช่น การวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรอิสระกับตัวแปรตาม และใช้สถิติ X2-test โดยที่การกระจายของข้อมูลที่เป็นตัวแปรตามเบ้ไปทางซ้ายมาก ทำให้มี cell ใด cell หนึ่งหรืออาจมากกว่าไม่มีข้อมูลเลย หรือการใช้ Z-test โดยไม่ทราบความแปรปรวนของประชากร (Population Variance) การใช้การวิเคราะห์ความแปรปรวน (ANOVA) ของข้อมูลที่วัดเป็นความถี่ เป็นต้น ดังนี้การอ่านผลการวิเคราะห์จะไม่ถูกต้องและไม่น่าเชื่อถือ

3. ขาดความสอดคล้องกันระหว่างวัตถุประสงค์และสมมติฐานของการวิจัย กับสถิติที่ใช้ ทำให้ผลการวิเคราะห์จึงไม่สนองตอบต่อสมมติฐาน และคำถามการวิจัย เช่น ต้องการศึกษาปัจจัยต่างๆที่มีความสัมพันธ์กับพฤติกรรมการปฏิบัติเกี่ยวกับ สุขภาพ แต่ผู้วิจัยเลือกสถิติ ANOVA ทำให้การสรุปผลการวิจัยเกิดข้อผิดพลาดในการใช้ประโยชน์จากผลการวิจัยเป็นต้น

4. การวิเคราะห์เน้นเฉพาะประเด็นย่อยของตัวแปร โดยไม่วิเคราะห์ผลในภาพรวมของตัวแปร เช่น การเปรียบเทียบความแตกต่างระหว่างค่าเฉลี่ยของความรู้เป็นรายข้อ ใช้สถิติ t-test และไม่มีการวิเคราะห์ผลจากค่าเฉลี่ยรวมของความรู้ทุกข้อ หรือการเปรียบเทียบความแตกต่างระหว่างประชากรหลายกลุ่มตามตัวแปรอิสระทีละ ตัวโดยใช้การวิเคราะห์ความแปรปรวนทางเดียว (One-way ANOVA) แทนที่จะใช้การวิเคราะห์ความแปรปรวนแบบหลายทาง (Factorial ANOVA) ซึ่งสามารถศึกษาปฏิสัมพันธ์ร่วมระหว่างตัวแปรได้ด้วย หรือการเปรียบเทียบตามตัวแปรตามหลายตัว แต่ทำการแยกวิเคราะห์ทีละตัว (Univariate) แทนที่น่าจะใช้การเปรียบเทียบตัวแปรตามหลายตัวไปพร้อมกัน (Multivariate) เป็นต้น

โดยสรุปแล้วนักวิจัยทางพฤติกรรมสุขภาพ จะต้องวางแผนการเลือกใช้สถิติและการวิเคราะห์ข้อมูลให้เหมาะสมและถูกต้อง โดยการเลือกสถิติในการวิจัยเรื่องหนึ่งๆ จะต้องพิจารณากันให้สอดคล้องกันตั้งแต่ รูปแบบการวิจัย วัตถุประสงค์ สมมติฐานการวิจัยตัวแปรในการวิจัย ระดับการวัดตัวแปร และเครื่องมือในการรวบรวมข้อมูล เพราะในทุกขั้นตอนของการวิจัยจะมีความสัมพันธ์ต่อเนื่องกันทั้งสิ้น ดังนั้นในกรณีที่ผู้วิจัยไม่ทราบหรือไม่แน่ใจว่าจะใช้สถิติอะไรจึงจะเหมาะสม ก็ควรขอคำปรึกษาจากผู้เชี่ยวชาญ หรือนักสถิติเพื่อไม่ให้เกิดข้อผิดพลาดในการวิจัย

2 ความคิดเห็น:

  1. ไม่ระบุชื่อ28 กรกฎาคม 2551 เวลา 23:16

    thank you so much:)

    ตอบลบ
  2. ขอบคุณครับ ถ้าจะต่อยอช่วยกันlink ขยายความและยกตัวอย่างสถิติที่ยกมาด้วยจะขอบคุณมากครับ

    ตอบลบ