วันพฤหัสบดีที่ 21 มกราคม พ.ศ. 2553

การประเมินคุณภาพการศึกษา



ดร.พนม พงษ์ไพบูลย์
ปลัดกระทรวงศึกษาธิการ


การประเมินคุณภาพการศึกษาด้านความถนัดทางการเรียน (SAT)หรือการสร้างแบบทดสอบ SAT เป็นโครงการที่ผู้เขียนริเริ่มแนวความคิดมาตั้งแต่ปี 2536 ขณะที่ดำรงตำแหน่งอธิบดีกรม วิชาการและได้รับการสานต่อจนเป็นรูปธรรมในปัจจุบัน แม้ว่าพระราชบัญญัติการศึกษาแห่งชาติไม่ได้กล่าวถึงแบบทดสอบ SAT โดยตรง แต่แบบทดสอบนี้จะเป็นเครื่องมือสำคัญในการปฏิบัติตามพระราชบัญญัติการศึกษาแห่งชาติ ในเรื่องการประเมินมาตรฐานการศึกษาและการประกันคุณภาพการศึกษาในบริบทของการจัดการศึกษาแบบกระจายอำนาจ กรมวิชาการได้ใช้เวลาศึกษาและพัฒนาแบบทดสอบ SAT มาเป็นเวลานานพอสมควร ในรูปของฐานข้อมูลคลังข้อสอบที่มีจำนวนข้อสอบหลายพันข้อ และได้นำไปทดลองใช้ในภาคสนามและวิเคราะห์ผลการทดลอง พร้อมหาค่าความเที่ยงตรงและความเชื่อมั่น (Validity and Reliability) ของแบบทดสอบ ซึ่งได้ผลเป็นที่น่าพอใจพร้อมที่จะนำไปใช้ในสถานการณ์จริง และที่ประชุมกระทรวงศึกษาธิการมีมติเห็นชอบให้ดำเนินการจัดสอบในปลายปีการศึกษา 2543 หรือประมาณต้นปี 2544 โดยถือว่าเป็นโครงการระดับกระทรวงศึกษาธิการ ที่กรมวิชาการ กรมต้นสังกัด และสำนักงานปลัดกระทรวงศึกษาธิการร่วมดำเนินการ
แนวคิดเรื่องการวัดความถนัดทางการเรียนหรือ SAT นี้ ประเทศต่างๆ ในโลกโดยเฉพาะประเทศตะวันตกที่จัดการศึกษาแบบกระจายอำนาจ แบบทดสอบความถนัดทางการเรียนจะเป็นตัวบ่งชี้คุณภาพการศึกษาที่สำคัญมาก เมื่อกล่าวเราพูดถึงการศึกษาโดยเฉพาะอย่างยิ่งการศึกษาขั้นพื้นฐาน คือประถมศึกษา และมัธยมศึกษา ถ้ามัธยมศึกษาเป็นการศึกษาเพื่อปวงชน และคนทุกคนเรียนมัธยมศึกษาอย่างกว้างขวาง รุ่นหนึ่งๆ ก็จะต้องมีคนเรียนมัธยมศึกษาประมาณ 1 ล้านคน หรือใกล้ๆ ล้านคนเป็นอย่างน้อย แล้วโปรแกรมการเรียนก็คงจะหลากหลายแตกต่างกันไป ตามความถนัดตามพื้นฐานของแต่ละคน และตามความสนใจของแต่ละคนที่แตกต่างกันตามวิถีชีวิตความเป็นอยู่ของแต่ละคนและแต่ละชุมชน เมื่อมีความแตกต่างกัน หลักสูตรของมัธยมศึกษาก็จะต้องยืดหยุ่นและกว้างขวาง กระบวนการเรียน กระบวนการวัดผลประเมินผลต่างๆ ก็จะยืดหยุ่นและก่อให้เกิดความหลากหลาย ได้เคยมีการเรียกร้องว่า ควรจะมีการทำข้อสอบกลาง เพราะเห็นว่าผลการเรียนคือ GPA ของนักเรียนแต่ละคน ไม่สามารถจะเทียบกันได้ โรงเรียนของแต่ละคนก็มีวิธีการให้เกรดหรือการตัดสินผลการเรียนที่แตกต่างกัน ทำให้นำผลการเรียนมาเปรียบเทียบกันไม่ได้ ทบวงมหาวิทยาลัยก็ไม่สามารถเอาไปใช้ประกอบการคัดเลือกได้เพราะความหลากหลายของมาตรฐานและวิธีการวัดและประเมินผลของแต่ละโรงเรียน และได้ตั้งเงื่อนไขว่าเมื่อใดกระทรวงศึกษาธิการสามารถแสดงให้เห็นว่ามีวิธีนำผลการเรียนมาเทียบกันได้ จะนำไปใช้เป็นเกณฑ์ในการคัดเลือกคนเข้าเรียนในมหาวิทยาลัย ซึ่งเป็นไปไม่ได้ที่จะทำให้ผลการเรียนเปรียบเทียบกันได้อย่างถูกต้องสมบูรณ์ และไม่มีประเทศไหนในโลกที่สามารถจะทำได้อย่างนั้นได้ มีวิธีเดียวที่เราสามารถจะเทียบกันได้ คือการวัดความสามารถของผู้เรียนที่ไม่ใช่วัดความรู้ด้านเนื้อหาสาระเพียงอย่างเดียว แต่เป็นการวัดสิ่งที่อยู่ในตัวผู้เรียน อันเป็นผลเกิดจากการสะสมของกระบวนการเรียนรู้ ที่เกิดขึ้นมาตั้งแต่แรกเริ่มเข้าสู่โรงเรียนและสังเคราะห์สะสมกันเรื่อยๆมา ดร.ชอบ ลีซอ ใช้คำว่าเป็นการตกผลึกของความรู้ คือ ความรู้ความสามารถที่สะสมไว้ในตัวผู้เรียน หรือที่นักจิตวิทยาทางเชาว์ปัญญาเรียกว่า Crystalized Ability ซึ่งไม่ใช่ตัวความรู้โดยตรง แต่เป็นคุณสมบัติต่างๆ ที่เกิดขึ้นจากกระบวนการเรียนรู้สามารถแสดงออกได้ และเป็นตัวบ่งชี้ความสามารถของคนได้ เรียกว่า Aptitude ภาษาไทยแปลว่าความถนัด ที่จริงไม่ใช่ความถนัดโดยตรงแต่เป็นสิ่งที่สังเคราะห์สะสมจากการเรียนรู้ของผู้เรียน ถ้ามีเครื่องมือวัดความสามารถอย่างนี้แล้ว คนที่ผ่านกระบวนการเรียนรู้ เรียนเนื้อหาสาระที่แตกต่างกัน ผลของการสะสมสังเคราะห์ของความรู้หรือความสามารถที่ตกผลึกควรที่จะสามารถเปรียบเทียบกันได้อย่างสมเหตุสมผล ใครมีความสามารถที่ได้รับการพัฒนามาก การสอบด้วยแบบทดสอบ SAT จะได้คะแนนสูง ถ้ามี SAT ที่ใช้ได้ทั้งประเทศ ก็จะสามารถวัดเด็กทุกคนในประเทศและนำผลมาเทียบกันได้ว่ามีใครมีความเด่น มีความด้อย ความถนัด ความสามารถแตกต่างกันอย่างไร สามารถนำไปใช้เป็นตัวบ่งชี้ในการพิจารณาในเรื่องต่างๆ ได้อย่างกว้างขวางมากมาย เช่น ใช้ในกระบวนการแนะแนว การเลือกอาชีพ การส่งเสริมการเรียน เป็นต้น
ประเทศสหรัฐอเมริกาได้ใช้ SAT มาเป็นเวลาหลายสิบปี และทำมาต่อเนื่องโดยตลอด โดยมีองค์กรอิสระคือ Educational Testing Service หรือ ETSเป็นผู้จัดสร้างและนำไปใช้เป็นเครื่องมือทดสอบ การทดสอบนี้เป็นการสมัครใจ แต่ละคนต้องไปสมัครสอบ ทาง ETS จะรายงานผลการสอบให้เป็นรายบุคคลแล้วมหาวิทยาลัยในสหรัฐเกือบทั้งหมด จะใช้ผลการสอบ SAT ประกอบการพิจารณาโดยไม่มีการบังคับใครจะสมัครเข้าเรียนก็จะขอดูคะแนน SAT ใช้เป็นเกณฑ์ที่สำคัญ และมีการศึกษาวิจัยพบว่าคะแนน SATเมื่อไปศึกษาหาความสัมพันธ์กับความสำเร็จในการเรียนระดับอุดมศึกษาแล้ว พบว่ามีความสัมพันธ์กันสูงมากสูงไม่น้อยไปกว่าดูความสัมพันธ์ผลการเรียนในระดับมัธยมศึกษา คือ GPA เมื่อเทียบกับความสำเร็จในระดับอุดมศึกษา แต่ปัญหา GPAคือเทียบกันไม่ได้ในระหว่างโรงเรียน แต่ SAT มันเทียบกันได้ระหว่างโรงเรียนและระหว่างคนแต่ละคนที่สมัครเข้าไป
ในออสเตรเลีย มีการทดสอบเรียกว่า AST หรือAustralian Scaling Test ซึ่งเป็นแบบ วัดความถนัดทางการเรียนคล้ายกับ SAT และมีระบบการสอบคล้ายๆ กันคือมีหน่วยงานกลางเรียกว่า Board of Senior SecondaryStudies เป็นหน่วยจัดสร้างข้อสอบประเภทนี้โดยไม่บังคับว่าให้ใครมาสอบ แต่มหาวิทยาลัยในออสเตรเลียก็จะขอดูคะแนนผลการสอบนี้ การประกาศผลสอบเขาจะใช้วิธีการพิมพ์โดยคอมพิวเตอร์แจกไปแต่ละคน เมื่อสมัครเข้ามหาวิทยาลัยหน่วยงานที่จัดสอบจะ รายงานผลการสอบในคอมพิวเตอร์ส่งไปให้มหาวิทยาลัยโดยตรง แต่ละคณะจะมีเกณฑ์พิจารณาคะแนน SATว่าอย่างน้อยต้องอยู่ในระดับใด จึงจะมารับพิจารณา ซึ่งจะแตกต่างกันไปตามระดับความมีชื่อเสียงของมหาวิทยาลัยแต่ละแห่งการสอบมาตรฐานแบบนี้ในสหรัฐอเมริกาและออสเตรเลียจะทำกันอย่างกว้างขวาง แม้ว่าระบบของออสเตรเลียจะต่างจากสหรัฐ แต่ก็ใช้ในลักษณะคล้ายกัน คือ คัดเลือกเข้ามหาวิทยาลัย ในประเทศอังกฤษใช้แบบสอบอีกแบบหนึ่งโดยใช้อายุของผู้เรียนเป็นเกณฑ์ คนที่อยู่อายุเดียวกันจัดอยู่กลุ่มเดียวกันมีแบบทดสอบมาตรฐานกลางซึ่งมีองค์กรหลายแห่งจัดทำส่วนมากเป็นมหาวิทยาลัยขนาดใหญ่ เช่น Oxford Cambridgeสถาบันอุดมศึกษาจะรับเข้าศึกษาต่อก็จะขอดู แล้วบอกว่าเป็น O – level หรือ A – level คือ ระดับคะแนนสูง O – level เป็นระดับคะแนนปานกลางถ้าจะไปเรียนคณะนี้จะต้องได้ A – level กี่วิชา O – level กี่วิชา
ประเทศไทยล้าหลังมากเมื่อเปรียบเทียบกับประเทศต่างๆ เหล่านี้ระบบการสอบเข้ามหาวิทยาลัยของไทยจะใช้การสอบวัด Achievement test วัดการเรียนรู้ตามเนื้อหาสาระของวิชาเป็นส่วนใหญ่ไม่ได้นำผลของการสะสมที่เกิดจากกระบวนการเรียนรู้ไปใช้เป็นประโยชน์ ด้วยเหตุนี้จึงคิดว่าถึงเวลาแล้วที่เราจะต้องมีระบบ SATมาใช้เป็นมาตรฐานกลางเพื่อเปรียบเทียบหรือใช้ประโยชน์ในการแนะแนวหรือการคัดเลือกคนเข้าสู่ระบบในเรื่องต่างๆ เจตนาลึกๆ คิดว่าทำอย่างไร เราจะเปลี่ยนระบบคัดเลือกเข้ามหาวิทยาลัย ในขณะที่มหาวิทยาลัยไม่ค่อยเห็นด้วยในการใช้ GPA และ SAT จะเป็นตัวเลือก จึงได้คิดพัฒนาระบบ SAT ขึ้นในประเทศไทย โดยกรมวิชาการได้เชิญ ผู้ทรงคุณวุฒิทางด้านวัดผลประเมินผลทางการศึกษาและทางจิตวิทยา จากสถาบันและหน่วยงานทางการศึกษา ต่างๆ ในประเทศไทย มาช่วยกันคิดวางแผนและได้ช่วยกันสร้างข้อสอบประมาณ 2 ปี จึงออกมาเป็นข้อสอบแบบ SAT
โดยทั่วไป SAT มีหลายรูปแบบส่วนที่สำคัญที่คิดว่าสามารถจะเป็นตัวแทนของการเรียนรู้ การสะสมของการเรียนรู้ได้ทั้งหมดและเป็นตัวแทนได้อย่างดีมี 3 เรื่องเรื่องแรกคือความสามารถทางภาษา หรือ Verbal Ability เป็นการวัดการสะสมความสามารถ ความถนัดต่างๆ ทางด้านภาษา นักจิตวิทยาได้วิจัยแล้วพบว่า Verbal ไปสัมพันธ์กับ ความสำเร็จทางการเรียนในสาขาวิชาที่เกี่ยวข้องกับทางด้านสังคมศาสตร์ มนุษยศาสตร์ เรื่องที่สองคือความสามารถทางการคิดคำนวณ หรือ Numerical Ability คือเรื่องของการคำนวณตัวเลขต่างๆ ซึ่งเป็นการคิดคำนวณเบื้องต้นง่ายๆ แต่ว่าจากการเรียนรู้นี้เป็นผลจากการสะสมการคิดคำนวณ คนโบราณอาจไม่รู้ว่า บวก ลบ คูณ หาร เป็นอย่างไร แต่ด้วยทักษะสามารถคิดตัวเลข คิดอะไรต่างๆออกมาได้ แบบนี้คือทักษะแบบ Numerical ซึ่งจากการศึกษาวิจัยพบว่า ทักษะแบบนี้เป็นตัวแทนของการสะสมความรู้ทางด้านคณิตศาสตร์ ทางด้านวิทยาศาสตร์ การประยุกต์คณิต – วิทย์ไปใช้ในการเรียน ผลการทดสอบของ Numerical จะเป็น ตัวแทนความสามารถทางด้านนี้เป็นอย่างดี เพราะจะมีความสัมพันธ์สูงกับผลสัมฤทธิ์ทางการเรียนทางด้านวิทยาศาสตร์และคณิตศาสตร์ อีกด้านหนึ่งของแบบทดสอบความถนัดทางการเรียน ซึ่งเป็นตัวบ่งชี้ที่คิดว่าสำคัญ เรียกว่าทางด้าน Analytical Ability หรือความสามารถเชิงวิเคราะห์ ก็คือทางด้านคิดหาเหตุผล การหาความสัมพันธ์ของสิ่งต่างๆ เป็นสิ่งที่ให้เห็นความสามารถในการแก้ปัญหาต่างๆ ในลักษณะเฉพาะหน้า ความสามารถเชิงวิเคราะห์นี้สัมพันธ์กับทางด้าน Numerical ทางด้าน Verbal เป็นตัวเชื่อมระหว่าง ความสามารถทางการคิดคำนวณกับความสามารถทางด้านภาษา เข้าด้วยกัน ถ้าใครมี Analytical ผสมกับ Verbal ก็จะประสบความสำเร็จทางด้านมนุษยศาสตร์ สังคมศาสตร์ หรือด้าน Analytical ไปสัมพันธ์กับทางด้าน Numerical ด้วย ความสำเร็จทางด้าน คณิต – วิทย์ ยิ่งจะสูงมาก หรือถ้า มีความสามารถทั้ง 3 ด้าน ได้คะแนนเหมือนกันหมด แสดงว่าคนนี้จะไปเรียนทางด้านไหนก็ได้ จะประสบความสำเร็จ ถึงแม้ว่าเป็นนักวิทยาศาสตร์ ก็จะเก่งด้านภาษา ด้านเหตุผล จึงเห็นว่าความถนัดทางการเรียนมีความหมายมาก เพราะจะเป็นตัวแทนวัดความสามารถรวมของมนุษย์ เกือบทุกสิ่งทุกอย่าง อยู่ในตัวเดียวกัน โดยแสดงออกผ่าน 3 ตัวนี้ ซึ่งมีความสำคัญที่จะต้องพยายามวัดออกมาให้ได้ ถ้าวัดออกมาแล้วจะสามารถใช้คาดคะเน ใช้พยากรณ์อะไรต่าง ๆ ได้อย่างมากมาย จึงได้พยายามสร้างแบบวัดทดสอบวัด SAT ใน 3 ด้านด้วยกัน ถ้าเด็กผ่านกระบวนการทดสอบความถนัดนี้ครูจะสามารถให้คำแนะนำผู้ปกครองได้ว่าควรให้เด็กเรียนอะไรหรือไม่ควรจะไปเรียนอะไรจึงเป็นประโยชน์สำหรับการแนะแนว อีกประการหนึ่งคือว่า เนื่องจากข้อสอบไม่ได้วัดตัวเนื้อหาสาระของความรู้ ดังนั้น ข้อสอบแบบนี้บางทีคนเห็นข้อสอบแล้วติวข้อสอบก็ทำข้อสอบผิด เพราะว่าถ้าเขาไม่ได้สะสมการเรียนรู้ มาอย่างสมบูรณ์ถูกต้องนี้แล้ว จะแปลความหมายข้อสอบผิด แต่ถ้าคนมีความเข้าใจมีสิ่งที่ต้องสะสมเป็นผลมาจากการเรียนรู้มาดี ก็จะแปลข้อสอบได้อย่างง่ายมาก ข้อสอบแบบนี้วัดคนเก่งได้ดี และมีอำนาจจำแนกความสามารถของคนได้สูง ถึงแม้ว่าจะรู้ข้อสอบ เก็งข้อสอบหรือพิมพ์ข้อสอบขาย ก็ไม่ได้ผลเป็นข้อสอบที่เราใช้ได้บ่อยและเด็กก็สามารถสอบได้บ่อยโดยไม่ขึ้นกับเนื้อหาสาระของการเรียนรู้ว่าเรียนจบหลักสูตรหรือไม่อย่างไร เพราะฉะนั้นจะสอบที่ไหนก็ได้ จะสอบชั้นม. 4 ก็ได้ จะสอบชั้น ม.5 ก็ได้ หรือจบไปแล้วมาสอบก็ได้ ปีหนึ่งสอบ 2 หนก็ได้ 3 หนก็ได้ แต่ถ้าคนที่เรียนรู้มากๆ คะแนนผลการเรียนรู้ก็จะพัฒนาบุคคลโดยส่วนรวม คะแนนการสอบก็จะพัฒนาขึ้นมาได้ หรือถ้าคนที่มีความสามารถสูง ๆ แต่เรียนรู้ยังไม่มากนักก็สามารถจะทำได้ เช่นเดียวกัน
ในระยะแรกคิดว่าจะให้เด็กสอบได้หลายครั้งในเวลาต่างๆ กัน โดยไม่จำเป็นต้องประกาศว่าให้มาสอบข้อสอบนี้พร้อมกันทั่วประเทศ ถ้าทำได้มาตรฐานจริงๆ ไม่จำเป็นต้องมานั่งสอบพร้อมกันทั่วประเทศ ใครพร้อมมาสอบเวลาไหนก็ได้ หรืออาจนัดเด็กเข้ามาสอบนั่งหน้าจอคอมพิวเตอร์ แล้วส่งข้อสอบผ่านคอมพิวเตอร์เข้าไป แล้วเด็กก็ตอบข้อสอบต่อหน้าคอมพิวเตอร์ ไม่ต้องใช้กระดาษ ดินสอ เด็กสอบเสร็จเด็กรู้คะแนนเลย แจ้งคะแนนได้เลย วันหลังไม่พอใจคะแนนก็นัดมาสอบใหม่ก็ได้ นี่คือความคิดที่มองไกลไปถึงอนาคตว่าอาจจะทำได้ดีถึงขนาดนั้น ทั้งนี้จะต้องขึ้นอยู่กับอีกส่วนหนึ่งคือคลังข้อสอบ เพราะการสอบแต่ละครั้งเด็กจะจำข้อสอบได้ จำนวนหนึ่ง และก็จะบอกกันต่อไป แล้วก็จะมีธุรกิจจ้างคนมาจำข้อสอบ แล้วก็เอาไปพิมพ์ขาย เพราะฉะนั้น ข้อสอบก็จะรั่วไหลได้ กระบวนการพัฒนาข้อสอบจะต้องทำกันอยู่ตลอดเวลา เพื่อปรับปรุงข้อสอบให้แตกต่างไปจากข้อสอบเดิม สร้างสะสมไว้ แล้วข้อสอบแต่ละข้อทำถูกอาจได้ 1 คะแนน บางข้ออาจได้ไม่ถึง 1 คะแนน หรือได้มากกว่า 1 คะแนน ขึ้นอยู่กับคุณสมบัติของข้อสอบที่ได้คิดคำนวณค่าไว้เรียบร้อยแล้ว
ในการสอบแต่ละโรงเรียน แต่ละอำเภอ ก็ไม่จำเป็นว่าจะต้องใช้ข้อสอบเดียวกันทั่วประเทศ เพราะว่ามีคลังข้อสอบอยู่เป็นพัน ๆ ข้อ และรู้คุณสมบัติของข้อสอบแต่ละข้อเรียบร้อยแล้ว ก็สามารถจะให้คอมพิวเตอร์เลือกข้อสอบที่จะเอามาผสมผสานกันเป็น 1 ฉบับ แล้วก็มีค่าคุณสมบัติเท่าเทียมกัน เทียบเคียงกันได้ ถึงแม้ว่าข้อสอบนั้นจะแตกต่างกันไป ผลที่ออกมาก็จะสามารถเปรียบเทียบกันได้อย่างน่าเชื่อถือ เป็นธรรม และเป็นมาตรฐาน เมื่อเข้าใจความสำคัญของแบบทดสอบความถนัดทางการเรียน และเห็นประโยชน์ของโครงการประเมินคุณภาพการศึกษาด้านความถนัดทางการเรียนแล้ว หวังเป็นอย่างยิ่งว่าคณะกรรมการดำเนินงานระดับจังหวัด และหน่วยงานต้นสังกัดที่เกี่ยวข้องจะร่วมกันทำงานอย่างเต็มกำลังความสามารถ เพื่อให้การดำเนินการสอบเป็นไปอย่างมีประสิทธิภาพ มีมาตรฐาน ให้นักเรียนทุกคนทำข้อสอบด้วยความตั้งใจและเต็มความสามารถ คณะทำงานทุกระดับปฏิบัติตามแนวทางที่กำหนดในเอกสารที่กรมวิชาการจัดให้ โดยเฉพาะอย่างยิ่งเรื่องการรักษาความลับของแบบทดสอบ และให้หน่วยงานระดับจังหวัดและกรมต้นสังกัดร่วมกันรับผิดชอบค่าใช้จ่ายในส่วนที่ต้องรับผิดชอบ ต่อไป

ไม่มีความคิดเห็น:

แสดงความคิดเห็น