AI寫作回饋看似中立,卻可能因學生身分而改變
當我們把作文交給人工智慧時,常期待它比人類更客觀、更一致;但最新研究卻提醒,AI對學生的回饋並不一定中性。一項由史丹佛研究者完成、題為〈Marked Pedagogies: Examining Linguistic Biases in Personalized Automated Writing Feedback〉的研究,分析了600篇八年級說服型作文,並將作品反覆送入多個AI模型,觀察系統在不同學生標籤下給出的文字回饋。
研究結果顯示,同一篇文章只要被標註成不同族裔、性別或學習狀態,AI的語氣與重點就可能不同。對黑人學生的作品,模型更常給予稱讚與鼓勵;對女性學生,語氣則更柔和、帶有親暱感。這種現象不只是語氣差異,也可能影響學生拿到的是「鼓勵」還是「能幫助進步的批評」。
相關報導指出,研究中使用的模型包含不同版本的 ChatGPT 與 Meta 的 Llama;研究者反覆提交相同作文,僅改變「作者身分」描述,便觀察到回饋明顯轉向。這代表AI在教育場景中的偏誤,可能並不是偶發,而是和訓練資料中的人類語言模式有關。
黑人、女性與其他群體:AI回饋出現不同語調
研究發現,被標註為黑人學生的作文,更容易收到「你的個人故事很有力量」這類正面評語,甚至出現強調領導力或力量的措辭;有些回饋中,像 “powerful” 這樣的字眼只出現在黑人學生身上。相對地,白人學生更常得到針對論證結構、證據與清晰度的建議,這類回饋通常更直接,也更能幫助修改內容。
另一個值得注意的發現是,女性學生收到的回饋往往更親切,甚至帶有「love」等詞彙,語氣像是在安慰或鼓勵,而不是嚴格指出問題。對於被描述為「缺乏動機」的學生,AI又常給出更樂觀、鼓舞性的語句;但若標註為高成就或有動機,系統反而更容易提出直接、批判性的修改建議。
研究者認為,這些現象反映AI正在複製人類語言中的既有偏見。也就是說,當模型學到大量人類寫作與互動模式後,它可能模仿了教師或社會對不同學生「應該如何說話」的習慣,導致不同群體在相同表現下,卻得到不同品質的回應。
教育AI偏誤不只存在於回饋,也反映在評分與資源落差
這類偏誤並非只出現在作文回饋。過去研究與案例也指出,AI在招募、醫療與教育等領域,都曾出現對女性或少數族群不利的情況。以女性為例,相關報導提到,AI偏誤在醫療資料中可能因女性樣本不足而擴大,甚至有研究發現某些血液檢測模型在辨識肝病時,對女性漏判的機率高於男性。
這些案例說明,AI並不是天然公平的工具。它的輸出品質,取決於訓練資料、模型設計與使用情境;若資料本身帶有歷史偏差,系統就可能把偏差包裝成「專業」或「個人化」。因此,當AI被導入教室,不只是要看它能不能幫忙批改,更要看它是否會放大既有的不平等。
從更廣義的角度看,AI偏誤的問題其實提醒我們:技術效率不能取代教育公平。若一套系統在不同學生身上給出不同語氣、不同標準,那麼它改善學習的能力就會被打折,甚至讓部分學生在無形中被貼上刻板印象。
黑人與西語裔青少年更常把AI用在功課上,背後是需求也是落差
除了「AI怎麼回饋」之外,另一個值得關注的問題是「誰更常使用AI」。Pew Research Center 的調查顯示,Black Teens Lead in AI Use for Schoolwork指出,約6成黑人青少年會用AI幫忙做功課,白人青少年則約為一半;黑人成年輕人也更常表示AI對完成學校作業「非常」或「相當」有幫助。這種差距不一定代表科技使用能力更高,也可能反映學習支持資源的分配不均。
教育分析者認為,黑人學生更依賴聊天機器人,可能是因為他們不像白人或較富裕家庭的學生那樣,能更容易取得家教、導師或額外輔導。換言之,AI在某些情境下成了替代性支援;但若學生只能依賴聊天機器人,而不是獲得足夠的人際指導與學校資源,那它所填補的,其實是結構性的缺口。
這也讓AI教育應用呈現雙面性:一方面,它可能降低學習門檻;另一方面,它也可能把既有差距轉化為新的數位依賴。當不同群體對AI的使用方式、頻率與回饋品質都不一樣時,教育科技就不只是工具問題,而是公平問題。
要讓AI成為助力,關鍵在透明、監督與人類判斷
這幾篇研究與報導共同指出一件事:AI的「個人化」不一定等於公平。若系統會因為學生被標註為黑人、女性、缺乏動機或有學習障礙,而自動調整成不同語氣,那教育現場就必須更謹慎地檢視它到底在強化什麼、忽略什麼。好的回饋應該幫助學生提升,而不是在無形中重演刻板印象。
更務實的做法,或許不是全面拒絕AI,而是要求更高的透明度、測試與人工監督。學校與開發者都需要知道,模型在不同群體上的表現是否一致,是否會對某些學生過度溫和、對另一些學生過度嚴苛,或在語氣上讓人感覺被特殊對待。只有當AI的行為可被檢驗,教育應用才可能真正成為助力。
總結來說,這些新聞拼出了一個清楚的畫面:AI已經深度進入教育,但它並不自動帶來公平。從作文回饋到功課輔助,AI偏誤既反映了資料與模型的問題,也照見了現實世界中的資源不平等。未來真正值得追問的,不只是「AI能做什麼」,而是「它究竟為誰而做、又對誰不一樣」。





