Skip to Content Facebook Feature Image

從「被動套用」到「主動探究」:數字教育的未來方向

博客文章

從「被動套用」到「主動探究」:數字教育的未來方向
博客文章

博客文章

從「被動套用」到「主動探究」:數字教育的未來方向

2026年05月28日 13:11 最後更新:15:22

深耕資訊科技教育二十餘載,我親眼見證這門學科的演變:教學重心從最初的基礎打字、程式語法,逐步發展為如今結合人工智慧的協作與創新。隨著氛圍編程(Vibe Coding) 走入校園,學生無需再死記繁雜的程式語法,僅透過自然語言下達指令,就能快速編寫程式,輕鬆完成生態裝置、氣象模擬等跨學科創客作品。
科技為教學帶來諸多便利,令人欣喜,但隱憂也隨之而來:當 AI 能夠一鍵生成成品,學生往往跳過獨立思考、邏輯推演與反覆試錯的過程,直接獲得完善作品。長此以往,寶貴的學習體驗與成長歷程恐將逐漸流失。

在我看來,這也正是當下資訊教育加速轉型的契機。我們應摒棄機械化的傳統訓練模式,引導學生從被動接收知識,轉為主動探索發現,在自主探究中建構屬於自己的知識體系,這才是數字教育未來發展的核心方向。

當「高效率」遇上「零思考」

傳統資訊科技教學,以程式撰寫、除錯優化為核心,重在培養學生的運算思維。但這類學習門檻高、耗時久,小學生很容易產生挫敗感。而Vibe Coding顛覆了「先學理論、再動手實作」的傳統模式,學生不必熟稔程式語法,就能將腦海中的創意落地為實體作品,契合小學生具象化的思維特點,真正落實「做中學」的理念。

近期,本校高年級開展多項氛圍編程教學實作,推出「生態平衡器」、「風災模擬系統」等專案。AI 的高效性在過程中展露無遺,學生僅用十幾分鐘就能搭建出作品基礎框架。

然而觀察發現,多數「生態平衡器」只能機械化展示數據,無法模擬物種數量此消彼長的動態平衡;「風災模擬系統」也僅能簡單顯示風速,還原不出不同風級伴隨降雨的真實災場場景。

更值得反思的是,面對存在明顯缺漏的 AI 生成作品,絕大多數學生選擇全盤接受,鮮少主動發現問題、深究緣由,直接跳過了最關鍵的理解與思辨環節。

教學轉向:化「缺漏」為探究「起點」

AI非學習替代品,而是驅動變革的工具。新時代AI教育的關鍵是轉變學習思維:把重心從「完成作品」轉向「探究問題」,將AI的「快速生成」轉化為學生的「探究動力」。

在生態平衡器後續教學中,我們刻意保留AI成品的缺失,不直給予修正方案,而是拋出問題:「對比大自然,哪些因素影響物種數量?若發生旱災,還有哪些變數要納入設計?」。學生開始大膽質疑、梳理問題,帶著疑問重新與AI對話、調整參數。原本被動套用的學生,在修訂中真正內化了生態原理與程式邏輯。

風災模擬專案的轉變同樣明顯。教師引導學生回顧真實情境:「不同風球信號對建築物、樹木、設施的破壞有何差異?如何加入降雨等複合災害?」。學生發現問題後,主動修改提示詞,補充條件並反覆測試。最終不僅優化出可調控的系統,更理解了風力等級的標準,真正實現「做中學、問中悟、改中進」。

結語:回歸教育的本質

二十餘年的資訊科技教學經歷,讓我愈加明白:教育的終極目標,從不是培養單純會寫程式、會製作作品的學生,而是造就樂於思考、勇於提問、善於解難的孩子。

傳統教學階段,技術門檻限制了學生的創意發揮;步入 AI 時代,易得的成品又容易讓學生放棄深度探究。面對 AI 帶來的全新機遇與挑戰,我們更應跳出單一技能訓練的框架,回歸教育本心,讓科技成為學生成長的工具。

作者:保良局蕭漢森小學 李志成校長




教育4.0

** 博客文章文責自負,不代表本公司立場 **

為什麼大模型和AI智慧體(Agents)遲遲未能顛覆企業核心業務?阻礙它們規模化落地的核心痛點,正是那些難以消滅的報錯、失真與幻覺 。在處理郵件、理賠或審計等日常任務時,AI即便達到了90%至97%的準確率,剩下的少數錯誤也絕非一封致歉郵件就能打發 。這些錯誤不僅會造成嚴重的財務與聲譽損失,還可能暴露系統漏洞供人惡意利用 。


基於筆者有限的經驗, 本文嘗試為你梳理大模型的常見錯誤類型,並分享一些從網上搜羅的各式各樣真實專案驗證有效的抗噪策略:

一、 大模型錯誤分類學(LLM Error Taxonomy)

在對症下藥前,必須認清大模型經常扮演的幾類“反派角色” :

  • 幻覺(Hallucination):無中生有地編造聽起來合理的實體或文獻引用 。屬於偶爾發生但後果嚴重的致命傷,在運營中會帶來災難性損失 。
  • 事實錯誤(Factual Errors):給出錯誤或過時的資料 。這是發生頻率最高的錯誤,如同自動化的“白蟻”,悄悄啃食系統根基 。
  • 推理與對齊錯誤(Reasoning & Grounding Errors):即便事實正確,模型也可能推導錯結論 ;或者給出的答案正確,卻並非源自用戶指定的上下文 。
  • 指令與一致性錯誤(Instruction & Consistency Errors):模型無視格式約束(如輸出無效JSON),或在同一個長回答中前後矛盾 。
  • 安全違規與工具失效(Safety Violations & Tool Fails):輸出有害或違法的非合規言論,導致巨額罰款 ;或調用了錯誤的外部工具與參數 。


二、防錯與降噪實戰策略

如何有效控制並修復這些錯誤 ?以下方法在實際項目中各有千秋:


A. 基礎級調整

  • 標準推理(Reasoning - Standard):直接開啟大模型的原生思考功能,雖能略微提升品質 ,但在實踐中往往只是讓模型“錯得更有深度” 。投入極低,效果極低
  • 精准提示詞工程(Accuracy Prompting):通過明確指令、賦予特定角色和羅列品質標準來優化提示詞 。但單純命令模型“不要犯錯”只是美好的宏願,而非控制機制 。投入極低,效果極低
  • 任務微拆解(Break the Task into Smaller Steps):將複雜的提示詞徹底解構為多個獨立的子任務,可有效降低指令干擾 ,且通常不會大幅增加Token成本 。投入極低,效果較低


B. 架構級優化:

  • 特定領域推理(Reasoning - Be Specific!):關掉通用思考,改在提示詞中顯式描述並用Few-shot示例演示特定任務的推導步驟 。這能顯著減少事實錯誤 。投入較低,效果中等
  • 資料化輸出(Data as Output):讓模型輸出結構化JSON資料而非純文字 。這雖然不直接減少錯誤,但能讓錯誤顯性化、易於被程式處理 。投入極低,效果中等
  • 少樣本示例片段(Few-shot Examples):在提示詞中加入精准的輸入-輸出片段示範 。需注意Few-shot樣本老化速度極快,更像是容易過期的“乳製品” 。投入較低,效果較低
  • 上下文餵養(Context Instead of Pre-training):哪怕是公開常識,也儘量在Context中提供來源資料,避免讓模型盲猜預訓練記憶 。投入較低,效果中等
  • 確定性後處理(Deterministic Post-processing):用傳統代碼校驗模型輸出的代碼或格式,不合規時將報錯回饋給模型進行局部重算 。投入較低,效果中等

C. 終極大招:

  • 回應範本化(Templating Responses):讓模型僅輸出分類標籤和關鍵中繼資料,最終文本由預設的確定性模版生成 。它像死板的會計審計,能徹底消滅幻覺與合規風險 ,但不適用於開放式聊天 。投入中等,效果滿格
  • 置信度預測與人機協同(Confidence + Human Review):讓模型在JSON中輸出自身的置信度評分 。模型對自己“懂不懂”的感知通常比生成內容更准 ,提取該得分後,將低於閾值的案件無縫流轉給人工團隊 。投入中等,效果滿格
  • 多模型協同(Consistency & Majority Vote):通過跨模型一致性校驗(不同模型回答不一致則上報人工)或(加權)多數投票機制來決定最終輸出 。若三個行業頂尖模型給出相同答案,正確率極高 。但這會使系統延遲、算力成本及對比演算法的複雜度成倍激增 。投入中等至高,效果優異

三、 總結:如何構建組合拳?

在真實的智慧體項目研發中,從來沒有單兵作戰的必殺技,筆者認為最好的策略是組合多個方法 :對合規要求嚴苛、絕不容忍幻覺的場景,果斷選用回應範本化 ;而要消滅頻發的事實錯誤,則應按性價比逐步疊加結構化資料、特定推理與上下文餵養,直至達到業務標準為止

作者:馮穎匡博士,香港教育評議會執委兼AI教育工作小組副組長

你 或 有 興 趣 的 文 章