強化學習(Reinforcement Learning)是一種讓人工智慧透過「試誤」來學習的技術,類似於玩闖關遊戲:AI 每次行動會得到獎勵或懲罰,最終自行找出最優策略。
簡單來說,就是「做對得分、做錯扣分」,讓機器在反覆嘗試中累積經驗。
這段比喻來自於一支教育短影音,旨在幫助教師、家長和學生快速理解原本艱澀的 AI 名詞。影片將強化學習拆解為三個步驟:
- 探索:AI 像新手玩家一樣,嘗試各種動作。
- 回饋:每次動作後,環境給予正(獎勵)或負(懲罰)信號。
- 優化:AI 調整策略,趨向能獲得最大累積獎勵的行為。
這套機制讓 AI 能自主學習複雜任務,例如下棋、玩電玩,甚至自動駕駛。對於非技術背景的觀眾,這種「闖關」比喻大幅降低了理解門檻。
若想進一步認識強化學習的實際應用,可以關注相關 YouTube 頻道或教育科技資源。