本內容根據李宏毅老師的 YouTube 影片 「【生成式人工智慧與機器學習導論2025】第 2 講:上下文工程— AI Agent 背後的關鍵技術」 製作。
點擊卡片即可翻面查看答案。
選擇您認為最正確的答案,並分別提交各難度的答案。
1. 根據影片,當語言模型的輸出不理想時,如果我們選擇修改模型的輸入 (x),這個過程稱為什麼?
2. 影片中用哪個例子來展示「上下文學習 (In-context Learning)」的強大能力?
3. Claude 模型的 System Prompt 中明確指示它,當知識截止日期之後的問題時,應該如何回答?
4. 什麼是 AI Agent 與傳統一問一答模式最主要的區別?
5. 影片中,李老師用哪個 AI Agent 工具來示範製作貪食蛇遊戲?
6. 影片提到的 RAG 技術,主要是為了解決語言模型的哪個問題?
7. 為什麼模型需要「長期記憶」功能?
8. 上下文工程的三大基本操作(套路)不包含以下哪一項?
9. 在 Colab 範例中,要讓模型輸出的工具指令(如 `multiply(3,4)`)被真正執行,需要使用哪個 Python 函數?
10. 根據影片,AI Agent 運作的循環是什麼?
11. 「Lost in the middle」現象說明了什麼?
12. 為什麼在 RAG 的過程中加入「reranking」步驟是有益的?
13. 影片中提到,當 AI Agent 執行「Computer Use」(例如訂票)任務時,會產生大量瑣碎的互動紀錄。這時最適合使用哪種上下文工程策略來處理?
14. 根據影片中的實驗,當 RAG 提供的參考資料過多時,模型的表現會如何變化?
15. 多代理人系統如何幫助解決「Context Rot」(上下文腐爛) 的問題?
16. 在 Colab 範例中,如果沒有寫一個迴圈來捕捉模型生成的工具指令並實際執行它,會發生什麼事?
17. 影片中提到,一個好的 System Prompt 會包含哪些內容?
18. 為什麼說 ChatGPT 的「代理人模式」相對安全,而 Gemini CLI 相對危險?
19. 根據影片,模型「深度思考」時產生的「腦內小劇場」,對它最終的回答有什麼作用?
20. 「擠牙膏」式地給予指令,為什麼可能導致模型表現變差?
21. 即使一個模型的 Context Window 達到200萬個 token,為什麼在處理僅1萬個 token 的任務時就可能出錯?
22. 假設你要設計一個 AI Agent 來擔任專案經理,它需要追蹤多個子任務的進度。你會選擇單一 Agent 還是多 Agent 架構?為什麼?
23. 影片中的研究指出,給模型看過去的「正面範例」(答對的題目)比看「負面範例」(答錯的題目)效果更好。這對設計 AI Agent 的學習機制有何啟示?
24. 結合「遞迴式壓縮」和「長期記憶RAG」,你如何設計一個能平衡記憶細節和上下文長度的 AI Agent?
25. 為什麼即使在簡單任務上,多代理人系統的表現也可能不如單一代理人?
26. 語言模型在執行 Computer Use 時,是如何理解螢幕畫面的?
27. 如果一個 AI Agent 在執行任務時,其上下文視窗已滿,最不建議的做法是什麼?
28. 為什麼說上下文工程是一種「人機協同」的過程?
29. 假設一個語言模型在 RAG 任務中,即使正確答案在提供的文件中,它仍然回答錯誤。根據「Lost in the middle」理論,最可能的原因是什麼?
30. 在多代理人寫 overview paper 的例子中,每個只讀一篇論文的 agent 之間需要直接溝通嗎?這體現了什麼優勢?