LLM(大型語言模型)就是 ChatGPT、Claude、Gemini 這些「會聊天的 AI」背後的大腦。它讀過幾乎全部網路上的文字,所以「什麼都懂一點」,可以幫你寫文章、回答問題、翻譯。
但它有些事情真的做不到,硬要它做就會出錯。這頁就是要告訴你:哪些事可以放心交給 AI,哪些事一定要自己檢查。
擅長 vs 不擅長
從任務性質快速判斷是否適合交給 LLM
系統性限制一覽
這些不是 bug(程式錯誤),而是 LLM 本身運作方式造成的「天生限制」——就像鳥不會游泳一樣,是天生的特性
| 限制 | 說明 | 對應做法 |
|---|---|---|
| 即時資訊 | 知識有截止日期,不知道最新的新聞、政策、資料例如 AI 不知道今天天氣 | 搭配網路搜尋工具或 RAG(讓 AI 邊查資料邊回答)補足 |
| 數字計算 | AI 是「用統計猜下一個字」的方式運作,不是真的會算數學,所以複雜計算容易錯 | 複雜計算交給 Excel 或請 AI 寫程式來算 |
| 幻覺 | 可能捏造聽起來合理但錯誤的事實、引用、數據例如 AI 編造不存在的法條 | 事實類輸出一律人工查核 |
| 記憶有限 | 原本每次對話結束就清空。現在 ChatGPT、Claude 有加記憶功能,但不是百分百可靠 | 重要背景每次對話開頭重新提供,不要只依賴 AI 記得 |
| Context 上限能讀的文字量 | 單次對話能處理的文字量有上限,太長的文件會被截斷或遺忘前面內容 | 長文件分段處理,或使用 RAG(檢索式問答) |
| 無法執行行動 | 原本只能輸出文字,不能自動寄信、存檔、操作系統 | 需串接 Agent 或工具才能執行實際動作 |
| 長遠判斷 | 「這個決策對公司 3 年後的影響」這種需要全面評估的事,AI 給的答案不能盡信 | LLM 提供思考框架,最後決策由人來做 |
邊界判斷框架
面對任何任務,用這個框架快速判斷 LLM 的參與程度
輸出可被人驗證且修改成本低。例如草稿、翻譯、摘要、程式碼片段。
輸出難以被輕易驗證。例如事實性陳述、數字、引用來源。
涉及法律、財務責任或無法復原的行動。LLM 提供資訊,人負責決定。
對不同對象的說明方式
點擊展開各對象的說明話術與溝通重點
「LLM 可以幫我們把過去要花 2 小時寫的報告初稿壓縮到 20 分鐘,但最終內容仍需要由我們審閱、補充內部數據並確認正確性。它加速的是生產力,不是取代判斷力。」
重點:效率數字 + 人仍在決策迴圈中 + 內容品質由人把關
「把它想成一個博學但沒有在你公司待過的新人——文字能力很強、什麼都知道一點,但需要你給它脈絡,也需要你 review 它的輸出。」
重點:降低神秘感 + 說清楚需要人配合的地方 + 不誇大能力
「我們使用 LLM 生成的內容都會經過人工審核,不直接對外發布。LLM 不接觸機敏資料,也不做最終決策。所有對外的文件與建議,責任仍由我們的團隊承擔。」
重點:資料邊界 + 審核機制 + 責任歸屬清楚
「我們借助 AI 工具提升交付效率,但所有對外內容、建議與分析均由我們的專業團隊負責審核與把關。」
重點:不迴避使用 AI + 強調專業審核 + 品質由人負責
「先讓它生成一個 80 分的初稿,你再把它改到 100 分。但永遠記得:它說的事實需要你查證,它不知道我們公司的內部狀況,數字更要特別小心。」
重點:80 分初稿心態 + 三個必查的點(事實、內部資訊、數字)
💡
LLM 擅長「把事情說清楚、寫出來」,不擅長「確認事情是否為真、決定事情該怎麼做」。
讓它處理「表達與整理」,讓人負責「判斷與決策」。