Day 128 不要迷信 skill

你是不是也覺得網路上分享的 skill（給 AI 用的「外掛說明書」），沒有別人分享的那麼好用？

我今天遇到的案例可能有些幫助。

先說結論：看到別人分享的 skill，不要直接裝——請 /skill-creator 幫你裝，它會順便驗證這個 skill 在你的情境下到底有沒有幫助。

——

我在實驗一個 Google 工程師寫的 skill — Google Workspace CLI 專案（Google 自家給工程師用的命令列工具）裡的 gws-forms（專門操作 Google 表單的那一組）。看起來有公信力，但實驗跑出來的結果讓我多看了一眼。

有 skill 的版本：通過率 94.1% 沒有 skill 的版本：通過率 96.9%

裝了 skill，反而錯更多。

這是對同一批任務，「用 skill 的 AI」對上「沒有 skill 的 AI」的真實比較，不是捏造的數字。

——

為什麼？

skill 裡有 bug。Google Forms 的 API（程式之間溝通的窗口）有些選項，skill 沒寫到。

一個例子：Google Forms API 預設是直接 published（公開的）。要不公開，要在建立時多帶一個參數 unpublished=true，但 skill 沒提到這件事，AI 就用預設值——使用者明明說「先不要發佈」，AI 還是建出一個已發佈的 form。

沒有 skill 的版本？它沒有說明書，就直接問 API 有哪些參數，從規格書裡看到了 unpublished 這個選項，就用對了。靠現場偵測補上了那份漏寫的說明書。

其他還有三個類似的 bug：欄位寫法過時、JSON 格式不對、處理資料的邏輯算錯——全都是因為 skill 是當初寫好之後就沒再更新。

這些問題，沒有 skill 的版本靠現場偵測大多繞過去了。

——

看到有用的 skill，不要直接裝。請 /skill-creator 幫你安裝。

/skill-creator 裝的時候會順便跑實驗，然後在你的瀏覽器打開 http://localhost:3117/，直接告訴你有 skill 跟沒有 skill 的差別在哪、哪些任務有改善、哪些反而退步。你確認沒問題，它才算安裝完成。

如果 skill 有問題，它會根據實驗結果幫你迭代修改，再重跑一次，直到這個 skill 在你的使用情境下真的比沒有 skill 更好。

修掉那些 bug 之後，再跑一次：

有 skill 的版本：通過率 97%，平均 127.6 秒沒有 skill 的版本：通過率 97%，平均 167.2 秒

正確率追平了，但 skill 版本快了將近 40 秒。

所以 skill 現在的作用，純粹是省時間。要不要裝，就看你有沒有需要每次省下那幾十秒。

我自己的結論：決定不裝。省下的時間不夠抵掉之後要管理、更新、維護這個 skill 的麻煩。

——

這個實驗結果來自「gws-forms 這類 CLI 操作手冊型的 skill」。

gws-forms 本質上是在教 AI 怎麼下指令——而這些指令的最新資訊，AI 自己問 API 就拿得到，skill 反而容易過期或漏寫，價值就有限。

但 best practice 型的 skill 不一樣，例如教 AI 怎麼設計畫面、怎麼跑流程那種——AI 自己摸不出來，skill 有不可取代的價值。同樣跑 /skill-creator 驗證，結果可能完全相反。

所以裝不裝沒有通則，要看 skill 的類型。不確定的話，就多燒一點 token，用 /skill-creator 跑個實驗買個保障吧。

——

skill 是死的，但我們的使用情境不是。

Google 員工寫的 skill 對他自己的任務可能剛好夠用，或是在分享的當下適用，但等我們看到、想拿來用的時候，可能早就過期了。多做驗證這一步，能省下之後反覆修改的麻煩。

每當新的模型推出時，也最好請 /skill-creator 重新驗證一次。

同一個 skill 在新模型上的表現可能完全不同。

——

skill 是要被驗證的，不應該是信仰。

不要迷信 skill