Day 124 模型不是工具：為什麼 Spark 不能靠自己產圖

最近想榨乾訂閱帳號的價值，我打了一個如意算盤：用額度獨立的 Spark（gpt-5.3-codex-spark）去呼叫 GPT Image 2 幫我產圖。Spark 的額度跟 Codex 主帳號分開算，理論上很划算。

結果怎麼弄都不會動。

去翻 Spark announcement 才看到 OpenAI 自己寫得很白：

Spark 目前是 text-only。

我一開始把這句話讀成「模型沒辦法產圖」就放棄了。但停下來想想，其實是我把兩件事混在一起：模型能不能輸出圖片，跟模型能不能呼叫產圖工具，根本是兩回事。

模型像大腦，負責推理跟決定下一步。工具是 runtime 在這次 session 真的有發給它的能力——對電腦下指令、讀寫檔案、控制瀏覽器、產圖，都是工具。runtime 才是發工具的人。

Spark 是 text-only 的意思，是它自己沒辦法直接吐圖片 bytes。但只要 runtime 願意把 image_gen 注入進來，Spark 就能去呼叫——真正產圖的還是後面的 GPT Image 2，image_gen 只是這個 session 的入口。

注意到了嗎？這跟「模型夠不夠聰明」無關，關鍵是這個 session 的 runtime 有沒有把 image_gen 接上。

沒接上，prompt 裡寫一百次「你有 image_gen 工具」也沒用，模型沒地方送 tool call。就像你嘴上說我有相機，現場沒發相機，照片還是拍不出來。

所以 Spark 想自己產圖這條路是死的。如果硬要讓 Spark 帳號產圖，能走的就是另外開腳本，用 OpenAI API 直接打圖片模型——但那就吃 API key 的錢，不是 Codex 訂閱的額度，回到原點。

Claude Code 也是同一套架構：Claude 是模型，Claude Code 這個 runtime 發 Bash、Read、Edit、WebFetch 那些工具，要再多接外部能力就走 MCP。重點是工具不是 prompt 寫一寫就會生出來的，是 runtime 真的註冊進去才算數。

這次學到的事其實只有一句：選 agent 的時候不要只看模型名字，要看這個 session 配到的工具包。同一個模型在不同 runtime 裡，能做的事可以差很多。

reasoning effort 調再高也只是讓它想更久，不會憑空多一個 image_gen。

模型不是工具：為什麼 Spark 不能靠自己產圖