第 82 篇 · 台北 一份持續書寫的工作日誌

— Whisper 把音檔變成你的 AI 顧問素材

Whisper 超好用,我一直以來都有在用這個工具。

簡單來說,Whisper 是 OpenAI 開源的語音轉文字工具,裝在你自己的電腦上就能用,不用付 API 費、不用上傳到任何雲端,你的音檔完全不會外流。

但重點不是轉文字本身,而是轉完之後能做什麼。

舉個實際的場景:你報名了一堂線上課程,平台需要登入才能看,沒辦法直接複製文字內容。但你可以把音檔下載下來(還記得 Day 72、74 介紹的 agent browser 嗎?連需要登入的平台它都能幫你操作下載),丟給 Whisper 跑一次,幾分鐘就能拿到完整的逐字稿。

拿到逐字稿之後呢?直接貼給 AI 當參考材料。

這一步才是關鍵。你等於把一整堂課的內容變成了 AI 可以讀懂的文本,然後你就可以這樣用:

"這是一堂職涯規劃課的逐字稿,請根據裡面提到的原則幫我檢查我的履歷,告訴我哪些地方可以改進。"

"這是教授上課講的內容,我有幾個地方聽不懂,幫我用白話解釋一下。"

"這是一場產品設計的演講,幫我整理出裡面的核心框架和可以馬上應用的重點。"

AI 瞬間就變成了一個讀過那堂課所有內容的私人顧問,而且你可以一直追問、一直延伸。

再想想其他場景:

會議錄音 → 逐字稿 → 請 AI 幫你整理重點和待辦事項 Podcast → 逐字稿 → 請 AI 幫你萃取跟你工作相關的建議 老師的口頭回饋 → 逐字稿 → 請 AI 幫你根據回饋修改作業

以前這些音檔聽完就聽完了,頂多自己手動做筆記。現在有了 Whisper 加 AI 這個組合,等於每一段錄音都可以變成一個可以互動的知識庫。

怎麼開始?如果你是 Mac 使用者,最簡單的方式就是用 Homebrew 裝:

brew install openai-whisper

裝好之後一行指令就能跑:

whisper your_audio.mp3 --language zh --model medium

zh 是中文,model 可以選 tiny、base、small、medium、large,越大越準但越慢。一般用 medium 就很夠了。如果你的電腦有 GPU 會跑更快,沒有的話 CPU 也能跑,只是要等久一點。

另外如果你不想自己裝,也有很多免費的線上工具可以用,但好處就沒了,因為你的音檔會上傳到別人的伺服器。自己跑的好處就是隱私完全在自己手上。

更進階的玩法:你可以把逐字稿做成一個 skill,讓 AI 不只是讀一次就忘,而是變成一個你可以反覆召喚的專屬顧問。比如你上了一堂履歷撰寫課,把逐字稿整理成 skill 之後,以後每次要改履歷,AI 都會自動帶著那堂課的方法論來幫你,不用每次重新貼逐字稿。等於你把一堂課的知識永久裝進了 AI 的腦袋裡。

我預測未來線上學習平台都會開始提供每堂課程的 skill。為什麼?因為大家不見得有耐心把整堂課看完,但每個人都想直接套用知識、拿到成果。想像一下,你買了一堂課,平台直接給你一個 skill 檔案,匯入之後 AI 就變成那堂課的專屬教練,隨時幫你把學到的東西應用在你的實際工作上。課程的價值不再只是 "看過",而是 "隨時能用"。

這整套流程的核心觀念是:不要讓有價值的語音內容只停留在 "聽過" 的階段。把它轉成文字,就能讓 AI 幫你深度處理、反覆利用。一堂你花錢買的課程,搭配這個方法可以榨出三倍的價值。

你有沒有什麼錄音是一直想整理但懶得動手的?現在可以試試看。

延伸閱讀 看完整 137 篇 →