Deepgram

高速高準確的語音 AI API。

免費或付費 ★ 4.4 / 5
一句話介紹:高速高準確的語音 AI API。

Deepgram 是什麼?

Deepgram 提供高速、高準確的語音轉文字與文字轉語音 API,支援即時串流與多語,廣受開發者用於語音應用與語音代理。

Deepgram 的主要功能包括語音轉文字 API、文字轉語音、即時串流、多語,能協助使用者更有效率地完成相關工作,省下大量時間與人力。

Deepgram 可以用來做什麼?

在實際應用上,Deepgram 常被用於即時轉錄、語音代理、語音分析等情境。速度快、準確、好整合,這也是不少使用者選擇它的原因。

Deepgram 的價格與適合對象

Deepgram 提供免費方案,可先免費試用、有需要再升級付費。使用前可以留意:偏開發者、按量計費。如果你正在尋找即時轉錄相關的 AI 工具,Deepgram 值得納入考慮。

TheAI學院 編輯建議

編輯實測後的真心話
★ 4.4

要為產品接高速語音轉錄,Deepgram 與 AssemblyAI 同為主流 API。我們給 4.4 分。

— theai 編輯團隊

主要功能

  • 語音轉文字 API
  • 文字轉語音
  • 即時串流
  • 多語

適用場景

  • 即時轉錄
  • 語音代理
  • 語音分析

Deepgram 的優點與缺點

👍 優點

  • 速度快、準確、好整合
  • 適合即時應用

👎 缺點

  • 偏開發者
  • 按量計費

Deepgram 常見問題

Deepgram 適合誰?

要為應用接語音的開發者。

使用者評價

還沒有足夠評價,搶先分享你的使用心得!

寫下你的評價 ✍️

評論將經審核後公開。

相關 AI 工具

✨ 猜你也想看的AI 語音生成

Deepgram 評測:值得用嗎?

Deepgram 實測評測

Deepgram 是一套開發者導向的語音轉文字(STT)API,把音檔或即時音流丟進去,它回傳逐字稿。它不是給你點兩下就好的網頁工具,而是要寫程式接的後端服務。會用它的是要在自家產品裡塞語音功能的工程團隊——語音客服、會議轉錄、字幕系統、語音 agent 都靠它打底。當家模型 Nova-3 主打又快又便宜,另外還有 Aura(TTS)、Flux 跟 Voice Agent API 一整套。

優點:便宜跟快是它的硬實力。Nova-3 預錄音檔約每分鐘 0.0043 美元(換算一小時 0.46 美元),這個價位在主流 STT 裡相當有競爭力,大量轉錄時成本優勢明顯。即時串流延遲低,適合需要邊說邊出字的場景。支援 45 種以上語言,內建講者分離(diarization)、智慧斷句、關鍵詞提示這些實用功能。新用戶送 200 美元額度,夠你把 POC 跑完。

缺點:它是 API,沒有給一般人用的好看介面,不會寫程式的人完全無從下手。中文(尤其繁中、台語夾雜)的辨識準確度過得去但不是頂尖,專有名詞、口音重的場合還是要人工校對。付費走 Pay-As-You-Go 看用量,Growth 方案年繳起跳要四千美元以上,個人玩家用不到那層。各種 add-on(去識別化、關鍵詞)分開計費,最終帳單要自己加總。

適合誰:要在產品裡內建語音功能、重視成本與延遲的工程團隊。不適合:只想把一個會議錄音轉成文字的個人,殺雞用牛刀。

替代方案:同樣是 STT API、準確度導向可比 AssemblyAI;只是要會議記錄的個人,直接用 tl;dv 這類成品工具更省事。

台灣觀點:它是給開發者的「引擎」不是「整車」,選它前先確認你的團隊有人會接 API,也先拿你的中文音檔實測準確度再決定。

本評測由 TheAI學院編輯群整理,內容力求客觀、含優缺點,僅供參考。

最後更新:2026年6月

前往 Deepgram 官網 ↗