Deepgram
高速高準確的語音 AI API。
Deepgram 是什麼?
Deepgram 提供高速、高準確的語音轉文字與文字轉語音 API,支援即時串流與多語,廣受開發者用於語音應用與語音代理。
Deepgram 的主要功能包括語音轉文字 API、文字轉語音、即時串流、多語,能協助使用者更有效率地完成相關工作,省下大量時間與人力。
Deepgram 可以用來做什麼?
在實際應用上,Deepgram 常被用於即時轉錄、語音代理、語音分析等情境。速度快、準確、好整合,這也是不少使用者選擇它的原因。
Deepgram 的價格與適合對象
Deepgram 提供免費方案,可先免費試用、有需要再升級付費。使用前可以留意:偏開發者、按量計費。如果你正在尋找即時轉錄相關的 AI 工具,Deepgram 值得納入考慮。
TheAI學院 編輯建議
編輯實測後的真心話要為產品接高速語音轉錄,Deepgram 與 AssemblyAI 同為主流 API。我們給 4.4 分。
主要功能
- 語音轉文字 API
- 文字轉語音
- 即時串流
- 多語
適用場景
- 即時轉錄
- 語音代理
- 語音分析
Deepgram 的優點與缺點
👍 優點
- 速度快、準確、好整合
- 適合即時應用
👎 缺點
- 偏開發者
- 按量計費
Deepgram 常見問題
Deepgram 適合誰?
要為應用接語音的開發者。
使用者評價
還沒有足夠評價,搶先分享你的使用心得!
寫下你的評價 ✍️
相關 AI 工具
LOVO AI
以創作者為中心的 AI 語音與影片平台,旗下 Genny 把文字轉語音和影片編輯結合在一起,提供 500 多種音色、100 多種語言,讓你一站完成配音、字幕到影片產出,適合 YouTuber 與內容團隊。
♡InsMelo
克隆人聲、幾秒生出整首歌的 AI 音樂 App。錄一段或上傳一段聲音,它就把這個聲線編成一首完整、由該嗓音演唱的歌——你的、品牌的或角色的都行,iOS、Android 與網頁版資料同步。
♡Respeecher
烏克蘭團隊打造的企業級語音克隆與語音轉語音技術,品質做到被 Lucasfilm、Sony 等好萊塢片廠採用,專攻影視配音與需要高擬真聲音復刻的專業製作。
♡ACE Studio
以 MIDI 與歌詞生成錄音室級 AI 歌聲的工具,內建 140 多種多語歌手模型,還支援聲音克隆,讓不會唱歌的創作者也能做出有人聲演唱的完整作品。
♡Perso AI
韓國團隊做的影片在地化平台,一支影片就能配音、對嘴、翻成 33 種以上語言,還能生成 AI 虛擬人主播,專門解決跨國行銷與教育內容的多語版本問題。
♡Rime
為語音代理打造的擬真語音合成。
✨ 猜你也想看的AI 語音生成
Deepgram 評測:值得用嗎?
Deepgram 實測評測
Deepgram 是一套開發者導向的語音轉文字(STT)API,把音檔或即時音流丟進去,它回傳逐字稿。它不是給你點兩下就好的網頁工具,而是要寫程式接的後端服務。會用它的是要在自家產品裡塞語音功能的工程團隊——語音客服、會議轉錄、字幕系統、語音 agent 都靠它打底。當家模型 Nova-3 主打又快又便宜,另外還有 Aura(TTS)、Flux 跟 Voice Agent API 一整套。
優點:便宜跟快是它的硬實力。Nova-3 預錄音檔約每分鐘 0.0043 美元(換算一小時 0.46 美元),這個價位在主流 STT 裡相當有競爭力,大量轉錄時成本優勢明顯。即時串流延遲低,適合需要邊說邊出字的場景。支援 45 種以上語言,內建講者分離(diarization)、智慧斷句、關鍵詞提示這些實用功能。新用戶送 200 美元額度,夠你把 POC 跑完。
缺點:它是 API,沒有給一般人用的好看介面,不會寫程式的人完全無從下手。中文(尤其繁中、台語夾雜)的辨識準確度過得去但不是頂尖,專有名詞、口音重的場合還是要人工校對。付費走 Pay-As-You-Go 看用量,Growth 方案年繳起跳要四千美元以上,個人玩家用不到那層。各種 add-on(去識別化、關鍵詞)分開計費,最終帳單要自己加總。
適合誰:要在產品裡內建語音功能、重視成本與延遲的工程團隊。不適合:只想把一個會議錄音轉成文字的個人,殺雞用牛刀。
替代方案:同樣是 STT API、準確度導向可比 AssemblyAI;只是要會議記錄的個人,直接用 tl;dv 這類成品工具更省事。
台灣觀點:它是給開發者的「引擎」不是「整車」,選它前先確認你的團隊有人會接 API,也先拿你的中文音檔實測準確度再決定。
本評測由 TheAI學院編輯群整理,內容力求客觀、含優缺點,僅供參考。
最後更新:2026年6月