台灣自己的 AI:雅婷逐字稿、TAIDE 與繁中模型的現況與機會
當大家都在用國外的 AI,台灣有沒有自己的 AI?答案是有。這篇介紹雅婷逐字稿、TAIDE 這些立足繁體中文與台灣脈絡的在地 AI,談談它們的定位、現況,以及『台灣為什麼需要自己的 AI』。
Setiap kali membicarakan AI, selalu ada yang bertanya: "Apakah Taiwan memiliki AI-nya sendiri atau hanya bisa menggunakan yang dari luar negeri?" Ini adalah pertanyaan yang baik, dan jawabannya lebih optimis dari yang Anda bayangkan - Taiwan memang memiliki AI yang berdiri di atas bahasa Tionghoa tradisional dan konteks lokal, dan masing-masing memiliki aplikasi yang sangat praktis.
Aplikasi Paling Praktis: Transkrip Suara Yating
Transkrip Suara Yating mungkin adalah salah satu AI lokal Taiwan yang paling banyak digunakan. Ini fokus pada pengubahan suara bahasa Tionghoa menjadi teks, dan jarang sekali memasukkan 'dialek Taiwan' ke dalamnya, sehingga sangat berguna bagi jurnalis, mahasiswa, catatan rapat, dan wawancara lapangan. Ketika alat internasional sering kali kesulitan menghadapi aksen Taiwan, dialek Taiwan, dan istilah khusus lokal, alat seperti Yating yang 'disesuaikan untuk Taiwan' menunjukkan nilainya.
Model Tionghoa Tradisional Nasional: TAIDE
TAIDE adalah proyek model besar bahasa Tionghoa tradisional yang didukung oleh pemerintah Taiwan dan dipromosikan oleh tim penelitian, dengan tujuan menciptakan model dasar yang benar-benar memahami bahasa, budaya, dan nilai Taiwan. Artinya tidak hanya 'sekedar chatbot lain', tetapi juga memastikan Taiwan memiliki kemampuan model Tionghoa tradisional di era AI, tanpa harus sepenuhnya bergantung pada perusahaan besar luar negeri.
Mengapa Taiwan Membutuhkan AI-nya Sendiri?
Pertanyaan ini layak dijawab dengan serius, dengan tiga alasan.
Pertama, bahasa Tionghoa tradisional dan konteks Taiwan adalah kelemahan model internasional. Model besar internasional sebagian besar menggunakan data bahasa Inggris dan Tionghoa sederhana sebagai dasar, sehingga sering kali memiliki kesenjangan dalam memahami istilah bahasa Tionghoa tradisional, peraturan, sejarah, dan pengetahuan lokal Taiwan. Jika Taiwan memiliki modelnya sendiri, maka 'detail-detail yang paling memahami Taiwan' dapat dilakukan dengan benar.
Kedua, kemandirian data dan keamanan. Bidang pemerintahan, kesehatan, hukum, dan lain-lain yang sensitif tidak mungkin membagikan data secara penuh kepada cloud luar negeri. Dengan memiliki model Tionghoa tradisional yang dapat diterapkan secara lokal, AI dapat digunakan tanpa harus mengorbankan data.
Ketiga, kekuatan industri. Taiwan memiliki kekuatan besar dalam semikonduktor dan perangkat keras, jika juga dapat mempertahankan posisinya dalam model dan aplikasi, maka dapat memiliki kekuatan lebih lengkap dalam rantai pasokan AI, bukan hanya sekedar menjadi pihak ketiga.
Kondisi Saat Ini dan Peluang: Lebih Praktis
Jujur saja, AI lokal Taiwan dalam hal skala dan sumber daya tidak dapat bersaing langsung dengan raksasa internasional, ini adalah kenyataan. Namun, ini tidak berarti tidak ada peluang - pengalaman lokalisasi AI di Korea dan Jepang mengajarkan kita bahwa kemenangan di pasar kecil tidak terletak pada 'yang terbesar', tetapi pada 'yang paling memahami lokal' dan 'yang paling dapat mengintegrasikan kebutuhan lokal'.
Bagi Taiwan, jalur yang paling praktis adalah: menggunakan model sumber terbuka internasional dengan baik dalam kemampuan umum, dan dalam 'bahasa Tionghoa tradisional, dialek Taiwan, pengetahuan lokal, dan industri tertentu' yang tidak dapat dilakukan dengan baik oleh model internasional, membuat yang terbaik. Yating yang berhasil merekam dialek Taiwan dan TAIDE yang mempertahankan model dasar bahasa Tionghoa tradisional adalah langkah-langkah yang solid dalam jalur ini.
Apakah Taiwan memiliki AI-nya sendiri? Ya, dan itu sedang tumbuh. Ini mungkin tidak akan menjadi yang terbesar dalam hal parameter, tetapi asalkan 'memahami Taiwan' dilakukan dengan sempurna, maka akan memiliki posisi yang tidak dapat digantikan.
Pertanyaan yang Sering Diajukan
台灣有自己的 AI 嗎?
有,例如專注中文與台語語音轉文字的雅婷逐字稿,以及政府支持的繁中大模型計畫 TAIDE。
雅婷逐字稿有什麼特別?
它為台灣調校,把台語也納入語音轉文字,對台灣口音與在地專有名詞的處理優於多數國際工具。
台灣為什麼需要自己的 AI?
因為繁中與台灣脈絡是國際模型的弱項,加上資料自主、資安與產業話語權的需求,自有繁中模型有其必要。