Anthropic 推出 Claude Fable 5:史上最強模型分成「公開」與「管制」兩版,AI 安全治理進入新階段

6 月 9 日,Anthropic 一口氣端出兩個模型:人人能用的 Claude Fable 5,以及只開放給特定資安與生物研究單位的 Claude Mythos 5。同一個能力分成兩種版本放出來,這個決定本身,可能比模型有多強更值得台灣讀者關注。

Pada sore hari tanggal 9 Juni, seorang teman insinyur yang bekerja pada aplikasi AI di Taipei mengirimkan pesan kepada saya, hanya dengan satu kalimat: "Mereka telah membagi model menjadi dua versi, apakah kamu sudah melihatnya?" Saya membuka pengumuman dari Anthropic, dan terkejut beberapa detik - poin utamanya tidak ada pada skor. Perusahaan ini telah membagi kemampuan terkuat dari generasi yang sama menjadi dua versi: satu disebut Claude Fable 5, yang dapat digunakan oleh kita semua; dan yang lain disebut Claude Mythos 5, hanya untuk unit-unit tertentu yang telah melewati proses verifikasi.

Saya telah melakukan pengamatan tren selama beberapa tahun, dan telah melihat banyak "model terkuat sepanjang masa" yang dirilis. Namun, "memiliki kemampuan yang sama, tetapi memutuskan apakah kamu dapat menggunakannya berdasarkan identitas pengguna" adalah cara yang belum pernah saya lihat sebelumnya, dan ini dilakukan dengan sangat terbuka. Arti dari hal ini jauh lebih besar daripada skor yang diperoleh dalam sebuah daftar.

Latar Belakang

Anthropic adalah perusahaan di balik seri model Claude, dan dalam satu atau dua tahun terakhir, perusahaan ini telah menjadi semakin penting di kalangan perusahaan dan pengembang - banyak orang menulis program, melakukan pencarian jawaban, dan membangun agen AI, dan semua ini menggunakan Claude sebagai dasar. Baru-baru ini, pada akhir Mei, perusahaan ini telah menyelesaikan putaran pendanaan dengan skala yang luar biasa, dan valuasi mereka telah meningkat hingga mendekati satu triliun dolar (kami telah membahas ini sebelumnya dalam artikel Anthropic Mendapatkan Pendanaan Besar). Dengan uang dan kemampuan komputasi yang cukup, langkah selanjutnya adalah merilis model generasi berikutnya.

Namun, model yang dirilis kali ini berbeda. Sebelumnya, model yang dirilis biasanya hanya dibedakan berdasarkan ukuran - kemampuan yang sama, tetapi dengan kecepatan dan harga yang berbeda. Fable 5 dan Mythos 5 dibedakan berdasarkan dimensi yang berbeda: bukan berdasarkan kinerja, melainkan berdasarkan risiko. Fable 5 adalah versi yang telah diproses untuk keamanan, dan cocok untuk penggunaan umum; Mythos 5 memiliki beberapa batasan keamanan yang dilonggarkan, dan hanya tersedia untuk mitra keamanan yang telah melewati proses verifikasi (disebut sebagai "Project Glasswing" oleh Anthropic) dan beberapa peneliti di bidang biologi.

Dengan kata lain, Anthropic telah menentukan bahwa kemampuan model generasi ini sudah terlalu kuat, sehingga "membukanya secara penuh" memiliki risiko, dan karena itu mereka telah memutuskan untuk menyimpan sisi yang paling tajam, dan hanya memberikannya kepada orang-orang yang mereka percayai dan yang benar-benar membutuhkannya.

Poin Utama

Berdasarkan pengumuman resmi dari Anthropic dan rilis bersamaan dari AWS, informasi kunci dari rilis ini adalah sebagai berikut:

  • Rilis dua versi: Claude Fable 5 (tersedia untuk umum) dan Claude Mythos 5 (tersedia untuk unit-unit tertentu yang telah melewati proses verifikasi).
  • Harga yang ditingkatkan: Harga API untuk Fable 5 adalah 10 dolar AS per juta token input, dan 50 dolar AS per juta token output - sekitar dua kali lipat dari harga model sebelumnya, Opus 4.8. Kemampuan yang ditingkatkan juga berarti bahwa biaya yang dikeluarkan juga harus ditingkatkan.
  • Percobaan gratis terbatas: Dari tanggal 9 Juni hingga 22 Juni, pengguna Pro, Max, Tim, dan beberapa skema perusahaan dapat menggunakan Fable 5 secara gratis; setelah tanggal 23 Juni, mereka harus menggunakan kredit yang mereka miliki. Skema perusahaan yang berbasis penggunaan akan mulai dihitung sejak hari pertama rilis.
  • Rilis bersamaan di cloud: Fable 5 telah tersedia di AWS sejak hari pertama rilis, sehingga sangat mudah diakses oleh tim yang sudah menggunakan AWS.
  • Benchmarks yang ditonjolkan: Anthropic menonjolkan bahwa Fable 5 memiliki kinerja terbaik di antara model-model terdepan, berdasarkan pengujian FrontierCode dari Cognition. Namun, perlu diingat bahwa angka "80,3%" yang beredar di luar sana sebenarnya berasal dari lembaga pengujian pihak ketiga (seperti Vellum), dan bukan dari pengumuman resmi Anthropic.

Saya ingin menekankan poin terakhir ini. Ketika model baru dirilis, banyak screenshot skor yang beredar di mana-mana, tetapi perlu diingat bahwa angka-angka yang diberikan oleh pihak ketiga dan oleh perusahaan itu sendiri bisa berbeda. Menggunakan angka-angka pihak ketiga sebagai jaminan resmi adalah salah satu kesalahan yang paling umum dilakukan ketika membaca berita tentang AI.

Analisis Dampak Pasar

Bagi pengguna umum di Taiwan, dua hal yang paling langsung dirasakan adalah: model yang lebih pintar, dan harga yang lebih mahal. Jika kamu adalah pengguna Pro atau Max dari Claude, pastikan untuk menggunakan kesempatan percobaan gratis sebelum tanggal 22 Juni untuk mencoba Fable 5 - terutama jika kamu memiliki tugas yang sulit yang biasanya tidak dapat diselesaikan oleh ChatGPT atau Gemini. Namun, jangan terbiasa menggunakan model termahal untuk semua keperluan - gunakan model yang lebih murah untuk tugas-tugas sehari-hari, dan simpan Fable 5 untuk tugas-tugas yang benar-benar membutuhkannya.

Bagi perusahaan, harga yang ditingkatkan adalah kenyataan yang harus dihadapi. Jika sebuah perusahaan menggunakan Claude untuk layanan pelanggan, pengolahan dokumen, atau alat internal, dan memiliki volume penggunaan yang besar, biaya yang dikeluarkan akan sangat terasa. Saya sarankan untuk tidak langsung beralih ke Fable 5, tetapi untuk melakukan evaluasi terlebih dahulu - gunakan model yang lebih murah untuk tugas-tugas sederhana, dan hanya gunakan Fable 5 untuk tugas-tugas yang benar-benar membutuhkan kemampuan yang lebih tinggi. Ini sesuai dengan observasi kami sebelumnya tentang model MAI dari Microsoft - strategi AI perusahaan untuk tahun 2026 harus berfokus pada "menggunakan model yang berbeda-beda, dan membagi tugas-tugas berdasarkan kemampuan yang dibutuhkan".

Bagi pengembang, mekanisme "verifikasi terlebih dahulu" dari Mythos 5 adalah sinyal yang patut diperhatikan. Jika kamu bekerja pada proyek keamanan, pengujian penetrasi, atau tim merah, dan ingin menggunakan model dengan kemampuan penuh, kamu mungkin perlu melewati proses verifikasi terlebih dahulu. Ini adalah batasan yang masuk akal untuk penelitian keamanan yang sah, tetapi juga berarti bahwa kemampuan model tidak lagi dapat diperoleh dengan hanya membayar - kamu harus "memenuhi syarat" terlebih dahulu. Ketika menggunakan Cursor atau alat pengembangan lainnya dengan Fable 5, kamu hanya akan mendapatkan kemampuan versi umum; kemampuan yang benar-benar "tanpa batasan" tidak dapat diperoleh oleh semua orang.

Tren Pengembangan Masa Depan

Saya percaya bahwa poin utama dari rilis ini adalah bahwa "keamanan AI yang berbasis pada tingkat risiko" telah mulai diterapkan dalam produk. Sebelumnya, keamanan AI hanya dibahas dalam bentuk white paper atau pernyataan prinsip; Fable 5 dan Mythos 5 telah membuatnya menjadi keputusan produk yang nyata - menggunakan kemampuan yang berbeda-beda, dan membagi pengguna berdasarkan identitas mereka.

Dapat diprediksi bahwa perusahaan lain yang mengembangkan model AI akan mengikuti langkah yang sama. Ketika model menjadi terlalu kuat, "membukanya secara penuh" memiliki risiko yang terlalu tinggi, sehingga "menggunakan model yang berbeda-beda berdasarkan tingkat risiko dan identitas pengguna" akan menjadi kebiasaan di industri. Bagi pengguna, ini berarti bahwa "model terkuat" yang mereka dapatkan mungkin sebenarnya adalah "versi yang telah diproses untuk keamanan"; bagi regulator, ini memberikan antarmuka yang dapat diatur.

Tren lainnya adalah bahwa harga dan kemampuan tidak lagi terkait langsung. Jendela percobaan gratis, kemudian menggunakan kredit, dan skema perusahaan yang berbasis penggunaan - Anthropic telah memainkan "coba sebelum bayar" dengan sangat baik. Ini akan membuat pengguna lebih terbiasa dengan "membayar untuk kemampuan terbaik", dan juga membuat perbedaan antara "model yang murah untuk keperluan sehari-hari" dan "model yang mahal untuk tugas-tugas yang sulit" menjadi lebih jelas.

Ringkasan dan Evaluasi dari TheAI Akademi

Jujur saja, skor yang diperoleh oleh Fable 5 tidaklah terlalu penting - setengah tahun kemudian, akan ada model lain yang mengalahkannya. Poin utama dari berita ini adalah bahwa Anthropic telah menunjukkan "bagaimana kemampuan yang lebih kuat harus diimbangi dengan keamanan yang lebih tinggi" dalam sebuah rilis.

Ketika "model terkuat" mulai memutuskan apakah kamu dapat menggunakannya berdasarkan identitas kamu, kita tidak lagi hanya membahas teknologi - kita membahas siapa yang memiliki hak untuk menggunakannya.

Saran yang konkrit untuk pembaca di Taiwan adalah: pertama, jangan sia-siakan jendela percobaan gratis sebelum tanggal 22 Juni - gunakan tugas yang paling sulit yang kamu miliki untuk menguji Fable 5, dan rasakan sendiri apakah harga yang ditingkatkan sepadan; kedua, jika kamu atau perusahaan kamu sangat bergantung pada Claude, sekarang adalah saatnya untuk melakukan evaluasi - bagaimana kamu dapat menggunakan model yang berbeda-beda untuk tugas-tugas yang berbeda, dan menghemat biaya; ketiga, bagi pengembang yang bekerja pada keamanan atau agen AI, perlu untuk memperhatikan tren "verifikasi terlebih dahulu" dari perusahaan seperti Anthropic - siapkan diri kamu untuk melewati proses verifikasi, dan mengerti batasan yang diberlakukan pada kemampuan model.

Sumber

(Artikel ini disusun berdasarkan informasi yang tersedia secara umum, dan harga serta kemampuan model dapat berubah berdasarkan pengumuman resmi dari Anthropic; angka-angka yang diberikan oleh pihak ketiga telah diberi label sebagai demikian, dan perlu diperiksa sebelum digunakan.)

Pertanyaan yang Sering Diajukan

Claude Fable 5 和 Mythos 5 差在哪?

兩者是同一代能力的不同版本,差別在「風險與開放程度」而非效能高低。Fable 5 是經安全處理、面向一般使用者的公開版本;Mythos 5 放寬了部分安全限制,只開放給通過 Anthropic 審查的特定資安夥伴(Project Glasswing)與少數生物領域研究者,一般人無法取得。

Fable 5 的價格是多少?貴嗎?

官方公布的 API 價格為每百萬輸入 token 10 美元、每百萬輸出 token 50 美元,大約是前一代旗艦 Opus 4.8 的兩倍。對重度呼叫的企業應用,輸出費用會明顯反映在帳單上,建議做模型分級、按任務難度分配,而非全部都用最貴的版本。

我可以免費試用 Claude Fable 5 嗎?

在 2026 年 6 月 9 日到 22 日這段期間,Claude 的 Pro、Max、Team 與部分席次制企業方案可免費使用 Fable 5;6 月 23 日起需動用使用額度(credits)。用量計費的企業方案則從上線當天開始計費。把握免費窗口拿難題去實測最划算。

外界說的 SWE-Bench Pro 80.3% 是官方數字嗎?

不是。Anthropic 官方公告主打的是在 Cognition 的 FrontierCode 程式評測上的表現;而「SWE-Bench Pro 80.3%」這類數字來自第三方評測機構的整理,並非官方公告內容。看到跑分時,務必分清楚是官方還是第三方來源,避免把第三方數字當成官方保證。

繁體中文版 →