Tongyi Qianwen mengalami penurunan harga secara drastis, biaya pengembangan aplikasi AI Sumber Terbuka turun 97%

2025-07-29 01:54:30

Pembuatan abstrak sedang berlangsung

Gelombang penurunan harga model besar datang, kombinasi Qianwen Tongyi membantu aplikasi AI berkembang

Pada 21 Mei, Tongyi Qianwen mengumumkan penurunan harga yang signifikan untuk API panggilan model komersial dan open-source mereka. Di antaranya, harga input model utama Qwen-Long setara dengan tingkat GPT-4 turun dari 0,02 yuan/k untuk 1.000 tokens menjadi 0,5 yuan/untuk 1.000.000 tokens, dengan penurunan mencapai 97%.

Pada 9 Mei lalu, Tongyi merilis model open-source Qwen1.5-110B dengan skala parameter mencapai 1100 miliar. Model ini menunjukkan kinerja luar biasa dalam beberapa pengujian benchmark, melampaui beberapa model open-source terkenal, dan meraih peringkat teratas dalam daftar model open-source tertentu.

Strategi "penurunan harga + open source" sedang menjadi konsensus di antara produsen model besar global. Ini membantu mengatasi dua masalah utama yang dihadapi oleh pengembang aplikasi AI: harga API yang mahal dan kualitas model open source yang kurang, sehingga mendorong penerapan aplikasi AI yang lebih luas.

Belakangan ini, banyak perusahaan pengembang model besar meluncurkan produk dengan harga rendah atau menurunkan harga. Sejak Mei, sebuah perusahaan kuantitatif yang mengembangkan model MoE mengumumkan harga API-nya hanya sebesar satu persen dari model terkenal lainnya; sebuah perusahaan AI menurunkan harga panggilan untuk versi pribadi model sebesar 80%; sebuah perusahaan besar internasional meluncurkan model baru dengan kinerja setara tetapi dengan harga setengah; model utama dari suatu platform asisten pintar hanya dihargai 0.0008 Yuan/kTokens; sebuah perusahaan mesin pencari mengumumkan dua model utama mereka sepenuhnya gratis; sebuah perusahaan teknologi suara menghadirkan API gratis.

Harga API model besar secara umum turun, mungkin disebabkan oleh kemajuan teknologi inferensi dan penurunan biaya. Ini memberikan lebih banyak pilihan bagi pengembang, yang menguntungkan untuk meningkatkan penggunaan dan pengembangan model besar.

Tongyi juga telah meluncurkan beberapa model dengan ukuran parameter yang berbeda untuk memenuhi kebutuhan berbagai skenario. Model kecil dapat diterapkan di perangkat seluler, model besar mendukung aplikasi tingkat perusahaan, sementara model menengah mencari keseimbangan antara kinerja dan efisiensi. Selain itu, juga telah membuka sumber model multimodal seperti visual, audio, dan kode. Langkah-langkah ini akan mendorong penerapan model besar di skenario yang lebih luas.

GPT-14.33%

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

13 Suka