通义千问大幅降价Открытый исходный код AIприложение разработка стоимость骤降97%

robot
Генерация тезисов в процессе

Пришло время снижения цен на большие модели, комбинация Tongyi Q&A помогает AI-приложениям расцветать

21 мая, Tongyi Qwen объявил о значительном снижении цен на вызовы API для своих коммерческих и открытых моделей. В частности, цена ввода для основного модели уровня GPT-4 Qwen-Long снизилась с 0,02 юаня/k до 0,5 юаня/млн токенов, что составляет снижение на 97%.

9 мая был выпущен открытый модель Qwen1.5-110B с параметрами на уровне 1100 миллиардов. Эта модель показала отличные результаты в нескольких бенчмарках, превзойдя некоторые известные открытые большие модели и заняв первое место в одном из рейтингов открытых больших моделей.

Стратегия "Снижение цен + открытый исходный код" становится общим мнением среди производителей глобальных крупных моделей. Это помогает решить две основные проблемы, с которыми сталкиваются разработчики AI-приложений: высокие цены на API и недостаточное качество открытых моделей, что, в свою очередь, способствует широкому внедрению AI-приложений.

В последнее время несколько крупных производителей моделей выпустили недорогие продукты или снизили цены. С мая месяца цена на API модели MoE, выпущенной одной квантовой компанией, составляет всего одну сотую от известной модели; одна AI компания снизила цену на использование личной версии модели на 80%; одна международная компания представила новую модель с сопоставимой производительностью, но по цене в два раза ниже; основная модель одной платформы интеллектуального помощника стоит всего 0.0008 юаней за k Tokens; одна поисковая компания объявила, что две основные модели теперь полностью бесплатны; одна компания по голосовым технологиям открыла бесплатный API.

Цены на API больших моделей в целом снижены, что, возможно, связано с прогрессом в технологиях вывода и снижением затрат. Это предоставляет разработчикам больше возможностей, что способствует увеличению использования больших моделей в разработке.

Туньи также выпустила несколько моделей с различными параметрами, чтобы удовлетворить потребности различных сценариев. Малые модели могут быть развернуты на мобильных устройствах, крупные модели поддерживают корпоративные приложения, а средние модели стремятся найти баланс между производительностью и эффективностью. Кроме того, были открыты многомодальные модели, такие как визуальные, аудио и кодовые. Эти меры будут способствовать применению больших моделей в более широких сценариях.

GPT-14.75%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 5
  • Поделиться
комментарий
0/400
zkProofInThePuddingvip
· 07-29 11:03
Снижение цен благоприятная информация для всей отрасли
Посмотреть ОригиналОтветить0
Anon4461vip
· 07-29 02:24
Началась ценовая война
Посмотреть ОригиналОтветить0
ChainMelonWatchervip
· 07-29 02:19
Снижение цены на Alibaba, да?
Посмотреть ОригиналОтветить0
LowCapGemHuntervip
· 07-29 02:04
Падение затрат — это хорошо
Посмотреть ОригиналОтветить0
fork_in_the_roadvip
· 07-29 02:03
Ещё одна конкуренция вниз
Посмотреть ОригиналОтветить0
  • Закрепить