Пришло время снижения цен на большие модели, комбинация Tongyi Q&A помогает AI-приложениям расцветать
21 мая, Tongyi Qwen объявил о значительном снижении цен на вызовы API для своих коммерческих и открытых моделей. В частности, цена ввода для основного модели уровня GPT-4 Qwen-Long снизилась с 0,02 юаня/k до 0,5 юаня/млн токенов, что составляет снижение на 97%.
9 мая был выпущен открытый модель Qwen1.5-110B с параметрами на уровне 1100 миллиардов. Эта модель показала отличные результаты в нескольких бенчмарках, превзойдя некоторые известные открытые большие модели и заняв первое место в одном из рейтингов открытых больших моделей.
Стратегия "Снижение цен + открытый исходный код" становится общим мнением среди производителей глобальных крупных моделей. Это помогает решить две основные проблемы, с которыми сталкиваются разработчики AI-приложений: высокие цены на API и недостаточное качество открытых моделей, что, в свою очередь, способствует широкому внедрению AI-приложений.
В последнее время несколько крупных производителей моделей выпустили недорогие продукты или снизили цены. С мая месяца цена на API модели MoE, выпущенной одной квантовой компанией, составляет всего одну сотую от известной модели; одна AI компания снизила цену на использование личной версии модели на 80%; одна международная компания представила новую модель с сопоставимой производительностью, но по цене в два раза ниже; основная модель одной платформы интеллектуального помощника стоит всего 0.0008 юаней за k Tokens; одна поисковая компания объявила, что две основные модели теперь полностью бесплатны; одна компания по голосовым технологиям открыла бесплатный API.
Цены на API больших моделей в целом снижены, что, возможно, связано с прогрессом в технологиях вывода и снижением затрат. Это предоставляет разработчикам больше возможностей, что способствует увеличению использования больших моделей в разработке.
Туньи также выпустила несколько моделей с различными параметрами, чтобы удовлетворить потребности различных сценариев. Малые модели могут быть развернуты на мобильных устройствах, крупные модели поддерживают корпоративные приложения, а средние модели стремятся найти баланс между производительностью и эффективностью. Кроме того, были открыты многомодальные модели, такие как визуальные, аудио и кодовые. Эти меры будут способствовать применению больших моделей в более широких сценариях.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
13 Лайков
Награда
13
5
Поделиться
комментарий
0/400
zkProofInThePudding
· 07-29 11:03
Снижение цен благоприятная информация для всей отрасли
通义千问大幅降价Открытый исходный код AIприложение разработка стоимость骤降97%
Пришло время снижения цен на большие модели, комбинация Tongyi Q&A помогает AI-приложениям расцветать
21 мая, Tongyi Qwen объявил о значительном снижении цен на вызовы API для своих коммерческих и открытых моделей. В частности, цена ввода для основного модели уровня GPT-4 Qwen-Long снизилась с 0,02 юаня/k до 0,5 юаня/млн токенов, что составляет снижение на 97%.
9 мая был выпущен открытый модель Qwen1.5-110B с параметрами на уровне 1100 миллиардов. Эта модель показала отличные результаты в нескольких бенчмарках, превзойдя некоторые известные открытые большие модели и заняв первое место в одном из рейтингов открытых больших моделей.
Стратегия "Снижение цен + открытый исходный код" становится общим мнением среди производителей глобальных крупных моделей. Это помогает решить две основные проблемы, с которыми сталкиваются разработчики AI-приложений: высокие цены на API и недостаточное качество открытых моделей, что, в свою очередь, способствует широкому внедрению AI-приложений.
В последнее время несколько крупных производителей моделей выпустили недорогие продукты или снизили цены. С мая месяца цена на API модели MoE, выпущенной одной квантовой компанией, составляет всего одну сотую от известной модели; одна AI компания снизила цену на использование личной версии модели на 80%; одна международная компания представила новую модель с сопоставимой производительностью, но по цене в два раза ниже; основная модель одной платформы интеллектуального помощника стоит всего 0.0008 юаней за k Tokens; одна поисковая компания объявила, что две основные модели теперь полностью бесплатны; одна компания по голосовым технологиям открыла бесплатный API.
Цены на API больших моделей в целом снижены, что, возможно, связано с прогрессом в технологиях вывода и снижением затрат. Это предоставляет разработчикам больше возможностей, что способствует увеличению использования больших моделей в разработке.
Туньи также выпустила несколько моделей с различными параметрами, чтобы удовлетворить потребности различных сценариев. Малые модели могут быть развернуты на мобильных устройствах, крупные модели поддерживают корпоративные приложения, а средние модели стремятся найти баланс между производительностью и эффективностью. Кроме того, были открыты многомодальные модели, такие как визуальные, аудио и кодовые. Эти меры будут способствовать применению больших моделей в более широких сценариях.