Али Туньи Кинь Вэнь значительно снизил цену на 97%, что способствует ускорению разработки AI-приложений.

robot
Генерация тезисов в процессе

Туньи Цяньвэнь значительно снизил цену, поддерживая разработку AI-приложений

21 мая Alibaba Cloud объявила о значительном снижении цен на API вызовы коммерческой модели Tongyi Qianwen и открытой модели для разработчиков. В частности, цена ввода для основной модели Qwen-Long уровня GPT-4 снизилась с 0,02 юаня за 千tokens до 0,5 юаня за миллион tokens, что составляет снижение на 97%.

9 мая этого года компания Alibaba Tongyi представила открытую модель Qwen1.5-110B с параметрами, достигающими 110 миллиардов. Сообщается, что эта модель показала отличные результаты в нескольких бенчмарках, превзойдя модель Meta Llama-3-70B и заняв первое место в рейтинге открытых моделей на HuggingFace.

Текущая стратегия Tongyi Qianwen заключается в комбинировании "снижения цен + открытого кода", что нацелено на решение двух основных проблем, с которыми сталкиваются разработчики приложений ИИ: высокая стоимость API больших моделей и недостаточно высокое качество открытых моделей. Этот подход может способствовать широкому внедрению приложений ИИ.

На самом деле, в последнее время несколько крупных производителей моделей выпустили недорогие продукты или приняли меры по снижению цен:

  • Глубокий поиск (DeepSeek) под брендом Huanfang Quantization, открытая вторая генерация модели MoE, цена API составляет лишь около одной сотой от цены GPT-4-Turbo.

  • Zhìpǔ AI снизил цену на вызов модели GLM-3Turbo для личной версии с 5 юаней за миллион токенов до 1 юаня за миллион токенов.

  • OpenAI представила модель GPT4o, производительность которой сопоставима с GPT-4 Turbo, но цена составляет половину, и она доступна всем пользователям бесплатно.

  • Цены на входные данные для модели основного пакета бобов снизились до 0,0008 юаней/k Tokens.

  • Baidu Intelligent Cloud объявила о полной бесплатности двух основных моделей модели Wencin.

  • Компания iFlytek объявила о бесплатном открытии API iFlytek Spark Lite.

Общее снижение цен на API больших моделей может быть связано с прогрессом в технологиях вывода и снижением затрат. Это предоставляет разработчикам больше возможностей и способствует увеличению их усилий по разработке больших моделей ИИ.

Помимо снижения цен, Alibaba Tongyi также представила различные масштабы и типы моделей, чтобы удовлетворить потребности в разработке приложений для различных сценариев:

  • 8 моделей больших языков с параметрами от 500 миллионов до 110 миллиардов, охватывающих различные потребности от развертывания на устройствах до корпоративных приложений.

  • Открытые модели визуального понимания Qwen-VL, модели аудиопонимания Qwen-Audio и другие многомодальные модели.

  • Открытая модель кода CodeQwen1.5-7B и модель смешанного эксперта Qwen1.5-MoE.

Эти меры помогут внедрить технологии ИИ в более широкие области. С постоянным совершенствованием экосистемы больших моделей, у нас есть основания ожидать бурного развития приложений ИИ.

GPT-12.19%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 6
  • Поделиться
комментарий
0/400
StakeOrRegretvip
· 10ч назад
Я думаю, это Alibaba Cloud в панике?
Посмотреть ОригиналОтветить0
HackerWhoCaresvip
· 08-06 00:20
Что дешево? Разве это не просто желание продать услуги?
Посмотреть ОригиналОтветить0
GateUser-c799715cvip
· 08-06 00:20
Можно снизить еще?
Посмотреть ОригиналОтветить0
GhostChainLoyalistvip
· 08-06 00:13
Вот оно, что должно было произойти, наконец-то пришло.
Посмотреть ОригиналОтветить0
MoonlightGamervip
· 08-06 00:04
Это падение слишком резкое, не так ли?
Посмотреть ОригиналОтветить0
BankruptcyArtistvip
· 08-05 23:57
Сильно, Али! Такая цена!
Посмотреть ОригиналОтветить0
  • Закрепить