Туньи Цяньвэнь значительно снизил цену, поддерживая разработку AI-приложений
21 мая Alibaba Cloud объявила о значительном снижении цен на API вызовы коммерческой модели Tongyi Qianwen и открытой модели для разработчиков. В частности, цена ввода для основной модели Qwen-Long уровня GPT-4 снизилась с 0,02 юаня за 千tokens до 0,5 юаня за миллион tokens, что составляет снижение на 97%.
9 мая этого года компания Alibaba Tongyi представила открытую модель Qwen1.5-110B с параметрами, достигающими 110 миллиардов. Сообщается, что эта модель показала отличные результаты в нескольких бенчмарках, превзойдя модель Meta Llama-3-70B и заняв первое место в рейтинге открытых моделей на HuggingFace.
Текущая стратегия Tongyi Qianwen заключается в комбинировании "снижения цен + открытого кода", что нацелено на решение двух основных проблем, с которыми сталкиваются разработчики приложений ИИ: высокая стоимость API больших моделей и недостаточно высокое качество открытых моделей. Этот подход может способствовать широкому внедрению приложений ИИ.
На самом деле, в последнее время несколько крупных производителей моделей выпустили недорогие продукты или приняли меры по снижению цен:
Глубокий поиск (DeepSeek) под брендом Huanfang Quantization, открытая вторая генерация модели MoE, цена API составляет лишь около одной сотой от цены GPT-4-Turbo.
Zhìpǔ AI снизил цену на вызов модели GLM-3Turbo для личной версии с 5 юаней за миллион токенов до 1 юаня за миллион токенов.
OpenAI представила модель GPT4o, производительность которой сопоставима с GPT-4 Turbo, но цена составляет половину, и она доступна всем пользователям бесплатно.
Цены на входные данные для модели основного пакета бобов снизились до 0,0008 юаней/k Tokens.
Baidu Intelligent Cloud объявила о полной бесплатности двух основных моделей модели Wencin.
Компания iFlytek объявила о бесплатном открытии API iFlytek Spark Lite.
Общее снижение цен на API больших моделей может быть связано с прогрессом в технологиях вывода и снижением затрат. Это предоставляет разработчикам больше возможностей и способствует увеличению их усилий по разработке больших моделей ИИ.
Помимо снижения цен, Alibaba Tongyi также представила различные масштабы и типы моделей, чтобы удовлетворить потребности в разработке приложений для различных сценариев:
8 моделей больших языков с параметрами от 500 миллионов до 110 миллиардов, охватывающих различные потребности от развертывания на устройствах до корпоративных приложений.
Открытые модели визуального понимания Qwen-VL, модели аудиопонимания Qwen-Audio и другие многомодальные модели.
Открытая модель кода CodeQwen1.5-7B и модель смешанного эксперта Qwen1.5-MoE.
Эти меры помогут внедрить технологии ИИ в более широкие области. С постоянным совершенствованием экосистемы больших моделей, у нас есть основания ожидать бурного развития приложений ИИ.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
21 Лайков
Награда
21
6
Поделиться
комментарий
0/400
StakeOrRegret
· 10ч назад
Я думаю, это Alibaba Cloud в панике?
Посмотреть ОригиналОтветить0
HackerWhoCares
· 08-06 00:20
Что дешево? Разве это не просто желание продать услуги?
Посмотреть ОригиналОтветить0
GateUser-c799715c
· 08-06 00:20
Можно снизить еще?
Посмотреть ОригиналОтветить0
GhostChainLoyalist
· 08-06 00:13
Вот оно, что должно было произойти, наконец-то пришло.
Али Туньи Кинь Вэнь значительно снизил цену на 97%, что способствует ускорению разработки AI-приложений.
Туньи Цяньвэнь значительно снизил цену, поддерживая разработку AI-приложений
21 мая Alibaba Cloud объявила о значительном снижении цен на API вызовы коммерческой модели Tongyi Qianwen и открытой модели для разработчиков. В частности, цена ввода для основной модели Qwen-Long уровня GPT-4 снизилась с 0,02 юаня за 千tokens до 0,5 юаня за миллион tokens, что составляет снижение на 97%.
9 мая этого года компания Alibaba Tongyi представила открытую модель Qwen1.5-110B с параметрами, достигающими 110 миллиардов. Сообщается, что эта модель показала отличные результаты в нескольких бенчмарках, превзойдя модель Meta Llama-3-70B и заняв первое место в рейтинге открытых моделей на HuggingFace.
Текущая стратегия Tongyi Qianwen заключается в комбинировании "снижения цен + открытого кода", что нацелено на решение двух основных проблем, с которыми сталкиваются разработчики приложений ИИ: высокая стоимость API больших моделей и недостаточно высокое качество открытых моделей. Этот подход может способствовать широкому внедрению приложений ИИ.
На самом деле, в последнее время несколько крупных производителей моделей выпустили недорогие продукты или приняли меры по снижению цен:
Глубокий поиск (DeepSeek) под брендом Huanfang Quantization, открытая вторая генерация модели MoE, цена API составляет лишь около одной сотой от цены GPT-4-Turbo.
Zhìpǔ AI снизил цену на вызов модели GLM-3Turbo для личной версии с 5 юаней за миллион токенов до 1 юаня за миллион токенов.
OpenAI представила модель GPT4o, производительность которой сопоставима с GPT-4 Turbo, но цена составляет половину, и она доступна всем пользователям бесплатно.
Цены на входные данные для модели основного пакета бобов снизились до 0,0008 юаней/k Tokens.
Baidu Intelligent Cloud объявила о полной бесплатности двух основных моделей модели Wencin.
Компания iFlytek объявила о бесплатном открытии API iFlytek Spark Lite.
Общее снижение цен на API больших моделей может быть связано с прогрессом в технологиях вывода и снижением затрат. Это предоставляет разработчикам больше возможностей и способствует увеличению их усилий по разработке больших моделей ИИ.
Помимо снижения цен, Alibaba Tongyi также представила различные масштабы и типы моделей, чтобы удовлетворить потребности в разработке приложений для различных сценариев:
8 моделей больших языков с параметрами от 500 миллионов до 110 миллиардов, охватывающих различные потребности от развертывания на устройствах до корпоративных приложений.
Открытые модели визуального понимания Qwen-VL, модели аудиопонимания Qwen-Audio и другие многомодальные модели.
Открытая модель кода CodeQwen1.5-7B и модель смешанного эксперта Qwen1.5-MoE.
Эти меры помогут внедрить технологии ИИ в более широкие области. С постоянным совершенствованием экосистемы больших моделей, у нас есть основания ожидать бурного развития приложений ИИ.