A Queda Acentuada do Preço do Tongyi Qianwen Ajuda no Desenvolvimento de Aplicações de IA
No dia 21 de maio, a Alibaba Cloud anunciou uma redução significativa nos preços de chamadas de API para o modelo de comercialização e modelo de código aberto Tongyi Qianwen voltado para desenvolvedores. Dentre eles, o preço de entrada do modelo principal Qwen-Long no nível GPT-4 do Tongyi Qianwen caiu de 0,02 yuan/k tokens para 0,5 yuan/milhões de tokens, uma redução de até 97%.
No dia 9 de maio, a Alibaba Tongyi lançou o modelo de código aberto Qwen1.5-110B com parâmetros de 1100 bilhões. Diz-se que este modelo teve um desempenho excepcional em várias avaliações de referência, superando o modelo Llama-3-70B da Meta e alcançando o primeiro lugar na tabela de classificação de grandes modelos de código aberto da HuggingFace.
A estratégia combinada de "redução de preços + código aberto" adotada pela Tongyi Qianwen visa resolver duas grandes dores enfrentadas pelos desenvolvedores de aplicações de IA: o alto custo das APIs de grandes modelos e a qualidade insuficiente dos modelos de código aberto. Esta abordagem tem potencial para impulsionar a ampla implementação de aplicações de IA.
Na verdade, recentemente várias empresas de grandes modelos lançaram produtos a preços baixos ou medidas de redução de preços:
A DeepSeek, subsidiária da Huansquare Quant, lançou o modelo MoE de segunda geração de código aberto, com preços de API que representam apenas cerca de um por cento do GPT-4-Turbo.
A Zhìpǔ AI reduziu o preço de chamada do modelo GLM-3Turbo versão pessoal de 5 yuan/por milhão de tokens para 1 yuan/por milhão de tokens.
A OpenAI lançou o modelo GPT4o, com desempenho comparável ao GPT-4 Turbo, mas a metade do preço, e está disponível gratuitamente para todos os usuários.
O preço de entrada da inferência do modelo principal do Doubao caiu para 0,0008 euros/k Tokens.
A Baidu Smart Cloud anunciou que os dois principais modelos do modelo Wenxin estão totalmente gratuitos.
A iFlytek anunciou que a API do iFlytek Spark Lite estará disponível gratuitamente para sempre.
A redução geral dos preços da API do modelo grande pode ser resultado do avanço da tecnologia de inferência e da diminuição dos custos. Isso oferece mais opções aos desenvolvedores, favorecendo o aumento do desenvolvimento de modelos de IA em larga escala.
Além de reduzir os preços, a Alibaba Tongyi também lançou vários modelos de diferentes escalas e tipos para atender às necessidades de desenvolvimento de aplicações em diferentes cenários:
Oito grandes modelos de linguagem com escalas de parâmetros variando de 500 milhões a 110 mil milhões, cobrindo desde implementações em dispositivos até aplicações empresariais e diversas outras necessidades.
Modelos multimodais como o modelo de compreensão visual de código aberto Qwen-VL e o modelo de compreensão de áudio Qwen-Audio.
Modelo de código aberto CodeQwen1.5-7B e modelo de especialistas mistos Qwen1.5-MoE.
Estas medidas ajudarão a promover a aplicação da tecnologia de IA em áreas mais amplas. Com a contínua melhoria do ecossistema de grandes modelos, temos razões para esperar um desenvolvimento próspero das aplicações de IA.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
Alibaba Tongyi Qianwen reduz significativamente o preço em 97% para acelerar o desenvolvimento de aplicações de IA.
A Queda Acentuada do Preço do Tongyi Qianwen Ajuda no Desenvolvimento de Aplicações de IA
No dia 21 de maio, a Alibaba Cloud anunciou uma redução significativa nos preços de chamadas de API para o modelo de comercialização e modelo de código aberto Tongyi Qianwen voltado para desenvolvedores. Dentre eles, o preço de entrada do modelo principal Qwen-Long no nível GPT-4 do Tongyi Qianwen caiu de 0,02 yuan/k tokens para 0,5 yuan/milhões de tokens, uma redução de até 97%.
No dia 9 de maio, a Alibaba Tongyi lançou o modelo de código aberto Qwen1.5-110B com parâmetros de 1100 bilhões. Diz-se que este modelo teve um desempenho excepcional em várias avaliações de referência, superando o modelo Llama-3-70B da Meta e alcançando o primeiro lugar na tabela de classificação de grandes modelos de código aberto da HuggingFace.
A estratégia combinada de "redução de preços + código aberto" adotada pela Tongyi Qianwen visa resolver duas grandes dores enfrentadas pelos desenvolvedores de aplicações de IA: o alto custo das APIs de grandes modelos e a qualidade insuficiente dos modelos de código aberto. Esta abordagem tem potencial para impulsionar a ampla implementação de aplicações de IA.
Na verdade, recentemente várias empresas de grandes modelos lançaram produtos a preços baixos ou medidas de redução de preços:
A DeepSeek, subsidiária da Huansquare Quant, lançou o modelo MoE de segunda geração de código aberto, com preços de API que representam apenas cerca de um por cento do GPT-4-Turbo.
A Zhìpǔ AI reduziu o preço de chamada do modelo GLM-3Turbo versão pessoal de 5 yuan/por milhão de tokens para 1 yuan/por milhão de tokens.
A OpenAI lançou o modelo GPT4o, com desempenho comparável ao GPT-4 Turbo, mas a metade do preço, e está disponível gratuitamente para todos os usuários.
O preço de entrada da inferência do modelo principal do Doubao caiu para 0,0008 euros/k Tokens.
A Baidu Smart Cloud anunciou que os dois principais modelos do modelo Wenxin estão totalmente gratuitos.
A iFlytek anunciou que a API do iFlytek Spark Lite estará disponível gratuitamente para sempre.
A redução geral dos preços da API do modelo grande pode ser resultado do avanço da tecnologia de inferência e da diminuição dos custos. Isso oferece mais opções aos desenvolvedores, favorecendo o aumento do desenvolvimento de modelos de IA em larga escala.
Além de reduzir os preços, a Alibaba Tongyi também lançou vários modelos de diferentes escalas e tipos para atender às necessidades de desenvolvimento de aplicações em diferentes cenários:
Oito grandes modelos de linguagem com escalas de parâmetros variando de 500 milhões a 110 mil milhões, cobrindo desde implementações em dispositivos até aplicações empresariais e diversas outras necessidades.
Modelos multimodais como o modelo de compreensão visual de código aberto Qwen-VL e o modelo de compreensão de áudio Qwen-Audio.
Modelo de código aberto CodeQwen1.5-7B e modelo de especialistas mistos Qwen1.5-MoE.
Estas medidas ajudarão a promover a aplicação da tecnologia de IA em áreas mais amplas. Com a contínua melhoria do ecossistema de grandes modelos, temos razões para esperar um desenvolvimento próspero das aplicações de IA.