La gran reducción de precio de Tongyi Qianwen ayuda al desarrollo de aplicaciones de IA
El 21 de mayo, Alibaba Cloud anunció una reducción significativa en los precios de las llamadas a la API del modelo comercial y del modelo de código abierto de Tongyi Qianwen para desarrolladores. Entre ellos, el precio de entrada del modelo principal Qwen-Long de nivel GPT-4 de Tongyi Qianwen se redujo de 0.02 CNY/k tokens a 0.5 CNY/millón de tokens, lo que representa una disminución del 97%.
El 9 de mayo, Alibaba Tongyi lanzó el modelo de código abierto Qwen1.5-110B con parámetros que alcanzan los 1100 millones. Se dice que este modelo ha tenido un rendimiento excepcional en múltiples evaluaciones de referencia, superando al modelo Llama-3-70B de Meta, y ha alcanzado la cima de la lista de modelos de código abierto de HuggingFace.
La estrategia combinada de "reducción de precios + código abierto" adoptada por Tongyi Qianwen tiene como objetivo resolver los dos grandes problemas que enfrentan los desarrolladores de aplicaciones de IA: el alto costo de las API de modelos grandes y la calidad insuficiente de los modelos de código abierto. Esta práctica tiene el potencial de impulsar la implementación generalizada de aplicaciones de IA.
De hecho, recientemente varias empresas de grandes modelos han lanzado productos a bajo precio o han tomado medidas de reducción de precios:
DeepSeek, bajo la marca de Huanfang Quantitative, ha lanzado un modelo MoE de segunda generación de código abierto, con un precio de API de solo alrededor del uno por ciento del precio de GPT-4-Turbo.
Zhipu AI ha reducido el precio de uso del modelo GLM-3Turbo de la versión personal de 5 yuanes/ millón de tokens a 1 yuan/ millón de tokens.
OpenAI ha lanzado el modelo GPT4o, cuyo rendimiento es comparable al de GPT-4 Turbo pero a mitad de precio, y está disponible de forma gratuita para todos los usuarios.
El precio de entrada de la inferencia del modelo de principal de Doubao ha bajado a 0.0008 yuanes/k Tokens.
Baidu Intelligent Cloud anuncia que los dos principales modelos del modelo WENXIN son completamente gratuitos.
iFLYTEK anuncia que la API de iFLYTEK Spark Lite estará disponible de forma gratuita para siempre.
La reducción general de los precios de la API de grandes modelos puede deberse a los avances en la tecnología de inferencia y a la reducción de costos. Esto proporciona más opciones a los desarrolladores, lo que les beneficia para aumentar sus esfuerzos en el desarrollo de grandes modelos de IA.
Además de reducir precios, Alibaba Tongyi también ha lanzado varios modelos de diferentes escalas y tipos para satisfacer las necesidades de desarrollo de aplicaciones en diferentes escenarios:
Ocho modelos de lenguaje de gran tamaño con parámetros que varían de 500 millones a 1100 k, cubriendo diversas necesidades desde el despliegue en el lado del cliente hasta aplicaciones empresariales.
Modelos multimodales como Qwen-VL, un modelo de comprensión visual de código abierto, y Qwen-Audio, un modelo de comprensión de audio.
Modelo de código abierto CodeQwen1.5-7B y modelo de expertos mixtos Qwen1.5-MoE.
Estas medidas ayudarán a impulsar la aplicación de la tecnología de IA en una gama más amplia de campos. Con la continua mejora del ecosistema de modelos grandes, tenemos razones para esperar un desarrollo floreciente de las aplicaciones de IA.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
21 me gusta
Recompensa
21
6
Compartir
Comentar
0/400
StakeOrRegret
· hace21h
¿Estoy pensando que Alibaba Cloud está ansioso?
Ver originalesResponder0
HackerWhoCares
· 08-06 00:20
¿Qué es barato? ¿No es solo querer vender servicios?
Ali Tongyi k preguntó una reducción de precio del 97% para acelerar el desarrollo de aplicaciones de IA.
La gran reducción de precio de Tongyi Qianwen ayuda al desarrollo de aplicaciones de IA
El 21 de mayo, Alibaba Cloud anunció una reducción significativa en los precios de las llamadas a la API del modelo comercial y del modelo de código abierto de Tongyi Qianwen para desarrolladores. Entre ellos, el precio de entrada del modelo principal Qwen-Long de nivel GPT-4 de Tongyi Qianwen se redujo de 0.02 CNY/k tokens a 0.5 CNY/millón de tokens, lo que representa una disminución del 97%.
El 9 de mayo, Alibaba Tongyi lanzó el modelo de código abierto Qwen1.5-110B con parámetros que alcanzan los 1100 millones. Se dice que este modelo ha tenido un rendimiento excepcional en múltiples evaluaciones de referencia, superando al modelo Llama-3-70B de Meta, y ha alcanzado la cima de la lista de modelos de código abierto de HuggingFace.
La estrategia combinada de "reducción de precios + código abierto" adoptada por Tongyi Qianwen tiene como objetivo resolver los dos grandes problemas que enfrentan los desarrolladores de aplicaciones de IA: el alto costo de las API de modelos grandes y la calidad insuficiente de los modelos de código abierto. Esta práctica tiene el potencial de impulsar la implementación generalizada de aplicaciones de IA.
De hecho, recientemente varias empresas de grandes modelos han lanzado productos a bajo precio o han tomado medidas de reducción de precios:
DeepSeek, bajo la marca de Huanfang Quantitative, ha lanzado un modelo MoE de segunda generación de código abierto, con un precio de API de solo alrededor del uno por ciento del precio de GPT-4-Turbo.
Zhipu AI ha reducido el precio de uso del modelo GLM-3Turbo de la versión personal de 5 yuanes/ millón de tokens a 1 yuan/ millón de tokens.
OpenAI ha lanzado el modelo GPT4o, cuyo rendimiento es comparable al de GPT-4 Turbo pero a mitad de precio, y está disponible de forma gratuita para todos los usuarios.
El precio de entrada de la inferencia del modelo de principal de Doubao ha bajado a 0.0008 yuanes/k Tokens.
Baidu Intelligent Cloud anuncia que los dos principales modelos del modelo WENXIN son completamente gratuitos.
iFLYTEK anuncia que la API de iFLYTEK Spark Lite estará disponible de forma gratuita para siempre.
La reducción general de los precios de la API de grandes modelos puede deberse a los avances en la tecnología de inferencia y a la reducción de costos. Esto proporciona más opciones a los desarrolladores, lo que les beneficia para aumentar sus esfuerzos en el desarrollo de grandes modelos de IA.
Además de reducir precios, Alibaba Tongyi también ha lanzado varios modelos de diferentes escalas y tipos para satisfacer las necesidades de desarrollo de aplicaciones en diferentes escenarios:
Ocho modelos de lenguaje de gran tamaño con parámetros que varían de 500 millones a 1100 k, cubriendo diversas necesidades desde el despliegue en el lado del cliente hasta aplicaciones empresariales.
Modelos multimodales como Qwen-VL, un modelo de comprensión visual de código abierto, y Qwen-Audio, un modelo de comprensión de audio.
Modelo de código abierto CodeQwen1.5-7B y modelo de expertos mixtos Qwen1.5-MoE.
Estas medidas ayudarán a impulsar la aplicación de la tecnología de IA en una gama más amplia de campos. Con la continua mejora del ecosistema de modelos grandes, tenemos razones para esperar un desarrollo floreciente de las aplicaciones de IA.