Microsoft lanza nuevos modelos de IA para voz, texto e imagen (+ precios)

Publicado el:

Microsoft AI, el laboratorio de investigación de la compañía, lanzó recientemente sus nuevos tres modelos de inteligencia artificial (IA) que tienen la capacidad de generar voz, texto e imágenes en video. 

Con este estreno, la empresa tecnológica confirma su objetivo de desarrollar modelos propios de inteligencia artificial multimodal. A pesar de que mantiene un vínculo con OpenAI, Microsoft busca competir con otros laboratorios del sector.

En Microsoft AI, estamos creando IA humanista. Tenemos una visión particular al crear nuestros modelos de IA: poner a los humanos en el centro, optimizarlos para la forma en que las personas se comunican en la vida real y entrenarlos para su uso práctico”, escribió Mustafa Suleyman, CEO del laboratorio, en la publicación del blog.

Microsoft lanzó nuevos modelos de IA

La compañía tecnológica presentó sus más recientes avances en inteligencia artificial, enfocados en mejorar la experiencia de usuario y hacer más versátiles sus servicios.

El nuevo modelo MAI-Transcribe-1 es una herramienta que tiene la capacidad de convertir voz a texto en 25 idiomas. Según informó la empresa, el modelo es 2,5 veces más rápido que su actual servicio Azure Fast.

Por su parte, MAI-Voice-1 es un generador de audio con el que el usuario puede crear voces personalizadas. Microsoft informó que funciona a alta velocidad y permite procesar un minuto de audio en tan solo un segundo.

El tercer modelo que lanzó la compañía es MAI-Image-2 es una herramienta especializada en la creación de videos. Inicialmente, este modelo se presentó el 19 de marzo en MAI Playground, un nuevo software de prueba de modelos de lenguaje a gran escala.

Actualmente, los tres modelos se lanzaron en Microsoft Foundry, mientras que los modelos de transcripción y voz también están disponibles en MAI Playground. “Pronto verán más modelos nuestros en Foundry y directamente en los productos y experiencias de Microsoft”, dijo Suleyman.

Estas innovaciones lanzadas la semana pasada fueron desarrolladas por MAI Superintelligence de Microsoft. El equipo de investigadores de inteligencia artificial, conformado en noviembre de 2025, estuvo liderado por Mustafa Suleyman.

¿Cuál es el precio?

Microsoft espera que sus nuevos modelos de IA lanzados al mercado destaquen por sus características, pero también por su precio. En una publicación en su blog, la compañía afirmó que son más económicos que los de Google y OpenAI.

El precio inicial de MAI-Transcribe-1 es de 0,36 dólares por hora, mientras que la tarifa base de MAI-Voice-1 es de 22 dólares por millón de caracteres. Finalmente, MAI-Image-2 tiene un precio inicial de 5 dólares por millón de tokens para entrada de texto y 33 dólares por millón de tokens para salida de imagen, se lee en una nota de TechCrunch.

El despliegue de estas capacidades por parte de Microsoft intensifica la competencia en el sector de la inteligencia artificial generativa. Esta carrera tecnológica ha llevado a que otros gigantes también muevan sus piezas, como se ha visto recientemente con la integración de ChatGPT y Gemini en el ecosistema de Apple para potenciar sus servicios móviles

Información de TechCrunch / redacción Noti IA

No dejes de leer: Google lanza Lyria 3 Pro: ahora permite crear música de hasta tres minutos


Sigue nuestras redes sociales y sé parte de nuestra comunidad 

Instagram

Telegram

YouTube

X

TikTok

Recientes