Microsoft está trabajando en un nuevo modelo de lenguaje de IA a gran escala llamado MAI-1, que potencialmente podría rivalizar con los modelos de última generación de Google, Anthropic y OpenAI, según un informe de Información. Esta es la primera vez que Microsoft desarrolla un modelo interno de IA de esta escala desde que invirtió más de 10 mil millones de dólares en OpenAI para asegurarse el derecho a reutilizar los modelos de IA de la startup. GPT-4 de OpenAI impulsa no solo ChatGPT sino también Microsoft Copilot.
El desarrollo de MAI-1 está dirigido por Mustafa Suleyman, el exlíder de IA de Google que recientemente se desempeñó como director ejecutivo de la startup de IA Inflection antes de que Microsoft adquiriera la mayor parte del personal y la propiedad intelectual de la startup por 650 millones de dólares en marzo. Bien que MAI-1 puisse s'appuyer sur des techniques apportées par l'ancien personnel d'Inflection, il s'agirait d'un tout nouveau modèle de langage étendu (LLM), comme l'ont confirmé deux employés de Microsoft familiers avec el proyecto.
Con alrededor de 500 mil millones de parámetros, MAI-1 será significativamente más grande que los modelos anteriores de código abierto de Microsoft (como Phi-3, sobre el cual informamos el mes pasado), lo que requerirá más potencia informática y datos de entrenamiento. Esto colocaría a MAI-1 en una liga similar al GPT-4 de OpenAI, que es rumor con más de 1 billón de parámetros (en una configuración experta mixta) y muy por encima de modelos más pequeños como los modelos de 70 mil millones de parámetros de Meta y Mistral.
El desarrollo de MAI-1 sugiere un enfoque dual hacia la IA dentro de Microsoft, centrándose tanto en modelos de lenguaje pequeño ejecutados localmente para dispositivos móviles como en modelos de vanguardia más grandes impulsados por la nube. Según se informa, Apple está explorando un enfoque similar. También subraya el deseo de la compañía de explorar el desarrollo de la IA independientemente de OpenAI, cuya tecnología actualmente impulsa las funciones de IA generativa más ambiciosas de Microsoft, incluido un chatbot integrado en Windows.
Al parecer, el propósito exacto de MAI-1 no ha sido determinado (ni siquiera dentro de Microsoft), y su uso más ideal dependerá de su rendimiento, según una de las fuentes de The Information. Para entrenar el modelo, Microsoft asignó un gran grupo de servidores con GPU Nvidia y recopiló datos de entrenamiento de varias fuentes, incluido texto generado por GPT-4 de OpenAI y datos públicos de Internet.
Dependiendo del progreso en las próximas semanas, The Information informa que Microsoft podría obtener una vista previa de MAI-1 ya en su conferencia de desarrolladores Build a finales de este mes, como informa una de las fuentes citadas por la publicación.
«Defensor de los viajes extremos. Amante del café. Experto en tocino total. Wannabe tv pionero».
También te puede interesar
-
Cómo el ultraciclista Kabir Rachure recorrió 900 km en bicicleta a través de Ladakh para establecer un récord
-
Google Meet obtiene una nueva función de IA generativa «Toma notas por mí»
-
Google implementa Gems e Imagen 3 en Gemini Advanced
-
Infinix Hot 50 5G con procesador MediaTek Dimensity y clasificación IP54 lanzado el 5 de septiembre: características esperadas
-
El Direct final de Nintendo para este verano estará compuesto por 40 minutos de juegos independientes y de partners para Switch