El nuevo modelo de IA de Microsoft podría desafiar a GPT-4 y Google Gemini

El nuevo modelo de IA de Microsoft podría desafiar a GPT-4 y Google Gemini

Mustafa Suleyman, cofundador y director ejecutivo de Inflection AI UK Ltd., durante un ayuntamiento el segundo día del Foro Económico Mundial (FEM) en Davos, Suiza, el miércoles 17 de enero de 2024.
Agrandar / Mustafa Suleyman, cofundador y director ejecutivo de Inflection AI UK Ltd., durante un ayuntamiento el segundo día del Foro Económico Mundial (FEM) en Davos, Suiza, el miércoles 17 de enero de 2024. Suleyman se unió a Microsoft en marzo.

Microsoft está trabajando en un nuevo modelo de lenguaje de IA a gran escala llamado MAI-1, que potencialmente podría rivalizar con los modelos de última generación de Google, Anthropic y OpenAI, según un informe de Información. Esta es la primera vez que Microsoft desarrolla un modelo interno de IA de esta escala desde que invirtió más de 10 mil millones de dólares en OpenAI para asegurarse el derecho a reutilizar los modelos de IA de la startup. GPT-4 de OpenAI impulsa no solo ChatGPT sino también Microsoft Copilot.

El desarrollo de MAI-1 está dirigido por Mustafa Suleyman, el exlíder de IA de Google que recientemente se desempeñó como director ejecutivo de la startup de IA Inflection antes de que Microsoft adquiriera la mayor parte del personal y la propiedad intelectual de la startup por 650 millones de dólares en marzo. Bien que MAI-1 puisse s'appuyer sur des techniques apportées par l'ancien personnel d'Inflection, il s'agirait d'un tout nouveau modèle de langage étendu (LLM), comme l'ont confirmé deux employés de Microsoft familiers avec el proyecto.

Con alrededor de 500 mil millones de parámetros, MAI-1 será significativamente más grande que los modelos anteriores de código abierto de Microsoft (como Phi-3, sobre el cual informamos el mes pasado), lo que requerirá más potencia informática y datos de entrenamiento. Esto colocaría a MAI-1 en una liga similar al GPT-4 de OpenAI, que es rumor con más de 1 billón de parámetros (en una configuración experta mixta) y muy por encima de modelos más pequeños como los modelos de 70 mil millones de parámetros de Meta y Mistral.

El desarrollo de MAI-1 sugiere un enfoque dual hacia la IA dentro de Microsoft, centrándose tanto en modelos de lenguaje pequeño ejecutados localmente para dispositivos móviles como en modelos de vanguardia más grandes impulsados ​​por la nube. Según se informa, Apple está explorando un enfoque similar. También subraya el deseo de la compañía de explorar el desarrollo de la IA independientemente de OpenAI, cuya tecnología actualmente impulsa las funciones de IA generativa más ambiciosas de Microsoft, incluido un chatbot integrado en Windows.

Al parecer, el propósito exacto de MAI-1 no ha sido determinado (ni siquiera dentro de Microsoft), y su uso más ideal dependerá de su rendimiento, según una de las fuentes de The Information. Para entrenar el modelo, Microsoft asignó un gran grupo de servidores con GPU Nvidia y recopiló datos de entrenamiento de varias fuentes, incluido texto generado por GPT-4 de OpenAI y datos públicos de Internet.

Dependiendo del progreso en las próximas semanas, The Information informa que Microsoft podría obtener una vista previa de MAI-1 ya en su conferencia de desarrolladores Build a finales de este mes, como informa una de las fuentes citadas por la publicación.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *