O novo modelo de IA da Microsoft pode desafiar o GPT-4 e o Google Gemini

Mais Zoom / Mustafa Suleiman, cofundador e CEO da Inflection AI UK Ltd., durante uma reunião no segundo dia do Fórum Econômico Mundial (WEF) em Davos, Suíça, na quarta-feira, 17 de janeiro de 2024. Suleiman juntou-se à Microsoft na caminhada.

A Microsoft está trabalhando em um novo modelo de linguagem de IA em grande escala chamado MAI-1, que poderia competir com os modelos mais recentes do Google, Anthropic e OpenAI, de acordo com um relatório da Microsoft. a informação. Esta é a primeira vez que a Microsoft desenvolve um modelo interno de IA deste tamanho desde que investiu mais de US$ 10 bilhões na OpenAI pelos direitos de reutilização dos modelos de IA da startup. O GPT-4 da OpenAI não apenas alimenta o ChatGPT, mas também o Microsoft Copilot.

O desenvolvimento do MAI-1 está sendo liderado por Mustafa Soliman, o ex-líder de IA do Google que mais recentemente atuou como CEO da startup de IA Inflection antes de a Microsoft adquirir a maioria dos funcionários e propriedade intelectual da startup por US$ 650 milhões em março. Embora o MAI-1 possa ser baseado em tecnologias trazidas por ex-funcionários do Inflection, diz-se que é um modelo de linguagem grande (LLM) inteiramente novo, conforme confirmado por dois funcionários da Microsoft familiarizados com o projeto.

Com quase 500 bilhões de parâmetros, o MAI-1 será muito maior do que os modelos de código aberto anteriores da Microsoft (como o Phi-3, que abordamos no mês passado), exigindo mais poder de computação e dados de treinamento. Diz-se que isso coloca o MAI-1 em uma liga semelhante ao GPT-4 da OpenAI, que é… Boato Para mais de um trilhão de parâmetros (em uma combinação de especialistas) e muito mais do que modelos menores como os modelos Meta e Mistral com 70 bilhões de parâmetros.

READ  O IPhone 13 parece mais decepcionante com o redesenho do Pixel 6

O desenvolvimento do MAI-1 sinaliza uma abordagem dupla à IA dentro da Microsoft, concentrando-se em modelos de linguagem pequena que são executados localmente para dispositivos móveis e em modelos maiores e mais novos que são executados na nuvem. Diz-se que a Apple está explorando uma abordagem semelhante. Também destaca o desejo da empresa de explorar o desenvolvimento de IA independentemente do OpenAI, cuja tecnologia atualmente alimenta os recursos de IA mais ambiciosos da Microsoft, incluindo um chatbot integrado ao Windows.

A finalidade exata do MAI-1 ainda não foi determinada (mesmo dentro da Microsoft), e seu uso ideal dependerá de seu desempenho, de acordo com uma fonte de informação. Para treinar o modelo, a Microsoft dedicou um grande cluster de servidores com GPUs Nvidia e coletou dados de treinamento de diversas fontes, incluindo texto gerado pelo GPT-4 da OpenAI e dados públicos da Internet.

Dependendo do progresso nas próximas semanas, as informações sugerem que a Microsoft poderá visualizar o MAI-1 já em sua conferência Build Developer, no final deste mês, conforme relatado por uma das fontes citadas pelo post.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *