O novo modelo de IA da Microsoft pode desafiar o GPT-4 e o Google Gemini

Mais Zoom / Mustafa Suleiman, cofundador e CEO da Inflection AI UK Ltd., durante uma reunião no segundo dia do Fórum Econômico Mundial (WEF) em Davos, Suíça, na quarta-feira, 17 de janeiro de 2024. Suleiman juntou-se à Microsoft na caminhada.

A Microsoft está trabalhando em um novo modelo de linguagem de IA em grande escala chamado MAI-1, que poderia competir com os modelos mais recentes do Google, Anthropic e OpenAI, de acordo com um relatório da Microsoft. a informação. Esta é a primeira vez que a Microsoft desenvolve um modelo interno de IA deste tamanho desde que investiu mais de US$ 10 bilhões na OpenAI pelos direitos de reutilização dos modelos de IA da startup. O GPT-4 da OpenAI não apenas alimenta o ChatGPT, mas também o Microsoft Copilot.

O desenvolvimento do MAI-1 está sendo liderado por Mustafa Soliman, o ex-líder de IA do Google que mais recentemente atuou como CEO da startup de IA Inflection antes de a Microsoft adquirir a maioria dos funcionários e propriedade intelectual da startup por US$ 650 milhões em março. Embora o MAI-1 possa ser baseado em tecnologias trazidas por ex-funcionários do Inflection, diz-se que é um modelo de linguagem grande (LLM) inteiramente novo, conforme confirmado por dois funcionários da Microsoft familiarizados com o projeto.

Com quase 500 bilhões de parâmetros, o MAI-1 será muito maior do que os modelos de código aberto anteriores da Microsoft (como o Phi-3, que abordamos no mês passado), exigindo mais poder de computação e dados de treinamento. Diz-se que isso coloca o MAI-1 em uma liga semelhante ao GPT-4 da OpenAI, que é… Boato Para mais de um trilhão de parâmetros (em uma combinação de especialistas) e muito mais do que modelos menores como os modelos Meta e Mistral com 70 bilhões de parâmetros.

READ Discord termina negociações com a Microsoft

O desenvolvimento do MAI-1 sinaliza uma abordagem dupla à IA dentro da Microsoft, concentrando-se em modelos de linguagem pequena que são executados localmente para dispositivos móveis e em modelos maiores e mais novos que são executados na nuvem. Diz-se que a Apple está explorando uma abordagem semelhante. Também destaca o desejo da empresa de explorar o desenvolvimento de IA independentemente do OpenAI, cuja tecnologia atualmente alimenta os recursos de IA mais ambiciosos da Microsoft, incluindo um chatbot integrado ao Windows.

A finalidade exata do MAI-1 ainda não foi determinada (mesmo dentro da Microsoft), e seu uso ideal dependerá de seu desempenho, de acordo com uma fonte de informação. Para treinar o modelo, a Microsoft dedicou um grande cluster de servidores com GPUs Nvidia e coletou dados de treinamento de diversas fontes, incluindo texto gerado pelo GPT-4 da OpenAI e dados públicos da Internet.

Dependendo do progresso nas próximas semanas, as informações sugerem que a Microsoft poderá visualizar o MAI-1 já em sua conferência Build Developer, no final deste mês, conforme relatado por uma das fontes citadas pelo post.

Eugênio Moniz

“Introvert. Communicator. TV fanatic. Typical coffee advocate. Proud music expert. Annoyingly humble student.”

O novo modelo de IA da Microsoft pode desafiar o GPT-4 e o Google Gemini

Deixe um comentário Cancelar resposta

Você deve evitar ir ao hospital em julho?

Nigéria perde por 0 a 1 para o Brasil – Esportes – The Guardian Nigeria News – Nigéria e Notícias do Mundo

Após análise, o requisito de conta Epic no Bombing EDF6 será removido

Atualizações ao vivo: A cerimônia de abertura das Olimpíadas de Paris continua apesar dos ataques às ferrovias francesas