Google Gemini 1.5 Pro agora pode ouvir

A atualização do Google para Gemini 1.5 Pro dá ouvidos ao modelo. O modelo agora pode ouvir arquivos de áudio carregados e produzir informações de coisas como chamadas sobre lucros ou áudio de vídeos sem precisar consultar um texto escrito.

Durante o evento Google Next, o Google também anunciou que disponibilizará ao público pela primeira vez o Gemini 1.5 Pro por meio de sua plataforma de construção de aplicações de inteligência artificial, a Vertex AI. O Gemini 1.5 Pro foi anunciado pela primeira vez em fevereiro.

Esta nova versão do Gemini Pro, que deveria ser o modelo de peso médio da família Gemini, na verdade supera o modelo maior e mais poderoso, o Gemini Ultra, em desempenho. O Google afirma que o Gemini 1.5 Pro pode compreender instruções complexas e elimina a necessidade de ajustar formulários.

O Gemini 1.5 Pro não está disponível para pessoas que não têm acesso ao Vertex AI. No momento, a maioria das pessoas encontra modelos de linguagem Gemini por meio do chatbot Gemini. O Gemini Ultra executa o software de bate-papo Gemini Advanced e, embora seja poderoso e capaz de entender comandos longos, não é tão rápido quanto o Gemini 1.5 Pro.

O Gemini 1.5 Pro não é o único grande modelo de IA do Google a receber uma atualização. Imagen 2, o módulo de texto para imagem que ajuda a aprimorar os recursos de geração de imagens do Gemini, também adicionará in-draw e out-draw, permitindo aos usuários adicionar ou remover elementos das imagens. O Google também disponibilizou o recurso de marca d'água digital SynthID em todas as imagens criadas por meio do Imagen Forms. SynthID adiciona uma marca d’água invisível ao visualizador nas imagens que identifica sua origem quando visualizada através do detector.

O Google diz que também está apresentando publicamente uma maneira de basear suas respostas de IA usando a Pesquisa Google para que possam responder com informações atualizadas. Isto nem sempre é um dado adquirido com respostas produzidas por grandes modelos de linguagem, às vezes até intencionalmente; O Google bloqueou intencionalmente a Gemini de responder a perguntas relacionadas às eleições de 2024 nos EUA.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *