Google anuncia gemini 1. 5 com desempenho 87% superior. Atualização do modelo de linguagem será testada por desenvolvedores antes de chegar aos serviços e aplicativos do google

Google anuncia Gemini 1.5 com desempenho 87% superior 2s5614

Avatar de victor pacheco
Atualização do modelo de linguagem será testada por desenvolvedores antes de chegar aos serviços e aplicativos do Google

Cerca de um mês e meio após o lançamento de seu modelo de linguagem para o público geral, o Google anunciou hoje a atualização para o Gemini 1.5. Entre as novidade, ele está mais rápido e tem capacidade para ler conteúdos mais longos. O Gemini 1.5 estará disponível para desenvolvedores com até um milhão de tokens. Confira o que foi anunciado. 60b4u

O que chega com a atualização e7320

Novidade foi anunciada hoje (15) (Foto: Divulgação/Google)

O anúncio do Google para seu modelo de linguagem é mais uma mudança incremental que um novo lançamento. Em comparação com o modelo anterior, o Gemini 1.5 chega à internet com nova arquitetura que leva o nome de Mixture-of-Experts (MoE). Na prática, os modelos de linguagem serão divididos em pequenas redes neurais para melhor processamento e por meio de redes “especializadas”, em vez de serem lidas por gigantes parâmetros.

Tal novidade impacta diretamente no processamento de tarefas, que agora está mais rápido e pronto para realizar tarefas mais complexas. O Google também ressalta que o treinamento do Gemini está mais rápido. É importante lembrar que essa IA tem três variantes: Nano (nos smartphones Pixel),  Pro (disponível no chatbot Gemini) e Ultra (disponível no Gemini Advanced para desenvolvedores).

O Google afirma que o Gemini 1.5 Pro tem poder de desempenho que se assemelha ao Ultra 1.0, e que ele está 87% mais rápido do que o foi apresentado no final do ano ado. A empresa afirma que, segundo os testes feitos internamente, ele está mais rápido e pode processar mais informações que a geração anterior.

Quando testado em um abrangente de avaliações de texto, código, imagem, áudio e vídeo, o 1.5 Pro supera o 1.0 Pro em 87% dos benchmarks usados para desenvolver nossos LLMs.

Google sobre novo lançamento do Gemini 1.5.

Maior capacidade de processamento 1p665u

Modelo de linguagem pode ler documentos com até 700 páginas (Foto: Divulgação/Google)

A janela de contexto é basicamente o local em que as informações são processadas em tokens. É importante lembrar que um token não é exatamente um parâmetro, mas sim blocos de dados utilizados para processar informações. A versão de dezembro de 2023 tinha e para até 32 mil tokens, o que já era muita coisa.

Porém, o Gemini 1.5 ou a ter uma janela de contexto de até 1 milhão de tokens. O poder de processamento é tão grande que, em testes divulgados pela empresa, a inteligência artificial conseguiu ler todo um arquivo PDF de 402 páginas sobre a missão Apolo 11, que levou o homem à Lua, e trazer três momentos cômicos, em apenas alguns segundos. Assista ao vídeo abaixo:

Outro exemplo mostrado foi a revisão de um filme mudo de 44 minutos de Buster Keaton. Ao receber o arquivo, a inteligência artificial do Google conseguiu identificar uma cena específica e dar mais informações sobre o momento do filme. Confira:

Com essa quantidade máxima de 1 milhão de tokens, a atualização do Gemini permitirá que a inteligência artificial analise até 1h de vídeo, 11h de áudio, 30 mil linhas de código ou mais de 700 mil palavras. E, como você percebeu nos exemplos, isso será feito em apenas alguns segundos.

Disponibilidade para público geral 39254x

Por agora, novidade será testada por desenvolvedores (Foto: Divulgação/Google)

Para este primeiro momento, apenas desenvolvedores devem aproveitar a atualização do Gemini, haja vista que ela estará disponível apenas pelo AI Studio ou Vertex AI em um contexto limitado.

Também é importante lembrar que a atualização do modelo de linguagem do Google ainda está em desenvolvimento e a empresa garante aos desenvolvedores com o antecipado 128 mil tokens para testes — os lotes de 1 milhão de tokens terão o e serão liberados gradativamente.

Os primeiros testadores podem experimentar a janela de contexto de 1 milhão de tokens sem nenhum custo durante o período de teste, embora devam esperar tempos de latência mais longos com esse recurso experimental.

Google sobre novo lançamento do Gemini 1.5.

Em um futuro não tão distante, o modelo de linguagem será implementado aos serviços do Google, incluindo o assistente pessoal e o chatbot , que deixou de se chamar Bard e agora leva o nome de Gemini. Em quanto tempo você acredita que iremos usar a nova atualização do Gemini? Diga pra gente nos comentários!

Veja também

Como criar imagens no Bard, a IA do Google

Com informações: Google Blog l Google Brasil l The Verge

Revisado por Glauco Vital em 15/2/24.

Deixe um comentário Cancelar resposta 4d2j
Posts Relacionados 6w2v3

Hisense mostra produtos que vão chegar ao Brasil em 2025 5s6q3v

Além de uma nova linha de geladeiras conectadas, empresa mostrou projetor C2 Ultra, que exibe tela de até 300 polegadas com resolução 4K. Veja tudo o que foi anunciado
Avatar de victor pacheco
Leia Mais

Bespoke AI: Samsung mostra produtos de casa conectada no México 6y6k5b

Casa inteligente da Samsung na Cidade do México mostra como a vida pode ser mais prática com Inteligência Artificial e o ecossistema SmartThings. Veja todos os produtos
Avatar de bruno martinez
Leia Mais

Veja o que esperar do Galaxy Z Fold7 e Z Flip7 2y4056

Novos dobráveis da Samsung chegarão em breve e devem ser mais leves, ter processador do ano e câmeras melhores, com até mesmo uma versão de baixo custo do Z Flip. Veja tudo o que sabemos.
Avatar de victor pacheco
Leia Mais