Software

Gemini começa a ganhar função que o permite 'enxergar' com a câmera do celular; entenda

Formalmente apresentado em março, o Project Astra permite transmitir imagens da câmera ou da tela para interagir com o Gemini em tempo real

em 24/03/2025, 09:00
Gemini começa a ganhar função que o permite 'enxergar' com a câmera do celular; entenda

Fonte: Amanz/Unsplash

(Fonte: Amanz/Unsplash)

O Google começou a ativar a ferramenta que permite ao Gemini “enxergar” o mundo por meio das câmeras do celular. Parte do pacote Project Astra, a função foi formalmente anunciada durante a MWC 2025 e teve lançamento confirmado ainda para março.

Os recursos complementam o Gemini Live, o chat de voz em tempo real do Gemini. Segundo um usuário que teve acesso à funcionalidade, a novidade pode ser ativada pelos botões “Share screen with Live” (“Compartilhe a tela com o Live”, em português) ou “Ask about screen” (“Pergunte sobre algo da tela”), exibidos como sugestões acima da caixa de texto.

Ao compartilhar a tela, todo o conteúdo do display é exibido para o modelo, sem a opção de selecionar apenas um aplicativo — ao menos, por enquanto.

No entanto, o mais impressionante é a função de câmera, também acessível pelo Gemini Live. Ao ativá-la, o dispositivo aciona a câmera e permite que a inteligência artificial “veja” o mundo real, sendo capaz de identificar elementos enquadrados e responder perguntas sobre eles.

O usuário pode optar por compartilhar imagens da câmera traseira ou alternar para a frontal, com a possibilidade de interromper a transmissão a qualquer momento.

Gemini já tem capacidades multimodais

Atualmente, o Gemini já pode ser usado para esclarecer dúvidas sobre imagens e documentos — incluindo prints de tela e fotos tiradas na hora. No entanto, o processo ocorre em múltiplas etapas, tornando consultas rápidas mais complicadas.

Com o Project Astra no Gemini Live, essa interação se torna muito mais ágil e intuitiva. Além de permitir consultas diretas, a conversa com o chatbot se torna mais natural e, no caso do uso da câmera, simula uma videochamada com uma pessoa real.

Como funcionam os “olhos” do Gemini Live?

Na demonstração compartilhada pelo Google, a ferramenta responde perguntas em voz com rapidez, interpretando o conteúdo transmitido e oferecendo respostas audíveis. O chatbot consegue até mesmo identificar elementos específicos, apontando a posição exata do objeto ao qual se refere.

Em janeiro, quando revelou os planos do Project Astra, o Google mencionou que os celulares Pixel e os Galaxy S25 seriam os primeiros a receber as novidades. No entanto, o recurso foi flagrado em um modelo da Xiaomi (não especificado).

A princípio, o processamento de dados visuais do Gemini ocorreria de forma remota, diretamente nos servidores do Google. Portanto, em teoria, não haveria motivo para restringir a função a apenas alguns dispositivos.

Funções do Project Astra serão pagas

Na apresentação de janeiro, o Google reforçou que as funções do Project Astra serão exclusivas para celulares Android de assinantes do Gemini Advanced, parte do plano Google One Plano IA Premium.

No momento da elaboração desta matéria, o Plano IA Premium custa R$ 96,99 por mês, com o primeiro mês gratuito.

Por enquanto, não há previsão para o lançamento geral dos novos recursos do Gemini Live. Aparentemente, a novidade está sendo distribuída gradativamente entre usuários pagantes.


Avatar do(a) autor(a): Igor Almenara Carneiro

Por Igor Almenara Carneiro

Especialista em Redator

Redator de tecnologia desde 2019, ex-Canaltech, atualmente TecMundo e um assíduo universitário do curso de Bacharel em Sistemas de Informação. Pai de pet, gamer e amante de músicas desconhecidas.


Veja também