inteligência artificial

Criando APIs de Detecção de Objetos em Imagens com BuildShip e Google Vision: Um Guia Prático

Xavier

28 Mai 2025 • 5 min read

Introdução à Detecção de Objetos e o Papel do BuildShip

A detecção de objetos em imagens é uma capacidade cada vez mais crucial na tecnologia moderna, impulsionando desde aplicações de segurança até experiências de usuário enriquecidas. Tradicionalmente, o desenvolvimento de tais funcionalidades exigiria um conhecimento profundo em programação e aprendizado de máquina. No entanto, plataformas como o BuildShip estão democratizando o acesso a essas tecnologias, permitindo a criação de soluções de backend complexas com uma abordagem visual e simplificada. Este artigo explora como construir um endpoint de API que, ao receber uma imagem, utiliza o Google Vision API para identificar objetos e, em seguida, retorna tanto os dados dos objetos detectados quanto uma nova imagem com esses objetos destacados.

O que é o BuildShip?

O BuildShip é uma plataforma inovadora que combina o melhor dos mundos low-code e no-code para o desenvolvimento de backends. Ele permite que desenvolvedores e criadores construam APIs, tarefas agendadas e webhooks de forma visual, conectando nós pré-construídos ou gerando novos nós com o auxílio de inteligência artificial. Isso acelera significativamente o ciclo de desenvolvimento, tornando a criação de soluções robustas e escaláveis mais acessível, independentemente da complexidade.

Visão Geral do Projeto: Detecção de Objetos com Google Vision API

O objetivo deste projeto, demonstrado no vídeo, é criar um endpoint de API que realize as seguintes tarefas:

Receber a URL de uma imagem como entrada.
Utilizar o Google Vision API para detectar objetos presentes nessa imagem.
Gerar uma nova imagem com caixas delimitadoras e rótulos sobre os objetos detectados.
Retornar um JSON contendo a URL da nova imagem e a lista dos objetos identificados com suas respectivas coordenadas.

Essa funcionalidade será implementada inteiramente dentro do ambiente BuildShip, aproveitando seus nós e a capacidade de integração com serviços externos.

Passo a Passo da Implementação no BuildShip

A construção do fluxo de trabalho no BuildShip é intuitiva. O processo inicia-se com a seleção de um template pré-configurado para a detecção de objetos com o Google Vision API, o que já adianta boa parte da configuração.

H3: Configurando o Endpoint da API no BuildShip

O primeiro passo é definir o gatilho (trigger) do nosso fluxo. No BuildShip, isso é feito através do nó 'Rest API Call'.

Path (Caminho): Define-se um caminho para o endpoint, como por exemplo, /detect_objects. Este será o endereço que os clientes usarão para acessar a API.
Method (Método): O método HTTP escolhido é o GET, adequado para requisitar dados.
Get Query Param (Obter Parâmetro de Consulta): Este nó é utilizado para extrair parâmetros da URL da requisição. Configura-se para buscar o parâmetro image_url, que conterá o link da imagem a ser processada. Marca-se este parâmetro como obrigatório.

H3: Integrando o Google Vision API para Detecção de Objetos

Com a URL da imagem em mãos, o próximo nó crucial é o 'Detect Objects in Image'. Este nó é uma abstração poderosa que encapsula a lógica de comunicação com o Google Vision API.

Image URL (URL da Imagem): O valor obtido do nó 'Get Query Param' é passado como entrada para este nó.
Funcionamento Interno: Embora o BuildShip simplifique a interface, por baixo dos panos, este nó executa código (provavelmente JavaScript, como visualizado brevemente no vídeo) que utiliza o SDK do Google Cloud Vision para enviar a imagem e receber os resultados da detecção.
Output (Saída): O nó retorna uma lista de objetos detectados, cada um contendo informações como nome, confiança da detecção e coordenadas da caixa delimitadora (bounding box).

H3: Desenhando Contornos nos Objetos Detectados com Browserless no BuildShip

Após a detecção, o desafio é visualizar esses resultados. O nó 'Draw Multiple Object Bounds' entra em ação para criar uma nova imagem com os objetos destacados.

Image (Imagem): Recebe a URL da imagem original.
Objects (Objetos): Recebe a lista de objetos detectados pelo nó anterior.
Browserless Token: Este nó utiliza o serviço Browserless para renderizar a imagem com as anotações. Browserless é uma plataforma que oferece instâncias de navegador headless (sem interface gráfica) como um serviço, permitindo automação e manipulação de páginas web e, neste caso, imagens. É necessário adicionar um 'secret' (token de API do Browserless) nas configurações do projeto BuildShip para que o nó funcione.
Lógica de Desenho: O nó processa a imagem original e, para cada objeto detectado, desenha uma caixa delimitadora ao redor dele e adiciona um rótulo com o nome do objeto.
Output (Saída): O resultado é uma nova URL, apontando para a imagem processada e armazenada (possivelmente no Google Cloud Storage, integrado ao BuildShip).

H3: Formatando e Retornando a Resposta da API construída no BuildShip

Para finalizar o fluxo, é preciso preparar e enviar a resposta ao cliente.

Image Object Detection (Nó de Formatação): Este nó é utilizado para agrupar as informações relevantes: a URL da nova imagem gerada (com os objetos destacados) e a lista dos objetos detectados (com seus nomes, coordenadas, etc.).
Return Node (Nó de Retorno): Este é o último nó do fluxo. Ele envia a resposta HTTP de volta para quem chamou a API. Configura-se para retornar um status code 200 (OK), indicando sucesso, e o valor processado pelo nó 'Image Object Detection' como corpo da resposta JSON.

Testando a API com Postman

Após configurar e 'shipar' (publicar) o workflow no BuildShip, uma URL de endpoint é gerada. Para testar, utiliza-se uma ferramenta como o Postman.

Cria-se uma nova requisição GET no Postman.
Cola-se a URL do endpoint fornecida pelo BuildShip.
Adiciona-se o parâmetro de consulta image_url com o link de uma imagem de teste (por exemplo, uma foto de paisagem com balões e pessoas, como a usada no vídeo, obtida do Pexels).
Envia-se a requisição.

A resposta esperada é um JSON contendo imageUrl (o link para a imagem com os objetos destacados) e um array objects detalhando cada objeto detectado (nome, confiança, coordenadas). Abrindo a imageUrl em um navegador, visualiza-se a imagem com as anotações feitas pelo Browserless.

Análise e Vantagens da Abordagem com BuildShip

A principal vantagem demonstrada é a velocidade e simplicidade com que uma API relativamente complexa pode ser construída. O BuildShip abstrai grande parte da codificação manual, permitindo focar na lógica do fluxo de trabalho.

Desenvolvimento Rápido: A utilização de templates e nós pré-construídos reduz drasticamente o tempo de desenvolvimento.
Baixa Curva de Aprendizagem: A interface visual torna o processo acessível mesmo para quem não possui vasta experiência em backend.
Integração Facilitada: Conectar serviços como Google Vision API e Browserless torna-se uma tarefa de configuração de nós, em vez de escrita de código de integração complexo.
Flexibilidade: A possibilidade de inspecionar e até modificar o código dos nós (como visto no vídeo) oferece um grau de personalização que vai além das plataformas puramente no-code.

Expandindo as Possibilidades com BuildShip e Google Vision API

A solução apresentada é um excelente ponto de partida. Com o BuildShip, é possível expandir essa funcionalidade de diversas maneiras:

Armazenar os resultados da detecção em um banco de dados.
Enviar notificações (e-mail, Slack) quando determinados objetos forem detectados.
Integrar com outros serviços de IA para análise de sentimento em texto extraído de imagens (OCR).
Criar dashboards para visualizar estatísticas de objetos detectados ao longo do tempo.

Conclusão

Plataformas como o BuildShip estão redefinindo a maneira como backends e APIs são desenvolvidos. Ao combinar uma interface visual intuitiva com o poder de integrações robustas e a flexibilidade do low-code, torna-se viável criar soluções sofisticadas, como a detecção e anotação de objetos em imagens, em questão de minutos. Este exemplo prático com o Google Vision API e Browserless demonstra o potencial imenso para inovação rápida e eficiente no desenvolvimento de software.