Ferramenta gratuita de análise de imagens de IA do Google

O Google oferece uma ferramenta de classificação de imagens de IA que analisa imagens para classificar o conteúdo e atribuir rótulos a elas.

A ferramenta pretende ser uma demonstração do Google Vision, que pode dimensionar a classificação de imagens de forma automatizada, mas pode ser usada como uma ferramenta independente para ver como um algoritmo de detecção de imagens visualiza suas imagens e para que elas são relevantes.

Mesmo que você não use a API do Google Vision para dimensionar a detecção e classificação de imagens, a ferramenta fornece uma visão interessante do que os algoritmos relacionados a imagens do Google são capazes, o que torna interessante fazer upload de imagens para ver como o algoritmo Vision do Google as classifica .

Essa ferramenta demonstra os algoritmos de IA e aprendizado de máquina do Google para entender imagens.

Faz parte do pacote de APIs Cloud Vision do Google que oferece modelos de aprendizado de máquina de visão para aplicativos e sites.

A ferramenta Cloud Vision reflete o algoritmo do Google?

Este é apenas um modelo de aprendizado de máquina e não um algoritmo de classificação.

Portanto, não é realista usar essa ferramenta e esperar que ela reflita algo sobre o algoritmo de classificação de imagens do Google.

No entanto, é uma ótima ferramenta para entender como os algoritmos de IA e aprendizado de máquina do Google podem entender imagens e oferecerá uma visão educacional sobre o quão avançados são os algoritmos relacionados à visão de hoje.

As informações fornecidas por essa ferramenta podem ser usadas para entender como uma máquina pode entender do que se trata uma imagem e possivelmente fornecer uma ideia de quão precisamente essa imagem se encaixa no tópico geral de uma página da web.

Por que uma ferramenta de classificação de imagens é útil?

As imagens podem desempenhar um papel importante na visibilidade da pesquisa e na CTR das várias maneiras pelas quais o conteúdo da página da Web é exibido no Google.

Os potenciais visitantes do site que estão pesquisando um tópico usam imagens para navegar até o conteúdo certo.

Assim, o uso de imagens atraentes e relevantes para consultas de pesquisa pode, em determinados contextos, ser útil para comunicar rapidamente que uma página da Web é relevante para o que uma pessoa está pesquisando.

A ferramenta Google Vision fornece uma maneira de entender como um algoritmo pode visualizar e classificar uma imagem em termos do que está na imagem.

As diretrizes do Google para SEO de imagem recomendam:

“Fotos de alta qualidade atraem os usuários mais do que imagens borradas e pouco nítidas. Além disso, imagens nítidas são mais atraentes para os usuários na miniatura resultante e aumentam a probabilidade de obter tráfego dos usuários.”

Se a ferramenta Visão estiver com problemas para identificar do que se trata a imagem, isso pode ser um sinal de que potenciais visitantes do site também podem estar tendo os mesmos problemas e decidindo não visitar o site.

O que é a ferramenta de imagens do Google?

A ferramenta é uma forma de demonstração da API Cloud Vision do Google.

A API Cloud Vision é um serviço que permite que aplicativos e sites se conectem à ferramenta de aprendizado de máquina, fornecendo serviços de análise de imagens que podem ser dimensionados.

A própria ferramenta autônoma permite que você faça upload de uma imagem e informa como o algoritmo de aprendizado de máquina do Google a interpreta.

A página do Google Cloud Vision descreve como o serviço pode ser usado assim:

“O Cloud Vision permite que os desenvolvedores integrem facilmente recursos de detecção de visão em aplicativos, incluindo rotulagem de imagens, detecção de rostos e pontos de referência, reconhecimento óptico de caracteres (OCR) e marcação de conteúdo explícito”.

Estas são cinco maneiras pelas quais as ferramentas de análise de imagens do Google classificam as imagens enviadas:

  1. Rostos.
  2. Objetos.
  3. Rótulos.
  4. Propriedades.
  5. Pesquisa segura.

Rostos

A guia “rostos” fornece uma análise da emoção expressa pela imagem.

A precisão deste resultado é bastante precisa.

A imagem abaixo é uma pessoa descrita como confusa, mas isso não é realmente uma emoção.

A IA descreve a emoção expressa no rosto como surpresa, com uma pontuação de confiança de 96%.

IA de imagens do GoogleImagem composta criada pelo autor, julho de 2022; imagens provenientes da API Google Cloud Vision e Shutterstock/Cast Of Thousands

Objetos

A guia “objetos” mostra quais objetos estão na imagem, como óculos, pessoa, etc.

A ferramenta identifica com precisão cavalos e pessoas.

Captura de tela da ferramenta Google VisionImagem composta criada pelo autor, julho de 2022; imagens provenientes da API Google Cloud Vision e Shutterstock/Lukas Gojda

Rótulos

A guia “rótulos” mostra detalhes sobre a imagem que o Google reconhece, como orelhas e boca, mas também aspectos conceituais como retrato e fotografia.

Isso é particularmente interessante porque mostra o quão profundamente a IA de imagem do Google pode entender o que está em uma imagem.

Captura de tela do Google Vision AI identificando objetos em uma foto enviadaImagem composta criada pelo autor, julho de 2022; imagens provenientes da API Google Cloud Vision e Shutterstock/Lukas Gojda

O Google usa isso como parte do algoritmo de classificação? Isso é algo que não se sabe.

Propriedades

Propriedades são as cores usadas na imagem.

Captura de tela da ferramenta Google Vision identificando as cores dominantes em uma imagemCaptura de tela da API Google Cloud Vision, julho de 2022

Na superfície, o objetivo desta ferramenta não é óbvio e pode parecer um pouco sem utilidade.

Mas, na realidade, as cores de uma imagem podem ser muito importantes, principalmente para uma imagem em destaque.

Imagens que contêm uma gama muito ampla de cores podem ser uma indicação de uma imagem mal escolhida com um tamanho inchado, o que é algo a ser observado.

Outro insight útil sobre imagens e cores é que imagens com uma faixa de cores mais escura tendem a resultar em arquivos de imagem maiores.

Em termos de SEO, a seção Propriedade pode ser útil para identificar imagens em um site inteiro que podem ser trocadas por outras menos inchadas.

Além disso, os intervalos de cores para imagens em destaque que são suaves ou mesmo em tons de cinza podem ser algo a ser observado, porque as imagens em destaque que não possuem cores vivas tendem a não aparecer nas mídias sociais, Google Discover e Google Notícias.

Por exemplo, imagens em destaque que são vívidas podem ser facilmente digitalizadas e possivelmente receber uma taxa de cliques (CTR) mais alta quando exibidas nos resultados da pesquisa ou no Google Discover, pois elas chamam a atenção melhor do que as imagens silenciadas e desbotadas em segundo plano.

Existem muitas variáveis ​​que podem afetar o desempenho da CTR das imagens, mas isso fornece uma maneira de ampliar o processo de auditoria das imagens de um site inteiro.

O eBay realizou um estudo de imagens de produtos e CTR e descobriu que imagens com cores de fundo mais claras tendiam a ter uma CTR mais alta.

Os pesquisadores do eBay observaram:

“Neste artigo, descobrimos que os recursos da imagem do produto podem ter um impacto no comportamento de pesquisa do usuário.

Descobrimos que alguns recursos de imagem têm correlação com a CTR em um mecanismo de pesquisa de produtos e que esses recursos podem ajudar na modelagem da taxa de cliques para aplicativos de pesquisa de compras.

Este estudo pode fornecer aos vendedores um incentivo para enviar imagens melhores para os produtos que eles vendem.”

Curiosamente, o uso de cores vivas para imagens em destaque pode ser útil para aumentar a CTR de sites que dependem do tráfego do Google Discover e do Google Notícias.

Obviamente, existem muitos fatores que afetam a CTR do Google Discover e do Google News. Mas uma imagem que se destaque das outras pode ser útil.

Por esse motivo, usar a ferramenta Vision para entender as cores usadas pode ser útil para uma auditoria em escala de imagens.

Pesquisa segura

A Pesquisa segura mostra como a imagem é classificada para conteúdo não seguro. As descrições de imagens potencialmente inseguras são as seguintes:

  • Adulto.
  • Paródia.
  • Médico.
  • Violência.
  • Atrevido.

A pesquisa do Google tem filtros que avaliam uma página da Web quanto a conteúdo inseguro ou impróprio.

Por esse motivo, a seção Safe Search da ferramenta é muito importante porque, se uma imagem acionar involuntariamente um filtro de pesquisa segura, a página da web pode não ser classificada para potenciais visitantes do site que estão procurando o conteúdo na página da web.

Análise de pesquisa segura do Google VisionCaptura de tela da API Google Cloud Vision, julho de 2022

A captura de tela acima mostra a avaliação de uma foto de cavalos de corrida em uma pista de corrida. A ferramenta identifica com precisão que não há conteúdo médico ou adulto na imagem.

Texto: Reconhecimento óptico de caracteres (OCR)

O Google Vision tem uma capacidade notável de ler o texto que está em uma fotografia.

A ferramenta Visão é capaz de ler com precisão o texto da imagem abaixo:

Captura de tela da ferramenta Vision lendo com precisão o texto em uma imagemImagem composta criada pelo autor, julho de 2022; imagens provenientes da API Google Cloud Vision e Shutterstock/Melissa King

Como pode ser visto acima, o Google tem a capacidade (através de Reconhecimento óptico de caracteres, também conhecido como OCR), para ler palavras em imagens.

No entanto, isso não é uma indicação de que o Google usa OCR para fins de classificação de pesquisa.

O fato é que o Google recomenda o uso de palavras ao redor das imagens para ajudá-lo a entender do que se trata uma imagem e pode ser que mesmo para imagens com texto dentro delas, o Google ainda dependa das palavras ao redor da imagem para entender do que se trata a imagem. é sobre e relevante para.

As diretrizes do Google sobre SEO de imagens enfatizam repetidamente o uso de palavras para fornecer contexto às imagens.

“Ao adicionar mais contexto em torno das imagens, os resultados podem se tornar muito mais úteis, o que pode levar a um tráfego de maior qualidade para seu site.

…Sempre que possível, coloque as imagens perto do texto relevante.

…O Google extrai informações sobre o assunto da imagem do conteúdo da página…

…O Google usa texto alternativo junto com algoritmos de visão computacional e o conteúdo da página para entender o assunto da imagem.”

Está muito claro na documentação do Google que o Google depende do contexto do texto em torno das imagens para entender do que se trata a imagem.

Leve embora

A ferramenta Vision AI do Google oferece uma maneira de testar a Vision AI do Google para que um editor possa se conectar a ela por meio de uma API e usá-la para dimensionar a classificação de imagens e extrair dados para uso no site.

Mas também fornece uma visão de até que ponto os algoritmos para rotulagem de imagens, anotação e reconhecimento óptico de caracteres surgiram.

Carregue uma imagem aqui para ver como ela é classificada e se uma máquina a vê da mesma maneira que você.

Mais recursos:


Imagem em destaque por Maksim Shmeljov/Shutterstock

Leave a Reply

Your email address will not be published.