Um humano digital pode ser sua próxima celebridade favorita – ou consultor financeiro
Humano digital criado pela Baidu AI Cloud e modelado após a celebridade chinesa Simon Gong.

“O aumento da demanda está impulsionando o boom dos humanos digitais”, diz Shiyan Li, chefe do negócio de humanos digitais e robótica da Baidu, que criou o ator-modelo digital, Gong. “Somente na China, existem mais de 400 milhões de fãs de ACGN (animação, quadrinhos, jogos e romance) e um mercado corporativo no valor de centenas de bilhões de dólares centrado em humanos digitais”. E de acordo com uma empresa que rastreia registros de empresas, Qichacha, a China agora tem mais de 280.000 empresas que se envolvem em atividades digitais relacionadas a humanos.

Um tipo diferente de digital

A estreia da celebridade digital do Baidu pode não parecer muito à primeira vista, já que o conceito de “ídolos virtuais” existe há anos. Por exemplo, a influenciadora virtual norte-americana Lil Miquela aparece ao lado de celebridades humanas reais em anúncios online e comerciais de TV desde 2016, conquistando mais de três milhões de seguidores no Instagram. No entanto, há algo diferente na estrela chinesa virtual: um humano digital com a capacidade de ouvir, falar e interagir com humanos reais em um nível nunca visto antes. E os deveres digitais de Gong não se limitam a cantar. Na última atualização do Baidu App, o principal aplicativo de busca e feed da China, Gong aparece nos telefones dos usuários, ajudando nas pesquisas e consultas usando a voz real do ator-modelo. Desde que essa experiência de pesquisa interativa foi lançada em 2021, aumentou o número de consultas de pesquisa por voz no Baidu App em 18,2%.

O Baidu AI Cloud começou a desenvolver um funcionário digital em 2019 em colaboração com o Shanghai Pudong Development (SPD) Bank. Posteriormente, eles concentraram seus esforços na construção de um consultor financeiro digital para fornecer um serviço equivalente ao de um representante de banco humano quando os funcionários da vida real não estavam disponíveis. Hoje, o SPD Bank diz que mais de 460.000 clientes confiam em humanos digitais para serviços bancários e gerenciamento de portfólio a cada mês. “O acesso a humanos digitais fora do horário comercial permite que o SPD Bank ofereça atendimento ao cliente 24 horas por dia, 7 dias por semana, com baixo custo e alta eficiência”, diz um representante do banco.

Mais recentemente, um âncora virtual criado pelo Baidu forneceu comentários ao vivo em linguagem de sinais nos Jogos de Inverno de Pequim 2022 para espectadores com deficiência auditiva. Além de parecer uma pessoa real, o avatar foi capacitado com reconhecimento de fala e habilidades de interpretação de linguagem de sinais para garantir entrada e saída rápidas e altamente precisas. Com aproximadamente 430 milhões de pessoas em todo o mundo experimentando perda auditiva “incapacitante”, de acordo com a Organização Mundial da Saúde, há um forte potencial para que essa tecnologia seja usada para aumentar sua capacidade de acessar uma ampla variedade de conteúdo.

Um intérprete de linguagem de sinais criado pelo XiLing da Baidu AI Cloud.

XiLing: Uma nova geração em uma plataforma de IA

Do entretenimento aos serviços públicos, os humanos digitais devem desempenhar um papel maior em nossas vidas diárias. Mas por trás de sua aparência natural e sem esforço há uma complexa teia de tecnologias novas e emergentes que ultrapassam os limites da inovação em IA.

A celebridade digital do Baidu AI Cloud e as âncoras virtuais de linguagem de sinais foram criadas por meio do XiLing, uma nova plataforma digital lançada em 2021. humanos que podem ser anfitriões de transmissão ao vivo que podem cantar, dançar e responder a comentários em tempo real, sem precisar de uma única pausa. A XiLing é única em sua capacidade de apoiar todo o processo de criação de um ser humano digital, desde a criação de uma persona realista até dotá-la de habilidades de conversação e geração de conteúdo. Um de seus atributos mais marcantes é a velocidade. A plataforma pode gerar um avatar 3D baseado em uma pessoa real em uma a duas semanas, enquanto um avatar 2D pode ser feito em questão de minutos.

Além disso, usando as ferramentas de diálogo inteligentes do XiLing, os criadores podem personalizar rapidamente a capacidade de conversação de um humano digital, permitindo que ele se adapte e aprenda ao longo do tempo. Esse recurso é impulsionado pelo PLATO da Baidu, um modelo de diálogo de cem bilhões de parâmetros que permite que humanos digitais participem de conversas de domínio aberto, ou seja, entender qualquer tópico e fornecer respostas relevantes. O reconhecimento de fala altamente preciso e a sincronização labial com precisão acima de 98,5% permitem que o humano digital tenha interações mais suaves e semelhantes às humanas. “O uso de tecnologias avançadas de IA continuará reduzindo o custo de construção de humanos digitais e melhorará significativamente suas interações com humanos reais”, diz Li.

Assim como todo ser humano real tem seu próprio conjunto de habilidades e talentos, a nova geração de humanos digitais também tem. Isso pode incluir até mesmo dar aos humanos digitais a capacidade de serem criativos, graças ao recente progresso feito por grandes modelos de IA como o ERNIE do Baidu, que pode gerar textos e criar imagens realistas quando solicitado. Os humanos digitais projetados para servir como porta-vozes da marca, por exemplo, podem criar e postar de forma independente nas mídias sociais, criar pôsteres e atuar em vídeos.

Leave a Reply

Your email address will not be published.