Desta vez, no ano passado, a mídia social estava em chamas com o viral “Deep Nostalgia” do MyHeritage, cuja magia de IA anima nossas antigas fotos de família com um realismo perturbador. Bem, se você se assustar com isso, espere até ver o novo recurso que acabei de chamar LiveStory.
Desta vez, a tecnologia de uma empresa de genealogia online não está criando um pequeno clipe de 10 a 20 clipes com base em uma foto antiga de seu parente. Em vez disso, o LiveStory vai além criando um vídeo animado mais longo de seu antepassado que conta a história de toda a sua vida, completo com áudio de sincronização labial e uma apresentação de slides de fotos antigas.
Como antes, ele funciona usando a tecnologia de “reconstituição” alimentada por IA que anima uma imagem do rosto de seu parente. Mas desta vez você também recebe uma voz que é gerada automaticamente a partir da árvore genealógica do MyHeritage ou inserida manualmente por você. Em seguida, a tecnologia de conversão de texto em fala dá vida à história e a voz é sincronizada com o alto-falante em movimento de seu parente.
Como funciona?
Assim como a tecnologia “Deep Nostalgia” do ano passado, as animações do LiveStory são criadas usando uma grande coleção de “drivers videos”. Depois que os algoritmos do serviço analisam a imagem que você carregou, seus recursos salientes, ou “recursos” faciais, são mapeados para o vídeo do motorista para criar a impressão de movimento. Os algoritmos também preenchem os detalhes ausentes. O gerador de voz sintética também cria uma narração com base nas informações do perfil da pessoa, ou você pode criar seu próprio roteiro do zero. Você também pode enviar sua própria gravação de áudio.
MyHeritage e D-ID, a empresa israelense que cria e licencia a tecnologia, diz que o resultado final é totalmente personalizável, dando a você a capacidade de alterar narração, imagens e áudio antes de enviá-lo para a família ou mídia social. O LiveStory também parece oferecer suporte a 31 idiomas, dezenas de dialetos e centenas de caracteres de voz, além de várias opções de voz masculina e feminina.
Apesar de tudo isso, não há dúvida de que a tecnologia é um pouco assustadora e nos leva a uma jornada ainda maior no vale misterioso. Para alguns, adicionar áudio pode levar as coisas longe demais, e o MyHeritage teve que adicionar algumas isenções de responsabilidade para garantir que a tecnologia não estivesse sendo abusada. Ele diz que o LiveStory “só se destina a ser usado em fotografias de pessoas falecidas, geralmente seus ancestrais” e que “nunca deve ser usado em uma fotografia de uma pessoa viva sem sua permissão”.
No entanto, muitos nas mídias sociais descobriram que a técnica de “nostalgia profunda” do ano passado era uma maneira reconfortante ou mesmo comovente de “conhecer” relacionamentos que nunca haviam visto na vida real. Assim como esse recurso, o LiveStory está atualmente disponível para teste gratuito no desktop e na web móvel (ambos via Site MyHeritage) e no aplicativo móvel MyHeritage. Você pode criar várias LiveStories gratuitamente, mas depois disso você precisará pagar por uma assinatura (a partir de $ 119 / £ 89 por ano).
Análise: Um movimento mais ousado para o vale misterioso
Assim como o “Deep Nostalgia” do ano passado, estamos um pouco divididos sobre o novo recurso “LiveStory” do MyHeritage. Não há dúvida de que a tecnologia é ótima, e o fato de poder gerar automaticamente uma biografia de vídeo de 90 segundos a partir de uma foto, árvore genealógica e algum texto é impressionante e aterrorizante.
No entanto, não podemos deixar de sentir que grande parte do sucesso viral anterior da tecnologia (que resultou em 100 milhões de animações) se deve à sua precisão. Os rostos em movimento que o Deep Nostalgia produziu ocasionalmente piscavam ou inclinavam a cabeça, mas esse era o caso – e essa restrição ajudou a criar uma ilusão enquanto mascarava as limitações da tecnologia.
Adicionar som é um passo lógico e, sem dúvida, provará ser uma ferramenta popular para aqueles que não se arrepiam com o inegável fator de fluência. Mas pelos exemplos que vimos até agora, a entonação às vezes é automatizada e o fato de o som não ser sampleado do original o torna um pouco artificial.
Atualmente, o LiveStory parece ser mais adequado para museus ou educação, onde sua capacidade de dar vida a figuras históricas (em vez de relacionamentos pessoais) pode ser uma maneira útil de tornar a história mais envolvente para visitantes e crianças.
Claro, também há potencial para uso indevido, embora a D-ID (o fabricante da tecnologia) tenha colocado algumas barreiras para evitar que isso aconteça. Todos os usuários precisam aceitar os termos, incluindo a promessa de que não o usarão em pessoas vivas, antes que possam criar uma LiveStory. Há também um algoritmo de modificação de texto a bordo para verificar informações ofensivas, difamatórias ou falsas, embora não esteja claro como estas últimas são verificadas.
quando Conversamos com o D-ID no ano passado em uma entrevista exclusivaEstamos impressionados com o compromisso dela em garantir que sua tecnologia de IA não seja usada de maneira nefasta, se também um pouco incomodados com sua previsão de que a maioria da mídia visual que vemos online será sintética “dentro de 5 a 10 anos”. LiveStory é claramente mais um passo na linha.Esta faixa, se não o movimento, é o sucesso viral que foi “nostalgia profunda” no ano passado.