post patrocinado
Por
Alvo em movimento
A inteligência artificial é uma realidade no mundo do áudio. Para onde vamos?
Por
A inteligência artificial é uma realidade no mundo do áudio. Para onde vamos?
Por Mike Vlcek, produtor musical e sócio da DragonFly Audio
São Paulo, 06/08/2024
Escrever sobre Inteligência Artificial (IA daqui pra frente) no universo do áudio é como tentar acertar um alvo em constante movimento. A tecnologia avança a cada semana, com novidades e notícias a todo instante, embates judiciais em curso, novas ferramentas que revolucionam métodos de trabalho – e também que tiram o sono de muitos profissionais. Como sócio da Dragon.Fly Audio, é meu dever estar sempre antenado em tudo que acontece no nosso mercado. Por isso, mesmo sendo um alvo em movimento, vamos falar aqui sobre o atual estágio da IA em diferentes frentes do áudio: produção musical, pós produção, locuções e dublagens.
No campo prático em que uma produtora de áudio atua, as ferramentas de IA mais populares são as de geração de vozes, separação de instrumentos (stems splitter) e sound replacement (substituir um som, instrumento ou vocal por outro). Em uma produção para publicidade, é comum testarmos diversas versões de um roteiro (ou de canto) sem que seja necessário acionar um locutor ou cantor repetidamente, embora isso também se reflita em uma redução nos prazos para entrega.
Na pós produção, que também faz parte do dia a dia das produtoras, ferramentas de limpeza e restauração do áudio são realidade há anos e seu uso é costumeiro. No mundo pós pandemia, onde muitas locuções são gravadas em ambientes muitas vezes não controlados, essas ferramentas são essenciais para garantir um resultado profissional do áudio. Tudo isso passa por IA e machine learning.
A forma como um produtor e um finalizador do mercado publicitário trabalha em 2024 é, em muitos aspectos, completamente diferente de apenas dois anos atrás graças a esses recursos. Uma verdadeira revolução tecnológica.
Mas, como sabemos, nem tudo são flores. Nos mercados de locução e dublagem a luz vermelha anda acesa há tempos. Existe, inclusive, um projeto de lei, a PL 2338/2023, para tratar da regulamentação do setor. Não seria algo inédito. Alemanha, Espanha e Itália, entre outros, já possuem regras que impõem limites ao uso de vozes geradas por IA em dublagens. Obviamente o custo cai muito em relação aos métodos tradicionais que implicam contratar vários talentos, e isso é algo que teremos que discutir com muito cuidado no futuro próximo.
Há inclusive trabalhos onde a voz gerada por IA se torna uma opção estilística justamente pela sua característica mais linear e com menos carga emocional (algo que pode ser contornado facilmente com a tecnologia speech to speech, vale lembrar). Em outras palavras, a (falta de) interpretação nas vozes de IA estaria na moda? Para o locutor Gabriel Duarte, vice-presidente do Clube da Voz, não há motivo para alarme:
– Não vejo o “estilo IA” virar moda na publicidade. Pelo contrário, cada vez mais a locução publicitária se distancia disso, incluindo elementos de interpretação oral, interjeições, hiper naturalidade, sotaques regionais etc. Quando a voz generativa surgiu o Clube da Voz se propôs a estudá-la. Como funciona a tecnologia, quais os limites legais e éticos, qual o potencial, como tem sido usada e explorada. Essa iniciativa gerou diversos encontros e discussões com protagonistas nessas frentes – diz Gabriel, que completa:
– Na minha opinião, o principal valor do nosso trabalho está na interpretação. Qual é a mensagem e depois interpretar a mensagem. A tecnologia usada na voz generativa não se propõe a fazer isso, ela analisa um grande banco de dados e nos dá sempre a média – acredita o vice-presidente do Clube da Voz.
A questão da regulamentação também aflige o mercado dos dubladores, que seguem pressionando em Brasília para que a PL ande. Bati um papo com o empresário Sérgio Nogueira, dono da produtora Blue Bird no Rio de Janeiro, especializada em dublagem de conteúdo e que é parceira de todos os grandes serviços de streaming, como Disney, Paramount e Netfllix. Para ele, uma regulamentação é o caminho para que a tecnologia seja incorporada de forma responsável no mercado:
– A regulamentação é fundamental para que consigamos definir um caminho, delinear limites para o uso da tecnologia e auxiliar de uma forma geral no resultado final do trabalho. Pensar que o talento será substituído pela IA é uma decisão artística equivocada, porque para produções onde a emoção e a interpretação são fundamentais, a tecnologia não está pronta – afirma Sérgio.
Gabriel também acredita que a regulamentação seja a saída responsável para o futuro do setor:
– Estamos presentes nas discussões sobre a regulamentação do uso da IA como um todo e pressionando para que essa legislação não passe por cima dos nossos direitos autorais. A voz é um direito personalíssimo. A proteção desses direitos dizem respeito à sociedade como um todo, não só locutores e dubladores. E temos a chance enquanto sociedade de fazer isso com o PL 2338/2023. Nesse sentido, precisamos lutar contra o lobby das big techs que querem flexibilizar o uso do conteúdo protegido (como o que você posta nas redes sociais, sua imagem e sua voz) para treinamento de aprendizado de máquina e clonagem. Muitos países já estão implementando controles nessa tecnologia e vamos ver muitas mudanças em breve do que pode ou não ser feito e como você é obrigado a comunicar seu público sobre o processo que você usou – conclui Duarte.
Recentemente tive uma conversa com outro locutor sobre formas de monetização nesse novo mundo. Há locutores que geraram várias versões de suas vozes, em diversos moods, para que possam sempre pegar um trabalho, mesmo quando não tiverem acesso a um estúdio ou microfone – ou mesmo terceirizando o processo de geração da sua voz com a ajuda das produtoras de áudio. Outros consideram isso uma linha que nunca cruzariam.
A verdade é que existem muito mais perguntas do que respostas nesse momento, e não parecem haver limites para o potencial da IA em todos os setores da nossa sociedade, do estúdio de gravação ao set de filmagem, do celular no seu bolso às salas de aula. A cada mês novas ferramentas são criadas ou aprimoradas e coisas que pareciam impossíveis se tornam banais. O nosso desafio, acima de tudo, é conseguir olhar de fora e compreender, mesmo nesse ritmo de avanço insanamente veloz, para onde estamos caminhando. A resposta? Nunca perder o alvo de vista.
Compartilhe
Veja também