Transforme a sua voz com a IA: descubra como a tecnologia está revolucionando a comunicação

Olá! Vou explicar para você de forma simples e fácil de entender o que é a IA. A sigla IA significa Inteligência Artificial. É como se fosse uma “inteligência” criada por seres humanos, mas que não é um ser vivo como nós.

Sabe quando você joga um jogo no computador e os personagens se movimentam sozinhos, sem você precisar fazer tudo? É mais ou menos isso. A IA é como um “cérebro” criado para tomar decisões e resolver problemas por conta própria, mas é feita por programadores que escrevem códigos e algoritmos para ensiná-la a fazer coisas.

Por exemplo, a IA pode ajudar a entender e falar com pessoas de outras línguas, pode ajudar a reconhecer imagens e sons, pode ajudar a fazer diagnósticos médicos e até mesmo ajudar a criar jogos e filmes.

É uma tecnologia muito avançada e que tem muitas possibilidades para ajudar as pessoas.

A definição acima foi criada utilizando uma outra IA muito conhecida atualmente: o ChatGPT.  Este exemplo já é capaz de mostrar o quão poderosa é esta nova tecnologia e como está mudando o mundo em que vivemos, uma revolução que só vimos no início da digitalização no brasil ainda nos anos 90. É magnífico e assustador ao mesmo tempo, o mercado de trabalho e a forma como as pessoas produzem coisas será totalmente diferente, só estamos no começo. 

Modifique a sua voz com IA

Neste aplicativo você modifica a sua voz utilizando IA criando a ilusão de que outra pessoa repetiu a sua fala. O efeito é bem diferente de um sintetizador que deixa a voz parecida com o robô do Google ou aquela mulher do Waze. 

Hoje é muito comum encontrarmos aplicativos onde você digita um texto qualquer e o transforma em voz, o resultado não é dos melhores e praticamente não existe entonação, o que resulta em uma voz robotizada e sem sentimento mas agora está surgindo uma nova geração de aplicativos capaz repetir a sua fala incluindo a sua entonação vocal. Uma das aplicações recém lançadas é o MetaVoice. O seu funcionamento é extremamente simples, você grava a sua voz e escolhe um tipo para o qual ela seja transformada. O resultado é impressionante. 

O Metavoice também é capaz de converter sua voz em tempo real, ou seja, basta plugar o microfone, escolher a voz e soltar a criatividade. 

É graça? Quase...

Não são todos os serviços de IA que são gratuitos, ao que parece os melhores não são mas oferecem uma boa amostra do que podem fazer. No Metavoice você consegue gerar falas de até 3 minutos com 8 opções de vozes diferentes. Já no plano pago mais barato você tem a opção de 43 vozes diferentes e falas de até 5 minutos, o valor é de $10/mês. Bem acessível. 

O serviço não é perfeito mas lembre-se: só estamos no início da revolução utilizando Inteligência Artificial, o que virá será ainda mais assustador.

IA para DJ’s Parte 1

Nos últimos dias muito tem se falado sobre o ChatGPT, uma base de conhecimento criada por meio de inteligência artificial e que de forma assustadora nos traz respostas com um alto nível de qualidade, temos até a impressão de que estamos realmente conversando com alguém, você já experimentou?

Mas o ChatGPT não é o único sistema a se beneficiar da capacidade computacional que temos hoje, há outros diversos aplicativos que estão surfando nesta onda e fazendo com que as pessoas reflitam sobre suas profissões e seu lugar no mercado de trabalho, que por sinal é um assunto que vai longe e não iremos aborda-lo aqui.

Neste artigo, vamos te mostrar alguns dos aplicativos baseados em Inteligência Artificial e o que é possível fazer com eles.

MidJourney

Serviço de Inteligência Artificial para geração de imagens baseado em instruções descritivas, ou seja, você diz o que gostaria de ver o serviço gera uma imagem baseada nesta descrição, por exemplo: “Uma toca-discos da marca Technics, modelo SL MK 1200“, como o serviço funciona melhor utilizando o idioma inglês, então você poderá usar o chatGPT ou até mesmo o google Tradutor: “a technics turntable model sl mk 1200 “, eis o resultado:

Como a nossa descrição não foi detalhada o suficiente, a IA se baseia em seu “conhecimento” para completar lacunas, gerando uma imagem bonita, porém imperfeita mas a medida em que você vai detalhando, melhor será o resultado. Com um pouco mais de conhecimento do uso do prompt, você consegue definir a iluminação utilizada, o tamanho da imagem, o material, etc. Na documentação do serviço há diversos comandos a serem explorados.

Você também pode fazer o upload de uma imagem qualquer para que a IA utilize como base para arte a ser gerada mas lembre-se de que não será gerada uma versão de sua imagem, apenas uma nova imagem que utiliza dos elementos que você forneceu, por exemplo: você não irá conseguir criar uma versão sua em 3d ou cartoon, o sistema criará apenas uma imagem parecida com a fonte que você forneceu. Inserir palavras também é outro desafio, embora seja possível. Vale lembrar que para fornecer uma imagem como base é preciso que você suba esta imagem para algum serviço, recomendamos o PostImages. Então você faz o upload para este serviço, copie o “Direct Link” e informe no prompt, desta forma: /imagine <url da imagem> demais instruções.


Mais um exemplo: “A DJ playing song in a turntable technics mk2 1200“, resultado:

Exemplo gerado utilizando uma imagem base.

Neste exemplo, subimos para o PostImages uma capa de disco antigo para ser utilizada como base, veja o que a IA gerou para nós:

Imagem utilizada como base
Imagem gerada pela IA do Midjourney

Vale lembrar que a descrição utilizada não gerará a mesma imagem, portanto, faça seus testes, logue-se na plataforma , escolha a opção “Join the Beta”, escolha uma sala qualquer como “newbies-130” e na barra de descrição (conhecida como prompt) digite: /imagine (espaço) <descreva-sua-imagem> (tecle enter)

O serviço funciona dentro da plataforma Discord, o que pode causar uma certa confusão para usuários iniciantes porem asseguramos que o funcionamento é extremamente simples.

Quer mais um exemplo de imagem gerada no MidJourney? Saca só isso:

Mas de quem é esta imagem? Quais o direitos sobre ela? é possível utiliza-la comercialmente?
A resposta é SIM! Pelo menos por enquanto que não há legislação para isso. O assunto é amplamente discutido mas já é de conhecimento que artistas estão unindo forças para barrar o seu uso, isso não faz lembrar o caso dos taxistas no início do Uber no Brasil? Um bom artigo sobre assunto: https://olhardigital.com.br/2023/02/06/internet-e-redes-sociais/midjourney-imagens-produzidas-com-ia-podem-ser-usadas-comercialmente

Preço do Serviço

Você poderá utilizar o Midjourney gratuitamente por um numero limitado de horas mas há pacotes mensais a partir de 10 dólares mensais, um valor justo pela qualidade do serviço. Se você presta serviços de criação de flyers, cartazes e peças publicitárias em geral, este valor se paga logo nos primeiros trabalhos.

O Sistema que Pode Clonar Qualquer Voz

Esta notícia está longe de ser novidade, ela foi publicada em 2016 por vários portais especializados mas o que chama a atenção é que, como pode algo tão extraordinário se manter por tanto tempo sem que ninguém tocasse mais no assunto? O sistema criado pela Adobe (os mesmos criadores do Photoshop) é capaz de clonar com perfeição qualquer voz humana tendo como base apenas uma amostra. Sabe aquelas cenas em filmes de ficção científica onde um determinado android fala ao telefone com a voz de outra pessoa? Isto já é realidade. Imagine em dublagens de filmes, o sistema seria capaz de fazer com que o ator do filme falasse em Língua Portuguesa ou qualquer outro idioma utilizando a própria voz do ator. Mas nem tudo são flores, existe toda uma questão ética por trás desta nova tecnologia, o que talvez tenha contribuído para que o sistema não tenha causado tanto impacto como se imaginava. O sistema não foi oficialmente lançado e pelo jeito vai demorar para chegar às mãos de pessoas comuns. Outra empresa que já trabalha com esta tecnologia é a Lyrebird, segundo ela, são os pioneiros. Ao acessar a página da empresa, a primeira coisa que vemos é um aviso sobre ética mas há também exemplos de aplicação onde é clonada a voz de Barack Obama e Donald Trump. Veja abaixo como o sistema da Adobe funciona, é assustador: Junte isso ao Auto-Tune e em breve teremos músicas inéditas na voz de Michael Jackson, Whitney Houston, John Lennon, Elvis Presley e todos aqueles que um dia estiveram entre nós. Mas a grande questão é a forma como isto seria utilizado em mãos erradas, já imaginou uma falsa declaração de um chefe de estado usando sua “própria” voz? Desastroso, não? De qualquer forma este sistema é simplesmente genial, será o verdadeiro “photoshop” da voz.

Conheça também o Metavoice, aplicação que utiliza IA para modificar a sua voz lançada em 2023.

MP3 Agora é Free!

Como assim? E já não era livre?
Na verdade não. Uma das principais empresas que trabalharam na criação do formato MP3 foi alemã Fraunhofer, (este nome não deve ser estranho para você, já falamos sobre ela no post -> “Qual Foi o Primeiro MP3 da História?”) e esta semana ela soltou uma nota informando que a última patente do produto expirou em abril/2017 ou seja, a partir de agora o formato MP3 está livre.

Os criadores do formato MP3 – (Esquerda para direita) Dr.-Ing. Bernhard Grill, Prof. Dr.-Ing. Karlheinz Brandenburg, Dipl. Harald Popp

Para o usuário final, tudo é ôba-ôba mas para que uma empresa pudesse suportar o formato em seus aparelhos como CD’s Players, Rádios Automotivos e até mesmo celulares, era obrigatório o pagamento e os valores eram absurdos! Só para se ter uma ideia do tamanho do problema, em 2007 a Microsoft quase pagou mais de 1 bilhão de dólares pelo uso indevido do formato.

Quem é usuário Linux já deve ter passado pela chateação de não conseguir ouvir MP3 no sistema sem que tivesse que procurar por algum recurso extra e até mesmo para usuários Windows, alguns programas exigem que você adquira um decodificador externo para tal tarefa. Mas tudo isto mudou este mês e se você pensa que a Fraunhofer está tristinha com isso, esqueça… eles já ganharam muito dinheiro com o invento e já tem consciência de que o formato já foi superado há anos por outros melhores como o AAC e até mesmo o Ogg. O MP3 hoje é apenas o mais popular.

O Que Muda?

Ainda há softwares que exigem que você instale um plugin à parte, talvez este problema desapareça com o tempo e mais aparelhos poderão suportar o formato sem maiores problemas mas a guerra dos formatos irá continuar, resta você escolher o que soa melhor aos seus ouvidos e qual deles poderá ser executado no maior numero possível de dispositivos.
Para você, praticamente nada irá mudar.

Referências :https://tecnoblog.net/214020/fim-patentes-mp3/, http://www.deutscher-zukunftspreis.de/de/nominierte/2000/team-1, https://512pixels.net/2017/05/the-mp3-isnt-dead/, https://flipboard.com/@popularmechanics/-the-mp3-is-now-free/f-8d1bc017ee%2Fpopularmechanics.com