Sobre imagens e prompts: uma reflexão sobre IAs generativas.
- Paulo Fabre
- 14 de mai.
- 5 min de leitura

Tenho me aprofundado no uso de ferramentas de Inteligência Artificial, seja nas questões mais práticas relacionadas à minha produtividade, seja no pensamento crítico a respeito dos seus limites e implicações, sobretudo no que diz respeito à produção e a interpretação de imagens.
O foco deste pequeno artigo não é discorrer sobre a questão como um todo, tão pouco procurar dar contornos éticos e filosóficos a um tema igualmente amplo, interessante e controverso. Minha proposta é olhar para a geração de imagens por meio de ferramentas de IA e tentar construir uma opinião ao longo das próximas linhas enquanto fotógrafo e criador de imagens.
Bom, comecemos pelo começo: A geração de imagens por inteligência artificial é feita com o uso de algoritmos para criar imagens visualmente realistas ou artisticamente estilizadas a partir de dados de treinamento ou prompts textuais. Essas tecnologias, como GANs (Redes Generativas Adversariais) e modelos de difusão, aprendem padrões complexos de milhares de imagens reais para produzir novas imagens que podem ser utilizadas em diversas aplicações. Ou seja, para gerar uma nova fotografia a máquina recorre a todas as fotografias que ela "conhece" daquele assunto. Portanto, para melhor reproduzir algo a partir de um texto, a mais imagens daquele assunto ela precisa ter acesso. E aqui nós humanos entramos como "alimentadores" desses sistemas de aprendizagem, inclusive com as nossas fotos pessoais lançadas aos milhares diariamente nas redes sociais (A Meta já mudou alguns protocolos incluindo a possibilidade de usar as imagens dos usuários do Instagram para "treinar" a sua IA). Não vou entrar numa discussão sobre a (anti) ética deste caso, mas a minha opinião pessoal é de que um limite moral foi ultrapassado. Enfim…
Ideias e conceitos de autômatos e robôs fazem parte do nosso imaginário há quase 200 anos. Vou recorrer a mais antiga e pioneira delas para construir meu pensamento. Muito antes do Isaac Azimov lançar as 3 leis da robótica (1950), uma jovem inglesa de 19 anos aceitou o desafio de escrever uma história de terror numa noite chuvosa, enquanto estava hospedada num castelo à beira de um lago na Suíça e abriu as portas da ficção científica.
No seu livro lançado em 1818, um cientista obcecado pela a ideia de criar vida a partir de partes de corpos, mergulha ao longo de noites sem fim nos seus estudos e experimentos até conseguir animar uma criatura aparentemente humana de 2,50m de retalhos. Porém, quando o dr. Victor Frankenstein olha para sua criação e se dá conta do que havia empreendido, ele foge, largando-a no mundo por conta própria.
Questões vão surgindo na cabeça do cientista, jogando luzes sobre o futuro da criação junto à humanidade. Um ser como aquele, mais forte, mais apto, traria caos e desgraça ao mundo como conhecemos e, caso encontrasse uma maneira de se reproduzir, poderia aniquilar toda a raça humana.
Já a criatura abandonada consegue aprender a ler e a escrever e, observando de longe, entende alguns códigos daquela sociedade, passando inclusive a admirar e a amar as pessoas. Mas, a repulsa e o medo causados por sua aparência, fazem com que o amor se transforme em ódio e desejo de vingança contra seu criador.
Mary Shelley, filha de uma brilhante escritora e filósofa e de um editor de livros, criou um arcabouços de questões-chave que servem de base para pensarmos o uso e a geração de qualquer coisa a partir de modelos algorítmicos e artificiais.
Assim como o dr. Victor Frankenstein usou partes de corpos para criar um novo, IA's como conhecemos hoje precisam de imagens já existentes para criar novas. Sempre penso nele quando vejo uma foto de uma pessoa com 6 ou 7 dedos fazendo algo que alguém jamais faria. A diferença é que o personagem da Mary Shelley construiu apenas um e o Dall-e produz aos milhares diariamente, treinando seu algoritmo à perfeição. Aqui chegamos num ponto importante: o juízo de valor que o algoritmo dará às imagens construídas replica o das pessoas que o programam. Por exemplo, ao receber o comando de criar a imagem de uma mulher bonita e bem sucedida aparecerá na tela uma variação da Giselle Bundchen. Ou ainda, poderá levar ao equívoco de considerar uma pessoa suspeita apenas pela cor da sua pele. Então, da mesma forma, é preciso que o algoritmo trabalhe com inclusão social e racial, para não apenas repetir nossos vícios.
Vejo outra semelhança, mais sutil ainda, com a história de Shelley. O cientista não descansa enquanto não termina seu trabalho, mas enquanto o faz, ele não sabe para que o está fazendo. Na verdade, ele está forçando um limite, se desafiando para ir além do considerado possível. Tem um objetivo mas nenhum propósito. É resultado pelo resultado, tão comum no universo das empresas e dos negócios.
Do que vi de imagens geradas por IA até agora, a maioria me pareceu ter sido feita apenas para provar que poderia ser feita. De estar nevando em Copacabana até o Papa usando um casaco de rapper, são imagens vazias de propósito que existem somente por existir. E será que depois de provar ser possível fazê-las, ainda precisaremos delas?
Além disso, existe uma crise de autenticidade nas imagens geradas artificialmente. Lembram daquela foto que o prefeito do Rio gerou com turistas chegando na cidade? Pensando nela além do meme e do fuzz pela novidade, não seria mais autêntico, mais original se ela fosse feita com pessoas reais?
Sem dúvida há muitas vantagens para a fotografia com a inteligência artificial. O Photoshop e o Lightroom, por exemplo, programas de edição e tratamento de imagens que todo fotógrafo usa, melhoraram muito com ferramentas de IA embarcadas, agilizando e facilitando o trabalho da mesma forma como outros softwares de dados, apresentações, e diversos campos de pesquisa que tem ganhos exponenciais com novas tecnologias.
Para não me estender demais e fechar logo meu pensamento, acredito que estamos diante da grande ruptura de paradigma. Criamos algo enorme e agora, olhando para esta criatura não podemos nos ausentar da responsabilidade de manter seu propósito a serviço da humanidade, não apenas daqueles poucos humanos que ganham dinheiro com ela.
Na mitologia grega o titã Prometeu rouba o fogo dos deuses e o entrega aos seres humanos, representando com isso o momento em que a humanidade apropria-se do conhecimento. Mary Shelley deu um subtítulo ao seu livro: Frankenstein - O Prometeu moderno, pois trata de exemplo de como a inventividade humana pode produzir coisas incríveis ao mesmo tempo produzir o caos.
Prometeu acabou sendo severamente castigado - acorrentado no alto do mont Cáucaso, um corvo diariamente se alimentaria de um pedaço do seu fígado. Já o dr. Victor Frankenstein morreu doente num navio à deriva no gelo do ártico enquanto sua criatura bestial o amaldiçoava à distância.
Podemos e devemos aprender com as lições do mito e da literatura. As Inteligências Artificiais podem realmente ajudar-nos a evoluir enquanto sociedade, mas também podem contribuir para agravar ainda mais nossos problemas. E como em ambos os exemplos, a responsablidade para tal está nas nossas mãos.
Um texto seu como sempre muito brm escrito e necessário