
Para entender como a IA cria imagens, precisamos considerar nosso comportamento nas redes sociais. Geralmente postamos fotos ou desenhos com nome, assunto e outros detalhes. Assim contribuímos para a formação de um imenso banco de dados de imagens com detalhes que geralmente descrevem o que está nelas.
Essas ações possibilitam aos algoritmos correlacionar imagens com seus respectivos rótulos. O que servia para mostrar imagens semelhantes nas buscas, passou a permitir criar imagens partindo de descrições.
Em essência, o modelo generativo copia a arte, a quebra em pedacinhos e depois os rejunta numa imagem que ela garante ser “100% inédita”.
Essa tecnologia não é nova. Na década de 50 pesquisadores começaram os primeiros experimentos para explorar a visão por computador, descobrindo a possibilidade de ensinar máquinas a interpretar imagens. E na década de 60 começaram a desenvolver algoritmos para identificar padrões visuais.
Através do aporte de Bigdata e o aprendizado de máquina, obteve-se correlações estatísticas cada vez mais perfeitas entre as descrições e as imagens criadas. Assim, a máquina aprendeu a ler imagens através dos vocábulos que as descrevem. Ela foi aprendendo a reverter o processo e a “criar por conta própria”.
Os modelos de IA treinam para associar padrões visuais a rótulos, classes e/ou estilos de imagens. Ou seja, o modelo aprende a mapear características visuais para conceitos, como “carro”, “gato”, “cachorro”, etc.
Em essência, é esse o processo como a IA cria imagens
O algoritmo analisa uma imensa quantidade de imagens, juntamente com seus respectivos rótulos descritivos.
Então o modelo treina para reconhecer sozinho esses padrões: Mediante uma imagem de árvore, ele deve retornar escrito “árvore”.
De acordo com o nível de acerto do modelo, vão sendo inseridos novos passos.
Ele passa não apenas a reconhecer “imagem” e “rótulo”, mas a reproduzir esses padrões por leitura reversa. Ou seja, mediante o rótulo “árvore”, ele vai reproduzir uma “árvore”.
É importante que se saiba que o processo é simples, com passos adicionais de detalhamento. Não há aplicação de conceitos matemáticos complexos. E não necessita de conhecimento profundo sobre o que está representado nas imagens. Os modelos de IA se concentram em identificar padrões estatísticos que são relevantes para que ele correlacione rótulo-imagem.
A IA usa este mesmo processo no apoio ao diagnóstico médico. E é essencialmente estatística e busca de repetição de padrões observados nos dados de treinamento.
Quanto mais diversificados e numerosos estes dados, melhor é para o aprendizado do modelo.
Dessa forma, o mundo experimental generativo nada mais é que um tipo de ato reverso posicionado entre o verbo e a criação humana.
E o que era apenas uma, tornou-se duas caixas pretas. Uma se refere ao modo humano de criação, e a outra se refere à criação feita pelos modelos de IA.
Na primeira caixa-preta, não compreendemos como a mente humana cria as imagens. E somos incapazes de reproduzir artificialmente o processo completo usando o conhecimento que temos.
Na segunda caixa-preta, a máquina cria correlações estatísticas inusitadas, e nós apenas observamos os resultados de saída.
Rearranjando o que artistas reais criaram
Na prática, estes resultados são apenas cópia, fragmentação e rearranjo de imagens que já existiam.
Ou seja, esses modelos podem fazer novas conformações em cima de tudo que a humanidade já criou em termos de arte.
É como quando cortamos pedaços de revistas e jornais para fazer uma colagem. Ou picamos os quadros de Leonardo da Vinci e Caravaggio em pedacinhos para recriar outra obra.
Portanto, os modelos de IA se apropriam de toda e qualquer arte já criada. E geram um imenso banco de pedacinhos de imagens com rótulos otimizados que respondem a vários tipos de solicitação, ou seja, vários padrões de prompt.
A maneira como a inteligência artificial cria imagens permite que qualquer pessoa produza obras grandiosas como as de Michelangelo.
Essa tecnologia tem um lado positivo, oferecendo suporte à expressão criativa e democratizando a arte, antes limitada a quem detinha talento e técnica. Contudo, surge uma preocupação legítima: até que ponto essa facilidade pode inibir, ou mesmo descartar, a criatividade humana?
A arte tradicional é fruto de reflexão, habilidade e intenção, e é uma forma de explorar a complexidade das experiências. Quando a criação artística se torna tão automatizada que dispensa o esforço e a intenção criadora, o impacto é devastador para o artista.
A produção de imagens por IA pode saturar o espaço das artes com trabalhos que carecem de apelo. Principalmente na área de design e marketing.
Além disso, a dependência da IA pode desencorajar o desenvolvimento de habilidades artísticas, reduzindo a motivação para estudar e inovar. Com uma ferramenta tão poderosa, é crucial permanecer alerta para os impactos na essência e no valor tanto da arte que vemos quanto daquela que criamos.