Fazer com que as máquinas aprendam por conta própria: esse é, hoje, o grande desafio da inteligência artificial, a IA. Com esse objetivo e aparelhada de técnicas que imitam o processo de aprendizagem dos humanos, nasceu a área de “machine learning” ou aprendizado de máquina, cujo foco é possibilitar que os computadores desempenhem tarefas sozinhos por meio de observações ou interações com o ambiente.
A ideia, simples — basta alimentar uma máquina com dados e definir um propósito —, se inspira no modo como os humanos aprendem, ou seja, eles observam padrões já quando nascem. Uma criança passa a reconhecer um cachorro depois de observá-lo diversas vezes. Após soltar um brinquedo no ar e repetir essa ação, ela interioriza que tal objeto vai cair. Observar padrões e interagir com o mundo é como vivenciamos a realidade, uma experiência que está associada ao modo como interpretamos o ambiente.
Fudamentando-se nessa ideia, a área da IA obteve vários casos de sucesso, como derrotar o campeão humano no jogo go, até resolver um problema da biologia que estava encruado havia cinquenta anos. Aqui, porém, trata-se de situações em que lhe ensinaram tanto o jogo como a relação entre as proteínas. Não espanta que nos perguntemos se, além dessas realizações, ela seria capaz de criar ou gerar coisas por si só, o que para os seres humanos é natural. Nossa inteligência é, em geral, muito associada a nossa capacidade de construir, de obras de arte a projetos de cidades e receitas culinárias – enfim, a imaginação é o limite.
A questão motivou cientistas da computação a investigar como uma IA seria capaz de entender e extrair a informação de dados, que são alimentados ao modelo, e com base neles conseguir construir novos dados. Foi então que as redes generativas ganharam força. E o que são redes generativas? São redes que são ensinadas a refazer versões dos dados após entender a distribuição deles. Como produzir imagens baseadas em desenhos ou montar uma casa após observar diferentes fotos de casas. A combinação das redes generativas com o potencial que as redes neurais oferecem foi um marco importante para o avanço dessa proposta.
Uma das primeiras tarefas dessas redes generativas foi adquirir a habilidade de reproduzir rostos humanos. Ao longo dos anos, o sucesso dessa aquisição foi tamanho que hoje é difícil discernir se uma imagem é de fato uma foto tirada por olhos humanos ou a criação de uma IA. Não demorou muito e novos desafios surgiram, como criação de poemas e refazer uma cidade.
Recentemente, uma dessas redes conseguiu refazer em 3D a cidade de São Francisco, na Califórnia, depois de ter estudado fotos tiradas por carros. O feito foi obtido pela Waymo, uma empresa da Google que visa utilizar essa IA para treinar carros autônomos sem o risco de acidentes. Aliada a uma possível revolução a indústria de videogames, essa seria uma das primeiras aplicações diretas de uma produção de IA.
A grande revolução na área de IA nos últimos anos veio do GPT-3, um modelo monstruoso com 175 bilhões de parâmetros que utiliza redes generativas que podem gerar conversas, livros e até códigos. Uma versão com 12 bilhões de parâmetros, a DALL-E, foi construída para formar imagens com base em outras ou a partir de um texto. Mas o avanço veio com a segunda versão do DALL-E, que tanto cria imagens baseadas em textos como “ursinhos de pelúcia trabalhando num computador na Lua”, como pinta quadros ao estilo de grandes artistas, com resultados impressionantemente semelhantes ao do pintor que foi emulado.
Aos poucos as máquinas estão entendendo como produzir o mundo em que vivemos, seja a parte física, como uma cidade inteira em 3D, seja o modo como interpretamos a realidade por meio da arte, da literatura, da fotografia. Talvez tenha chegado a hora de começarmos a nos perguntar se em algum futuro próximo elas não estariam aptas a criar mundos tomando o nosso como base.
*
Roberta Duarte é física e doutoranda, e trabalha com aplicações de inteligência artificial na astrofísica.