terça-feira, 18 de abril de 2023

Entenda como as inteligências artificiais erram fatos básicos da história

 Por Elias Thomé Saliba

 Entenda como as inteligências artificiais erram fatos básicos da história -  Estadão
 Foto: Warnes Bros.

Teste feito com o ChatGPT mostrou que ele não reconheceu a existência do rei Carlos V da França

Uma historiadora inicia seu trabalho consultando online arquivos judiciais do século 19. A partir de sua hipótese para uma primeira sondagem seleciona processos que envolvem mulheres presas, e logo ela encontra cerca de mil registros que vão constituir o conjunto documental de sua pesquisa. Prossegue na garimpagem, baixando as transcrições completas para, em seguida, utilizar-se de ferramentas as quais fornecem, minutos depois, um gráfico de palavras-chave e as suas frequências ao longo do tempo.

Em seguida, utilizando-se de outro software de mineração de palavras, começa a procurar a estrutura semântica subjacente aos registros – e o algoritmo, depois de dois minutos de exploração, seleciona cerca de 25 tópicos que se relacionam com a maioria das palavras em cada documento. Com outro software de mineração de vocábulos, ela explora a relação entre os tópicos e os textos, formando uma rede de discursos que versam sobre os deveres legais e morais do Estado para com as mulheres presidiárias. Explora esta rede de discursos, identificando outros personagens e suas falas, incluindo carcereiros, crianças, homens e mulheres, concentrando-se em um conjunto menor de pessoas ligadas a uma comunidade prisional.

Ensaio fotográfico pelas ruas de São Paulo inspirado na estética do filme Blade Runner
Ensaio fotográfico pelas ruas de São Paulo inspirado na estética do filme Blade Runner Foto: Tiago Queiroz/Estadão

Ao final, depois de apenas duas horas de trabalho, ela já dispõe de uma espécie de visão macroscópica em torno de meio século de julgamentos de mulheres e de suas dezenas de conexões.

A descrição acima não é exata, mas indica uma mudança de paradigma no trabalho historiográfico: a passagem de uma cultura da escassez para uma cultura da abundância de fontes. Entre outros, é um dos muitos exemplos dos impactos do universo digital na prática historiográfica, analisados por Roy Rosenzweig (1950-2007) em Clio Conectada – O Futuro do Passado na Era Digital. Rosenzweig foi um dos primeiros historiadores a criar um centro de História e Novas Mídias, ainda no longínquo ano de 1994. Evitando tanto o ludismo instintivo de historiadores – ainda amarrados aos ritos metodológicos do mundo analógico – quanto um entusiasmo apressado e deslumbrado pela tecnologia, foi pioneiro em trabalhar, pela primeira vez, em conjunto com técnicos e engenheiros com o objetivo de criar softwares específicos para a pesquisa, ensino e divulgação da História. Precocemente falecido aos 57 anos, ele deixou um importante legado de ensaios e reflexões sobre o impacto do universo digital na pesquisa e no ensino de História, reunidos neste recente lançamento.

Versáteis e abrangentes, os ensaios refletem sobre o uso das ferramentas digitais nas Humanidades, analisando uma série de temas que visam superar os novos problemas suscitados pelas mídias digitais, as quais têm desestabilizado sistemas heurísticos tradicionais que permitiam maior grau de confiabilidade, autenticidade, direitos autorais e preservação. Analisa ainda a Wikipédia, a mais importante fonte histórica gratuita da internet, contando um pouco da sua história e considerando tanto os rasgados elogios quanto as formidáveis restrições. Rosenzweig é mais equilibrado: apesar da enorme quantidade de erros e limitações em verbetes de História na Wikipédia, ressalta o seu grande triunfo em democratizar as informações.

O nome da enciclopédia livre foi dado pelo primeiro criador do software, que copiou a expressão havaiana “wikiwiki” (que significa “rápido” ou “informal”). Como qualquer edição de um verbete se torna imediatamente disponível, viola-se reiteradamente a regra de citar as fontes e muitos dados são incompletos e desatualizados. Ela funciona como uma espécie de enorme megafone, ampliando a sabedoria convencional, ocasionalmente incorreta. “Mas será que devemos culpar a Wikipédia pelo apetite por informação pré-digerida e pré-preparada ou pela tendência a acreditar que tudo aquilo que se lê é verdade?”, questiona Rosenzweig. Esse problema já existia antes, nos dias daquelas antigas “enciclopédias de famílias”.

Luzes artificiais baseadas no filme Blade Runner, de 1982, de Ridley Scott
Luzes artificiais baseadas no filme Blade Runner, de 1982, de Ridley Scott Foto: Tiago Queiroz/Estadão

Já no campo do ensino, os problemas são mais graves. “Muitos de meus alunos do segundo ano da graduação não sabem distinguir um site legítimo, que tenha documentos primários autênticos ou artigos reproduzidos (avaliados por pares) daqueles outros sites que contêm uma versão popularizada da história, ou das mídias de bate-papo em que as mais loucas teorias da conspiração são transformadas em realidade”, escreve uma professora, colega do autor. O que se diz da Wikipédia vale para toda informação retirada da internet em geral: muitos alunos aceitam grande parte do que veem ali sem uma visão crítica – e quando não conseguem achar alguma coisa na web costumam concluir que ela não existe. A solução de Rosenzweig é a mesma para todos os usos: gastar mais tempo mostrando as limitações de todas as fontes de informação, enfatizando as habilidades de análise crítica das fontes primárias e secundárias.

O autor ainda recomenda uma atuação conjunta de historiadores, arquivistas e engenheiros no urgente trabalho de preservação. Muitos especialistas acreditam – equivocadamente – que o problema central é que estamos armazenando informações em mídias que têm tempo de vida muito curto. A mídia digital e a antiga mídia magnética sofrem deterioração em 10 a 20 anos. Mas a mídia está longe de ser o elo mais frágil na cadeia digital de preservação. Muito antes que a maior parte das mídias se deteriore, é provável que se tornem ilegíveis em razão de mudanças no hardware (obsolescência do disco ou dos drives) ou no software (dados gravados em formato de um programa que não roda mais).

Visão macroscópica pode levar a historiografia a enxergar apenas 
a floresta e perder de vista as árvores

Rosenzweig não viveu para conhecer as atuais “infraestruturas de nuvens” ou coisas parecidas, mas tinha razão ao enfatizar que o trabalho de preservação é cada vez mais urgente. A preocupação com o futuro do passado registrado digitalmente aumenta ainda mais quando se percebe que, na maioria dos países, o comprometimento público com os registros históricos digitais ainda é muito baixo.

Apesar de escritos há mais de duas décadas, seus ensaios sobre o uso de software no ensino de História são bastante prescientes. Ele foi o primeiro a criar, com a colaboração de Daniel Cohen, o H-Bot, um software de História que funcionava como um localizador automatizado de acontecimentos históricos. Ele submeteu o H-Bot a um exame normalmente utilizado no ensino médio da época (parecido com o Enem) e o robô não se saiu tão mal. Foi muito bom em perguntas do tipo: “Quem foi...” ou “Onde...? Mas errou feio em questões que exigiam desambiguação factual – aquele famoso teste que consiste em perguntar: Quem foi Carlos V? A resposta indicou apenas Carlos V, o imperador do sacro império romano-germânico do século 16. E ignorou completamente o outro Carlos V, que foi rei da França no século 14. Coisa menor, mas bastante significativa.

Cena de 'Blade Runner 2049', em que história e futuro passam pela tela do computador
Cena de 'Blade Runner 2049', em que história e futuro passam pela tela do computador  Foto: ESTADAO / undefined


Em homenagem a Rosenzweig, não resistimos a fazer o mesmo “teste de Carlos V” para o recente e badalado ChatGPT: ele respondeu citando apenas o Carlos V, do sacro império. Insistimos, dando uma dica do contexto, perguntando: “E Carlos V, rei da França, no século 14?”. O ChatGPT reiterou o erro: “Não houve um rei Carlos V na França”. Teimoso este robô não? Errou feio num simples teste de desambiguação factual. É claro que daqui a alguns dias (ou horas) certamente os algoritmos de segunda geração aprenderão a diferenciar os dois imperadores.

Mas, como no exemplo inicial da historiadora, um pequeno alarme começa a soar: será que a visão excessivamente macroscópica de um certo passado não levará a historiografia a enxergar apenas a floresta e perder de vista as árvores? Afinal, nesta, como em outras áreas, o futuro está ainda muito longe de se mostrar definido. Sabemos, nos últimos anos, o quanto as novas tecnologias introduzem possibilidades tanto repressivas quanto libertadoras. E o que está em jogo é, nada mais nada menos, que o futuro do passado.

CLIO CONECTADA

Autor: Roy Rosenzweig

Tradução: Luis Reyes Gil

Fonte: https://www.estadao.com.br/alias/entenda-as-inteligencias-artificiais-erram-fatos-basicos-da-historia/

Nenhum comentário:

Postar um comentário