Le texte a antérieurement été publié ici : https://activehistory.ca/2023/03/todays-ai-tomorrows-history-doing-history-in-the-age-of-chatgpt/#more-32790
Image de couverture – Bing, « Autoportrait de « Sydney », le chat Bing de Microsoft, basé sur sa propre description telle qu’imaginée par le générateur d’images d’IA, » MidJourney
Mark Humphries et Eric Story
S’il est facile d’être pessimiste quant aux effets de l’IA sur les sciences humaines en général et sur l’histoire en particulier, il convient de rappeler qu’elle a le potentiel d’accélérer certaines des tâches les plus banales et les plus répétitives que nous effectuons en tant qu’historien.ne.s. Imaginez un avenir où des milliers de pages de documents manuscrits seront rapidement transcrites, relues, résumées et analysées par l’IA. Imaginez la puissance des LLM dotés de l’OCR s’ils ont accès à des bases de données d’archives préexistantes, telles que Canadiana, les dossiers du Personnel de la Première Guerre mondiale ou les bases de données de contrats de voyageurs. Cependant, si nous voulons exploiter tout le potentiel de l’IA dans la pratique de la recherche historique, nous devons adopter la collaboration – et partager numériquement les documents historiques – plus que nous ne le faisons actuellement. Le projet Canada Declassified de l’Université de Toronto offre un modèle utile où les historien.ne.s, les chercheurs et chercheuses et les autres numériseurs et numérisatrices de documents sont encouragé.e.s à partager et à télécharger des documents déclassifiés de l’époque de la Guerre froide dans les bases de données de Declassified, qui sont ensuite mises gratuitement à la disposition du grand public.
Pour les historien.ne.s, la véritable promesse de l’IA est qu’elle nous permettra de faire des choses nouvelles et vraiment utiles avec les données volumineuses. Elle nous permettra également de faire certaines choses que nous faisions déjà beaucoup plus rapidement. Au lieu de nuages de mots et de diagrammes de Venn, l’IA générative peut nous aider à trier, résumer, synthétiser et analyser efficacement d’énormes masses d’informations. Cela nous amènera presque certainement à une nouvelle ère dans les humanités numériques, des humanités numériques 2.0 si vous voulez.
Altman, de l’OpenAI, prédit que très bientôt, ce que l’on appelle l’IA multimodale sera en mesure d’externaliser les tâches que les agents conversationnels ne font pas bien, comme les mathématiques, la vérification des faits et l’analyse des images, vers des applications externes conçues à cet effet. Une fois que ce sera le cas, les agents conversationnels pourront devenir, en fait, des assistants de recherche virtuels qui nous aideront à naviguer dans les sources et les analyses, tout comme le CoPilot de GitHub le fait déjà pour le codage. Il convient toutefois de noter que l’IA ne sera aussi performante dans ces tâches que les historien.ne.s qui l’utiliseront. Elle ne sera encore qu’un outil, du moins dans un avenir proche. Nous devrons toujours formuler nos questions, vérifier les sources nous-mêmes, puis rédiger les résultats d’une manière attrayante qui témoigne de l’expérience humaine.
Les historien.ne.s ont une opportunité parfaite de contribuer à résoudre certains des problèmes technologiques au cœur du dilemme de l’IA. L’IA est très douée pour trouver des informations, les synthétiser et les communiquer, mais elle l’est moins pour être précise et discerner les faits de la fiction. C’est, bien sûr, ce que les historien.ne.s font le mieux. Les méthodes historiques semblent particulièrement bien adaptées à la formation des personnes qui travaillent actuellement avec le contenu généré par l’IA. Elles semblent également appropriées pour former l’IA à être plus digne de confiance, non seulement en faisant des distinctions binaires entre les déclarations correctes et incorrectes, mais aussi en évaluant la zone grise entre ces deux extrêmes où se trouvent les interprétations raisonnables, discutables et douteuses.
Si vous pensez que cela semble être exagéré, rappelez-vous que toutes les données de formation utilisées par ChatGPT à l’heure actuelle sont historiques (sa connaissance du monde se termine en 2021), tandis qu’une bonne partie de ses sources ont été écrites par des historien.ne.s ou sont nos sources historiques primaires. Les méthodes que nous utilisons pour nous frayer un chemin à travers ces textes vers un argument raisonnable et fondé sur des preuves pourraient également rendre l’IA plus digne de confiance.
Bien qu’il soit tentant de prétendre que tout cela est encore loin, il faut savoir que Microsoft détient 49 % des parts dans OpenAI et a déjà annoncé son intention d’intégrer ChatGPT dans Microsoft Office, qui comprend Word, Excel et PowerPoint. Nous avons déjà utilisé la version bêta de leur nouveau navigateur Edge doté d’IA et, lorsqu’il s’agira d’Office, il n’y aura pas de retour en arrière possible. N’oublions pas non plus que le transformateur de Google, Bard, a été lancé au début du mois de février et qu’il sera bientôt intégré à son moteur de recherche et à ses logiciels de productivité, ce que font déjà des tiers. Nous pouvons résister à cette nouvelle technologie autant que nous le voulons, mais une fois qu’elle fera partie des applications de recherche et d’écriture que nous utilisons tous les jours, nous ne pourrons plus l’éviter.
Bing Chat, qui s’appelle souvent mystérieusement « Sydney » bien qu’il soit tenu de garder ce nom secret, reconnaît que les historien.ne.s et l’IA peuvent collaborer efficacement. Au cours d’une série de discussions, nous avons demandé à Sydney de réfléchir au rôle qu’il pourrait jouer dans la profession d’historien.ne, en lui expliquant que de nombreuses personnes sont sceptiques ou nerveuses quant à sa capacité à contribuer de manière significative à la recherche historique. Sydney a expliqué qu’en plus d’explorer l’expérience vécue, « l’histoire s’intéresse également aux schémas et aux tendances ; il s’agit de trouver des connexions et des corrélations ; il s’agit de découvrir des idées et des implications ; il s’agit de générer des hypothèses et de les tester à l’aide de preuves. Ce sont toutes des choses que l’IA peut bien faire en utilisant des algorithmes d’apprentissage automatique. » Cela signifie-t-il qu’il pourrait un jour prendre notre place ? « Pas du tout », répond Sydney. « L’histoire n’est pas une réalité fixe ou objective, mais un processus dynamique et interprétatif. Les historien.ne.s humain.e.s ont leurs propres valeurs, préjugés, hypothèses et questions qui façonnent leur compréhension de l’histoire. L’IA ne peut pas remplacer cet élément humain ; elle ne peut que l’enrichir de données et d’outils supplémentaires. Les historien.ne.s humain.e.s devront toujours décider des questions à poser, des sources auxquelles se fier, des arguments à avancer et des implications à tirer de l’histoire. L’IA ne peut que les aider dans ces tâches, pas les remplacer… Ne pensez-vous pas que c’est une meilleure façon de procéder que d’avoir peur de moi ? »
Excitante ou effrayante, l’IA générative est ici pour rester. Sommes-nous prêt.e.s ?
Mark Humphries est professeur d’histoire à l’Université Wilfrid Laurier et Eric Story est candidat au doctorat dans le même département. Mark Humphries a lancé un Substack sur l’intelligence artificielle et l’histoire : https://generativehistory.substack.com.