Histoires de Claira

Comment inclure l'historique des conversations avec l'IA dans l'eDiscovery

Résumer avec l'IA

Les outils d’IA générative sont devenus discrètement partie intégrante de la journée de travail des avocats, parajuristes, dirigeants et ingénieurs. Les gens rédigent des mémos dans ChatGPT, réfléchissent à des conditions d’accord dans Claude, résument des réunions dans Copilot et demandent à Gemini de comparer des normes juridiques. Ces conversations contiennent souvent le même genre de franchise qu’on trouvait autrefois dans les courriels, Slack et les messages textes. Cela signifie qu’elles entrent dans le champ de l’eDiscovery - et les équipes qui n’en tiennent pas encore compte risquent d’être surprises lorsque le conseil adverse les demandera.

Cet article explique comment traiter l’historique de clavardage de l’IA comme une source pouvant faire l’objet de la divulgation. Il couvre ce qu’il faut collecter, comment exporter à partir des principaux outils grand public, comment intégrer ces exports dans Nuix Discover, et comment les examiner efficacement avec Claira. L’objectif est d’obtenir un flux de travail défendable, proportionné et reproductible.

Pourquoi les conversations d’IA sont découvrables

L’analyse est la même que celle que les tribunaux appliquent depuis des années. Les renseignements pertinents et non privilégiés doivent être préservés et produits, peu importe où ils se trouvent. Les Principes de Sedona Canada et les Federal Rules of Civil Procedure des États-Unis définissent tous deux l’information stockée électroniquement de façon suffisamment large pour englober tout ce qui est saisi, généré ou enregistré dans le cours normal des activités. Cela inclut les conversations avec l’IA.

Ce qui est nouveau, c’est le mélange de contenu au sein d’une même session. Un seul fil ChatGPT peut contenir une première version d’un contrat, une question de recherche juridique, un copier-coller d’un mémo stratégique confidentiel et une remarque personnelle sur un collègue. La frontière entre ce qui est privilégié, réactif et sans pertinence peut changer d’un paragraphe à l’autre. C’est la véritable raison pour laquelle cette source mérite un flux de travail réfléchi plutôt qu’une collecte faite au mieux.

L’autre subtilité concerne la garde. Certains outils conservent les conversations dans le compte de l’utilisateur et lient la rétention aux paramètres de la personne. D’autres transfèrent tout vers un espace de travail d’entreprise. D’autres encore, comme les installations locales de Copilot, répartissent des fragments entre les caches des appareils, les documents Office et les journaux d’audit M365. Identifier le bon dépositaire des données est aussi important que d’identifier le bon dépositaire des communications qu’elles contiennent.

Collecte à partir des principaux outils

La bonne nouvelle, c’est que tous les principaux fournisseurs prennent désormais en charge une forme d’exportation. La mauvaise nouvelle, c’est qu’aucun export ne se ressemble, et qu’aucun n’arrive dans un format prêt à la révision. Voici ce qui fonctionne aujourd’hui, à la date de rédaction.

ChatGPT offre une exportation en libre-service dans Paramètres - Contrôles des données - Exporter les données. Le résultat est un fichier zip contenant un conversations.json et un rendu HTML. Le JSON conserve l’ordre des messages, les rôles, les horodatages, ainsi que toute pièce jointe d’image ou de fichier par référence. Le HTML est plus facile à lire pour un réviseur, mais supprime certaines métadonnées. Pour les comptes d’entreprise, les administrateurs peuvent lancer des exportations à l’échelle du compte via la console d’administration OpenAI.

Claude d’Anthropic propose une exportation similaire sous Paramètres - Confidentialité - Exporter les données, qui renvoie une archive JSON des conversations et une vue HTML simple. Les espaces de travail Claude d’entreprise peuvent être exportés par les administrateurs de l’espace de travail, et les Projects sont exportés sous forme de bundles structurés avec leurs fichiers joints intacts.

Microsoft Copilot est le plus délicat des quatre grands. Les conversations du Copilot grand public s’exportent via le tableau de bord de confidentialité Microsoft. Les conversations de Copilot pour Microsoft 365, en revanche, sont stockées comme éléments masqués dans la boîte aux lettres Exchange de l’utilisateur et exposées par eDiscovery Premium dans Purview. Si vous avez un dossier impliquant Copilot, supposez que la collecte passera par Purview plutôt que par une exportation accessible à l’utilisateur.

Les conversations Google Gemini sont disponibles dans l’archive Google Takeout de l’utilisateur, en JSON ou en HTML, et les conversations Gemini d’entreprise passent par Google Vault. Planifiez la collecte de la même manière que vous planifiez la collecte Gmail sur ce locataire.

Quelle que soit la source, déposez l’export brut dans votre zone de préparation forensique habituelle, hachez-le et documentez la chaîne de possession. L’export lui-même est la meilleure preuve que vous obtiendrez. Résistez à la tentation de copier-coller des conversations depuis un navigateur - cela rompt les horodatages et les pièces jointes et ne tiendra pas si l’authenticité d’un seul message est un jour contestée.

Traitement dans Nuix Discover

Une fois les archives en main, vous devez les transformer en documents exploitables par un réviseur. Deux formats traversent proprement Nuix Discover : les PDF de chaque conversation, générés à partir de la vue HTML, et les fichiers natifs du JSON avec une relation parent-enfant vers toute pièce jointe mentionnée. La plupart des équipes avec lesquelles nous travaillons produisent les deux, en traitant le PDF comme le dossier destiné au réviseur et le JSON comme la source faisant autorité.

Associez les métadonnées lors de l’ingestion. Au minimum, vous voulez le dépositaire, le nom de l’outil, le titre de la conversation, la date et l’heure de chaque message, le rôle du message (utilisateur ou assistant) et tout identifiant de pièce jointe. Si votre moteur de traitement ne parse pas ces champs nativement, rédigez un petit préprocesseur pour les injecter dans le fichier de chargement. Cela sera rentabilisé la première fois que quelqu’un demandera toutes les conversations ayant fait référence à un nom de projet précis entre deux dates.

Traitez les pièces jointes dans les conversations comme vous le feriez pour des pièces jointes dans les courriels. Extrayez-les, hachez-les et reliez-les au message parent. De nombreux outils de clavardage permettent aux utilisateurs de coller des images, des feuilles de calcul ou des PDF complets dans la conversation, et ces pièces jointes contiennent souvent le contenu le plus pertinent de tout l’archive.

Révision efficace avec Claira

Une fois les conversations dans Nuix Discover, c’est là que le volume devient le vrai problème. Un seul utilisateur actif de ChatGPT peut facilement générer des milliers de messages à travers des centaines de conversations en une année. La révision linéaire traditionnelle se brise à cette échelle, et la recherche par mots-clés est un instrument grossier pour une source où la même phrase peut être une divulgation stratégique, un remue-méninges anodin ou une ébauche de travail produit, selon ce qui la précède dans le fil.

C’est pour ce flux de travail que nous avons conçu Claira. Déposez les conversations dans un dossier, ajoutez le contexte propre au dossier dans Case Context afin que le modèle comprenne ce qui est en jeu, puis lancez une analyse en lot sur chaque message ou sur chaque résumé au niveau de la conversation. Vous pouvez demander à Claira de signaler tout fil qui traite de l’objet du litige, d’identifier les messages qui semblent privilégiés, d’extraire chaque mention de personnes nommées et de résumer chaque conversation en deux phrases pour une première passe du réviseur. Les résultats reviennent sous forme de champs structurés dans Nuix, prêts à être vérifiés par un réviseur humain.

C’est la même philosophie pragmatique que nous avons décrite dans notre article sur la pérennisation de l’eDiscovery grâce à la révision assistée par l’IA : utilisez l’IA pour les parties du travail où la cohérence et la rapidité comptent le plus, et gardez des humains dans la boucle pour les décisions de jugement. L’historique des conversations d’IA est presque parfaitement adapté à cette répartition du travail, parce qu’il est volumineux, structuré et rempli exactement du genre d’indices qu’un modèle bien interrogé peut repérer.

Une base défendable

Si votre équipe élabore son premier guide de procédures pour la découverte des conversations d’IA, visez trois choses. Identifiez tous les principaux outils d’IA utilisés par vos dépositaires, pas seulement ceux qui sont approuvés. Exportez dans le format natif offert par chaque outil, jamais à partir d’un navigateur. Traitez ces exports dans Nuix Discover avec les bonnes métadonnées et une gestion adéquate des pièces jointes, puis examinez-les avec un outil conçu pour l’échelle et la nuance qu’exige ce type de données. La technologie évolue rapidement, mais l’obligation de préserver, collecter et produire, elle, ne change pas. Un flux de travail réfléchi aujourd’hui coûte beaucoup moins cher qu’une requête en injonction de produire demain.