Histoires de Claira
Chaque document compte : pourquoi nous examinons l’ensemble du dossier, et non un échantillon

Un article de philosophie de Claira sur le caractère défendable, les pistes d’audit et pourquoi « la machine l’a trouvé » n’est pas une réponse.
La question qu’on nous pose sans cesse
Lorsque nous présentons Claira à de nouveaux utilisateurs, une question revient plus souvent que toutes les autres : « Ne peut-on pas simplement demander à l’IA de trouver les documents pertinents et passer le reste ? »
La réponse courte est non — pas dans le sens habituel de la question. La réponse longue est précisément l’objet de cet article, et elle mérite d’être comprise, car elle façonne la manière dont nous avons conçu Claira et notre vision de la façon dont la revue eDiscovery devrait fonctionner.
Nous adoptons une position ferme à ce sujet. Une fois qu’un document a été intégré à un ensemble de revue, chaque document de cet ensemble doit être examiné. Pas échantillonné. Pas recherché par vecteurs pour repérer ceux qui semblent probablement pertinents. Examiné. Chaque document évalué selon vos critères de revue, avec une décision consignée et une justification que vous pourriez défendre si on vous la demandait.
Ce n’est pas une préférence technologique. C’est un problème de logique, et la logique est simple.
Pourquoi la collecte est le moment clé
Le processus de tri existe pour une raison. C’est à cette étape que l’on prend la majorité des décisions défendables visant à exclure des documents de la revue — selon une plage de dates, un dépositaire, un type de fichier, un domaine, des filtres par mots-clés, ou encore par déduplication. Lorsqu’il est bien effectué, le tri reflète des jugements délibérés et documentés sur la pertinence, que l’on peut expliquer à un juge ou au conseil adverse.
Ce qui reste après le tri est, par définition, un ensemble de documents qui pourraient être pertinents. C’est précisément pour cela qu’ils ont survécu. S’il n’y avait aucune chance qu’ils soient importants, le tri aurait dû les retirer.
L’hypothèse de travail pour tout ce qui demeure dans l’ensemble de revue est donc simple : chacun de ces documents pourrait répondre à la demande. Nous ne savons lesquels tant que nous ne les avons pas examinés.
C’est à ce moment que la question philosophique devient concrète. Que faire d’un ensemble de documents que vous avez déjà décidé comme pouvant être pertinents ?
Les deux voies possibles
De manière générale, il existe deux approches.
La première est ce que l’on pourrait appeler la récupération probabiliste — utiliser l’IA pour rechercher, classer ou regrouper des documents et faire remonter ceux qu’elle juge les plus susceptibles d’être pertinents. La génération augmentée par récupération, la recherche vectorielle, le codage prédictif et la plupart des outils d’IA du type « interrogez vos documents » appartiennent à cette famille. Ce sont des outils utiles, et ils ont une vraie place en eDiscovery — en particulier pour l’évaluation précoce d’un dossier, le triage et l’enquête. Nous utilisons nous-mêmes des techniques similaires lorsqu’elles sont les mieux adaptées.
Mais comme méthode principale pour décider ce qui sera produit et ce qui ne le sera pas, la récupération probabiliste introduit un problème difficile à résoudre : les documents qui n’ont pas été retournés n’ont aucune justification écrite de leur exclusion. Ils ont simplement été moins bien classés. Si vous devez ensuite expliquer pourquoi un document particulier n’a pas été produit, la réponse honnête est « le modèle ne l’a pas fait remonter », ce qui est le genre de réponse qui entraîne souvent des questions de suivi que vous préféreriez éviter.
La deuxième approche est celle sur laquelle nous avons bâti Claira. Après le tri, chaque document de l’ensemble de revue est évalué selon vos critères de revue. Une décision est prise pour chacun. Une justification est rédigée pour chacun. Une piste d’audit existe pour chacun.
C’est tout. Ce n’est pas spectaculaire. Ce n’est pas une percée. C’est la même logique qui sous-tend depuis toujours une revue défendable : si vous l’avez collecté, et que le tri ne l’a pas retiré, alors quelqu’un — ou quelque chose supervisé par quelqu’un — doit l’examiner et trancher.
Le problème de la boîte noire
Il y a une raison pour laquelle cela compte au-delà du principe abstrait. Lorsque l’IA est utilisée pour décider ce qui sera examiné plutôt que pour aider à l’examen, l’équipe de revue perd quelque chose d’important : la capacité de défendre les décisions a posteriori.
Considérez les deux questions auxquelles un avocat doit pouvoir répondre au sujet de tout document dans une affaire :
Pourquoi ce document a-t-il été produit ?
Pourquoi ce document a-t-il été retenu ?
Dans une revue humaine traditionnelle, la réponse se trouve dans le codage et les notes du réviseur. Dans une revue assistée par l’IA bien structurée, la réponse se trouve dans l’analyse écrite de l’IA, en parallèle avec la vérification humaine. Dans les deux cas, vous pouvez vous appuyer sur quelque chose de concret.
Dans un flux de travail de récupération probabiliste pure, la réponse pour les documents exclus est une variante de « le système l’a classé sous notre seuil ». Cela peut être exact, et même raisonnable dans certains contextes — mais ce n’est pas une justification, c’est la description d’un processus. Lorsque le conseil adverse demande pourquoi un document précis n’a pas été produit, vous voulez pouvoir dire davantage que « le score de similarité vectorielle était faible ».
C’est ce que nous entendons lorsque nous parlons d’éviter une boîte noire. Non pas que l’IA ne devrait pas intervenir — l’IA est extrêmement utile, et s’en passer en 2026 constitue, à grande échelle, une forme de négligence professionnelle à part entière. Nous voulons dire que le rôle de l’IA devrait être de documenter son raisonnement pour chaque document, et non de décider silencieusement quels documents recevront d’abord un raisonnement.
À quoi cela ressemble en pratique
Dans un flux de travail Claira, le processus est simple.
L’équipe du dossier exécute le tri dans Nuix Discover à l’aide des outils standards — filtres de date, filtres par dépositaire, familles de termes de recherche, déduplication, suppression des quasi-doublons, exclusions de domaines. Tout ce qu’un praticien raisonnable de l’eDiscovery ferait pour réduire un ensemble collecté à une population de revue défendable. Les décisions prises pendant le tri sont elles-mêmes documentées et défendables, parce qu’il s’agit de décisions de masse fondées sur des critères objectifs, et non de jugements document par document.
Une fois l’ensemble de revue défini, l’équipe rédige un plan de revue — une formulation écrite de ce qu’elle recherche, de la manière dont elle le reconnaîtra, de ce qui est considéré comme privilégié et des formats que les décisions doivent prendre. Cela devient l’invite qui pilote la revue par l’IA. Nous avons déjà expliqué ailleurs comment aborder cela — consultez notre aperçu du prompting pour les principes, ainsi que notre documentation sur le contexte de l’affaire pour savoir comment fournir à Claira le contexte propre au dossier qui rend son analyse plus précise.
Claira passe ensuite en revue chaque document de l’ensemble au moyen d’une analyse en lot. Pas le sous-ensemble le mieux classé. Pas les grappes les plus semblables à un document source. Chaque document. Pour chacun, Claira produit une analyse écrite : la décision de pertinence, une brève justification, les passages ou métadonnées sur lesquels elle s’est appuyée, ainsi que toute alerte qu’elle estime qu’un humain devrait examiner.
Ces résultats sont ensuite intégrés directement dans les champs Nuix. Ils sont triables, filtrables et consultables. Les réviseurs peuvent les parcourir efficacement — en concentrant leur attention humaine sur les cas limites, les décisions borderline et la revue du privilège — plutôt que de lire chaque document à froid. Mais la piste d’audit de chaque document existe dès que Claira a terminé son passage. Notre guide sur la compréhension des résultats explique comment les réviseurs exploitent concrètement ces sorties.
Si le dossier est contesté un jour — si le conseil adverse veut savoir pourquoi un document particulier n’a pas été produit, ou si vous devez démontrer le caractère raisonnable de votre processus au regard du principe de proportionnalité — la réponse n’est pas « l’IA ne l’a pas fait remonter ». La réponse est la justification écrite produite pour ce document précis, au moment de la revue, et conservée dans le dossier.
Des outils pour accélérer, pas pour décider
Rien de tout cela ne signifie que le processus doit être lent. Des outils existent pour fluidifier chaque étape de ce flux de travail. Les résumés générés par l’IA accélèrent le tri initial. Le regroupement thématique aide les réviseurs à repérer des motifs dans l’ensemble. Le regroupement des quasi-doublons réduit le travail redondant. Les scores de confiance aident les réviseurs à hiérarchiser les décisions de l’IA à vérifier en premier. Ce sont tous des accélérateurs légitimes, et nous les utilisons tous.
Ce que nous ne faisons pas, c’est laisser l’un de ces accélérateurs décider si un document sera évalué ou non. Une fois qu’il est dans l’ensemble de revue, il est évalué. Les outils changent la vitesse de l’évaluation, pas le fait qu’elle ait lieu.
C’est une distinction subtile, mais importante. Les Principes Sedona Canada — en particulier le principe 7 — approuvent explicitement l’utilisation de la technologie pour respecter les obligations de production de manière proportionnée. Les tribunaux canadiens ont confirmé à plusieurs reprises que l’utilisation d’outils d’IA est compatible avec le devoir de diligence raisonnable d’un avocat. Ce que la jurisprudence n’a pas approuvé, c’est l’utilisation de l’IA pour exclure silencieusement des documents de l’examen sans justification document par document. Le principe de proportionnalité concerne l’effort, pas les raccourcis qui nuisent au caractère défendable.
Vous pouvez respecter la proportionnalité tout en examinant chaque document de votre ensemble de revue. En fait, avec l’aide de l’IA, cela n’a jamais été aussi réalisable. C’est précisément le but.
La philosophie, énoncée simplement
Si nous devions résumer notre philosophie en une seule page, elle ressemblerait à ceci.
La collecte est le filtre le plus large. Le tri est l’étape où s’effectuent les exclusions de masse défendables. Tout ce qui survit au tri est, par hypothèse, potentiellement pertinent. Chaque document potentiellement pertinent est examiné. Chaque décision de revue est justifiée par écrit. Les outils peuvent rendre cela plus rapide, mais ils ne peuvent pas en faire une option facultative.
Le résultat est un processus qui est :
Simple à expliquer à un juge, à un client ou au conseil adverse
Constant d’une affaire à l’autre, d’un réviseur à l’autre et d’une juridiction à l’autre
Défendable au niveau du document, et pas seulement au niveau du système
Compatible avec l’IA comme accélérateur plutôt que comme substitut au jugement
Nous pensons que c’est la bonne façon de faire de la revue eDiscovery à l’ère de l’IA. Nous avons écrit sur la philosophie plus large de la revue assistée par l’IA dans notre article de philosophie pratique, qui retrace l’évolution depuis l’estampillage Bates jusqu’à la TAR, puis à l’IA moderne, et explique où nous pensons que le domaine se dirige.
Les outils continueront de s’améliorer. Les volumes de données continueront de croître. La tentation de laisser l’IA décider de ce qui compte continuera d’augmenter. Notre point de vue est que les fondements ne changent pas : si vous l’avez collecté et que vous ne l’avez pas trié, vous l’examinez. C’est ainsi que vous restez défendable, et le caractère défendable est le produit que nous vendons tous réellement.