Comptoir IA Podcast

Episode 147

Stephane Bereux | Comptoir IA #147

1:05:3466 min
SB

Stephane Bereux

CTO et cofondateur de Jiminy AI, plateforme IA pour le droit

Resume

Stephane Bereux, CTO et cofondateur de Jiminy AI, presente sur Comptoir IA la plateforme qui economise 20 a 22 heures par dossier juridique. Lance en janvier 2023, Jiminy utilise le RAG (Retrieval Augmented Generation) pour ancrer chaque reponse dans des documents sources avec liens cliquables. Un audit RSE complet est realise en 5 minutes au lieu de semaines. L'outil est heberge chez Scaleway pour garantir la souverainete des donnees, un point crucial pour les cabinets d'avocats. Jiminy se differencie de Thomson Reuters et Doctrine en ciblant la productivite plutot que la recherche documentaire pure. Stephane predit des avancees majeures de l'IA en biologie et medecine, citant Gemini pour de nouvelles pistes therapeutiques contre le cancer. Nicolas Guyon et Stephane debattent de l'acces au droit pour les particuliers et du role de l'IA comme 'avocat dans la poche'.

Points cles de l'episode

  • 1Jiminy economise 20 a 22 heures par dossier juridique avec 20-30% de productivite supplementaire
  • 2Un audit RSE complet realise en 5 minutes au lieu de semaines
  • 3RAG (Retrieval Augmented Generation) ancre chaque reponse avec un lien cliquable vers le document source
  • 4Heberge chez Scaleway pour la souverainete des donnees - crucial pour les cabinets d'avocats
  • 5Les LLM ont toujours des problemes d'hallucination - la revision humaine reste indispensable
  • 6L'IA cree un 'avocat dans la poche' gratuit qui pourrait reduire le non-recours au droit
  • 7Gemini de Google a aide a identifier de nouvelles pistes therapeutiques contre le cancer
  • 8Les modeles open source restent inferieurs en performance et cout aux APIs comme OpenAI

Transcription complete

00:00

Presentation de Stephane Bereux et Jiminy AI

Nicolas GuyonBonjour Stéphane.

Stephane BereuxBonjour Nicolas.

Nicolas GuyonBonjour à tous. Nous sommes donc le 17 octobre 2025 et j'ai le plaisir aujourd'hui de recevoir Stéphane Béreux qui est le CTO cofondateur de Jiminy AI, l'IA des avocats, des professions juridiques. Et donc ça fait très longtemps qu'on voulait faire un épisode avec Jiminy. peut-être le Harvey à la française, alors Stéphane nous expliquera si c'est le cas ou pas, ou si c'est mieux, donc voilà. Donc on sait dans tous les cas que les professions du droit sont des professions qui sont complètement transformées par l'IA, évidemment il y a beaucoup d'informations, beaucoup de textes, les LLM sont redoutables par rapport à ça. Stéphane va nous expliquer aujourd'hui, nous dire quelle est la réalité de ce marché, qu'est-ce qui se passe, est-ce que les avocats peuvent se passer de l'IA générative aujourd'hui, comment ils l'utilisent, comment ils l'utilisent surtout avec leur plateforme Jimini. Il y a plusieurs solutions dans Jimini donc ça va être passionnant, je suis trop content de pouvoir faire cet épisode. Merci beaucoup Stéphane.

Stephane BereuxAvec plaisir Nicolas, et moi je suis ravi de pouvoir vous partager mes humbles lumières. Ce n'est jamais que mon avis, mais avec grand plaisir pour vous en dire un peu plus sur l'IA Générative.

Nicolas GuyonMerci Stéphane. Alors notre question, encore une fois, merci à tous nos auditeurs, à nos spectateurs aussi, parce que maintenant on se déporte sur YouTube de plus en plus. Donc abonnez-vous à la chaîne sur YouTube, ça nous aide énormément. On passe des podcasts audio aux podcasts vidéo. C'est la tendance. Donc, retrouvez-nous en vidéo sur YouTube avec Stéphane. Mais Stéphane, avant tout, comment est-ce que toi, tu es arrivé dans l'IA générative ? Donc, tu es CTO, donc tu as un profil un petit peu tech. Est-ce que tu peux nous expliquer un petit peu ton parcours là-dessus ?

Stephane BereuxEh bien, avec grand plaisir. Alors en fait, moi, j'ai commencé dans un monde totalement différent parce qu'à la base, j'ai commencé par étudier la biologie en vue d'être paléontologue. Et durant mes études, j'ai… Ça mène à tout. Et en fait, durant mes études, j'ai découvert l'intelligence artificielle, c'était en prépa, on avait un projet informatique où j'ai codé mon premier réseau de neurones. Et ensuite, j'ai intégré l'école polytechnique où, du coup, je me suis vraiment ouvert à l'intelligence artificielle. J'ai eu la chance d'avoir un parcours avec des cours passionnants sur le domaine. Et j'ai avancé sur la croisée entre la biologie et l'intelligence artificielle. Et en fait, après l'école, j'ai commencé une thèse sur l'intelligence artificielle appliquée aux micro-vertes intestinales. Donc, sujet passionnant, mais malheureusement, il me manquait les données pour réaliser ma thèse. Et du coup, je l'ai interrompu et j'ai rejoint Entrepreneur First, qui est un incubateur de startups. L'idée, c'est de se faire rencontrer des profils techniques et des profils business et de combiner nos avantages respectifs, nos spécialités. et d'avancer là-dessus. C'est dans le cadre de ce programme que j'ai rencontré Raphaël Haroche, qui est devenu ensuite mon cofondateur. On a itéré sur un certain nombre d'idées, et Raphaël avait monté par le passé une legal tech qui s'appelle monpostulant.fr, qui a 67% des avocats de France, donc il connaissait pas mal les problématiques liées à ce domaine-là. l'intelligence artificielle, moi j'en avais fait du coup pour le coup pas mal, et notamment des modèles textuels. Et en fait, ça se passait, c'était en janvier 2023, et ça a correspondu avec l'avènement de ChatGPT et globalement l'essor qu'on connaît actuel des LLM. Et en fait, ça nous a apparu un peu comme une évidence, ils connaissaient bien les problèmes des avocats et des juristes, et ça nous a apparu, voilà. À ce moment-là, on s'est lancé.

Nicolas GuyonSuper, merci beaucoup Stéphane. On salue Raphaël. D'accord, je comprends très bien la rencontre. C'est super intéressant. Il y a une question de timing aussi dans Jiminy, évidemment, parce que c'est sûr que sans l'IA démocratique, sans le LGPT, ce n'était pas la même histoire. Et même ensuite, c'est ce qu'on a dit aussi beaucoup sur Harvey, dont on parlera pendant l'épisode, H-A-R-V-E-Y, donc un peu une solution leader aux Etats-Unis, en tout cas sur le légal et l'IA, on disait qu'avec Harvey, Harvey en fait, ça ne fonctionnait pas très bien avec GPT 3.5 ou les modèles précédents, mais qu'à partir de GPT 4, donc ce qui veut dire février, mars 2023, là c'est devenu quelque chose d'extraordinaire.

Stephane BereuxAlors extraordinaire, je ne sais pas si...

Nicolas GuyonEt je n'ai jamais essayé le produit, c'est vrai.

Stephane BereuxNon mais effectivement, en fait, la capacité de ce genre de solution est relativement indexée sur la capacité du modèle sous-jacent, et donc les gains de performance des modèles permettent de résoudre des cas d'usage de manière de plus en plus efficace, de plus en plus fiable, et des cas d'usage de plus en plus complexes. Il y a plusieurs axes de progrès. Il y a la quantité de texte que le modèle peut ingérer, donc la complexité du problème qu'on peut lui soumettre, et ses capacités de raisonnement qui s'améliorent, et donc il est capable de faire des tâches de plus en plus complexes. Ces modèles, c'est une des briques, c'est un des éléments constitutifs de la solution. Ce n'est pas le seul, mais dès qu'il y a des nouvelles générations de modèles qui arrivent, c'est une brique qu'on remplace, qu'on met à jour et qui permet de rester toujours à la pointe de ce qui se fait, tout en améliorant le reste du véhicule pour avoir la solution la plus efficace possible.

05:40

Le parcours de Stephane vers l'IA generative

Nicolas GuyonBien sûr. Stéphane, donc toi, tu étais dans la biologie, tu nous disais précédemment, sur l'IA. Donc toi, tu es dans l'IA depuis un moment, tu es un passionné de l'IA. Comment est-ce que tu as vécu les deux années qui viennent de se passer ? Excuse-moi, je reviens juste en arrière sur ma question. peut dire quasiment maintenant les trois années parce qu'on arrive à quasiment à l'anniversaire de chaque GPT 30 novembre 2022.

Stephane BereuxEt on lui souhaite un très joli anniversaire. Non mais je trouve qu'il y a eu un énorme shift dans ce qui se faisait avant et ce qui se faisait après au sens où avant en tout cas de mon histoire personnelle, je bidouillais beaucoup les modèles. Donc je jouais sur l'architecture du modèle, sur la manière dont il s'est constitué, sur la taille des poids, sur la taille des couches, etc. Sur tout un tas de paramètres, je bidouais le modèle. Et à partir de ces LLM, qui sont des modèles beaucoup trop gros pour être entraînés par un particulier, on a changé d'échelle. Le modèle s'est devenu une brique unitaire à laquelle on touche finalement que très peu. Et en revanche, on va construire tout ce qu'il y a autour, et ce qu'on va travailler, c'est non plus le modèle en lui-même, mais c'est la manière dont on fournit des données au modèle, c'est la manière dont on demande au modèle de répondre, et on contraint la sortie du modèle. On veut qu'il réponde, par exemple, suivant un formalisme très précis, ce qui fait que ce qu'il nous renvoie en sortie, on peut le réutiliser. Par exemple, si on lui demande, je ne sais pas, l'âge d'une personne, on peut le forcer, ou le salaire d'une personne, on peut le forcer à répondre un chiffre, et comme ça, ce chiffre, on peut directement s'en servir pour faire des calculs dessus, parce qu'on a la garantie que c'est bien un chiffre et que ce n'est pas du texte. Donc c'est un petit peu le modèle d'une brique de base, en fait ça s'est solidifié, ça s'est figé et on a arrêté pour l'immense valorisation des gens de modifier l'intérieur du modèle et plus pour le prendre comme un acquis et travailler sur le reste.

Nicolas GuyonOui, d'accord. Et ce modèle, ces tokens, en fait, c'est notre intelligence un petit peu accessible en flux, de manière abondante, mais avec un coût. Et derrière, ce que tu nous dis, c'est qu'en effet, on va rajouter, on va fine-tuner le modèle, on va faire du contexte engineering. Alors là, on va au point un peu plus technique sur lequel on ira sur le podcast, je t'ai averti, mais pour avoir les données qu'on veut. Stéphane, petite question traditionnelle et après on arrive direct dans le droit et dans Jimmy. Ton outil d'IA préféré, celui que tu utilises le plus dans ton quotidien et est-ce que tu as un usage secret à nous révéler ?

Stephane BereuxEh bien, je n'ai pas d'usage très exotique. Moi, je me sers beaucoup de Cursor.

Nicolas GuyonCursor, très bien.

Stephane BereuxCursor, c'est un outil de code.

Nicolas GuyonQue j'adore aussi. On en parle ici souvent.

Stephane BereuxC'est un outil de code qui fonctionne très bien. Là, j'expérimente aussi.

Nicolas GuyonUn IDE, donc un environnement de développement intégré, donc sur notre ordinateur, application desktop.

Stephane BereuxExactement. Exactement, et qui permet d'éditer du code large scale, de faire des modifications, de lui donner des consignes. C'est une interface pour interagir avec un modèle qui est relativement bien fait et qui permet de fournir du contexte. aux modèles sur nos règles de code, la manière dont on souhaite que notre code soit organisé, la manière dont on souhaite que les tests soient programmés, puis fournir tout un tas d'instructions et interagir directement avec notre codebase de manière relativement efficace. et d'autre part ils ont un modèle de tab completion et ça permet en utilisant la touche et la tabulation, le modèle nous suggère des modifications de code, par exemple quand on va changer le nom d'une variable, il va nous proposer tous les endroits où cette variable est appelée et d'aller le corriger. C'est un petit détail mais c'est particulièrement Une UX particulièrement bien pensée, c'est extrêmement fluide, et ça fait gagner beaucoup beaucoup de temps. Et il y a un côté en plus très satisfaisant de son serveur. Donc maintenant ça s'est pas mal démocratisé, et je crois que GitHub Copilot le propose également, mais c'était un petit peu novateur au moment où ils l'ont sorti, et c'était un vrai grand temps.

Nicolas GuyonQuelle fonctionnalité est innovatrice ?

Stephane BereuxLa modification par tabulation à travers les fichiers, au lieu que ce soit juste local sur l'ensemble de la code base.

Nicolas GuyonJe te confirme, et même moi sans être développeur, sans coder, je me sers de curseur avec l'interface chat. Je fais un petit raccourci, commande L sur mon clavier, ça m'ouvre le chat et à partir de là j'arrive à lui parler en langage naturel et à lui faire faire à peu près ce que je veux. Ça peut faire peur aux non-initiés, aux non-codeurs, mais il ne faut pas hésiter parce qu'au final c'est quand même remarquable. Tu utilises quel modèle via Cursor ?

Stephane BereuxAlors là j'utilise, j'ai Claude Sonnet et les modèles d'OpenAL.

Nicolas GuyonD'accord.

Stephane BereuxOuais, en fonction des critiques que j'ai.

10:54

Jiminy AI : 20-22 heures economisees par dossier

Nicolas GuyonEt excuse-moi, dernière question parce que c'est l'abonnement de Cursor, t'as une idée ou pas ? Ça se passe comment la tarification ? Parce que tu peux payer les tokens des modèles que tu utilises et Cursor ou… Je ne suis pas au clair là-dessus en fait.

Stephane BereuxJ'Utilise l'abonnement pro qui coûte 18$ par mois.

Nicolas GuyonEt derrière tu branches dessus tes modèles.

Stephane BereuxAvec l'abonnement pro tu as déjà accès à des modèles.

Nicolas GuyonC'est ça, je me disais ça fonctionne sans même que tu aies besoin de mettre ton personnel. Donc oui, oui, d'accord. Donc il y a des tokens, des modèles qui sont compris dans l'abonnement ProCursor.

Stephane BereuxOui.

Nicolas GuyonMagnifique.

Stephane BereuxEt tu as, je ne sais plus, une certaine quantité de... Tu as différents modes en fait. Tu as le mode Reasoning. Enfin, tu as des modes plus ou moins coûteux en token. Et donc, tu as des quotas qui sont plus ou moins élevés en fonction de ton niveau d'abonnement.

Nicolas GuyonSuper. Bon bah écoute, merci beaucoup. Merci beaucoup Stéphane. Donc Cursor, à essayer les amis. Mais vous verrez que ça peut vous amener très, très, très, très loin. Bon maintenant j'aimerais Stéphane, est-ce que tu peux nous présenter un petit peu Jiminy et je crois que vous avez plus une philosophie un petit peu sur ce projet. Est-ce que tu peux nous en dire un peu plus ?

Stephane BereuxAvec plaisir. Donc Jiminy on s'est lancé du coup en janvier 2023 et l'idée c'est qu'on développe un copilote de productivité pour les professionnels du droit. C'est-à-dire qu'on automatise les tâches à faible valeur ajoutée. Il y a trois types de tâches. Il y a la recherche juridique, l'analyse documentaire, les tâches d'extraction d'informations dans des bases documentaires, et la rédaction en se basant sur des précédents, par exemple drafter des contrats en se basant sur un précédent.

Nicolas GuyonAttends, redis-moi Stéphane. Recherche juridique, excuse-moi, oui d'accord.

Stephane BereuxRecherche juridique, analyse de documents, donc ça va être par exemple l'extraction d'informations dans des bases documentaires. Et la rédaction, l'aide à la rédaction, et en se basant sur les précédents, un petit peu comme un contrat de droit.

Nicolas GuyonC'est très bien, c'est très bien. Donc merci beaucoup. Tu sais donc moi je fais des formations sur l'IA et en tout cas j'ai un prisme que j'utilise, que je rappelle à nos auditeurs et je suis très content parce que je le retrouve un petit peu dans ce que tu m'as décrit. Moi je dis qu'avec l'IA générative, on fait toujours trois choses grosso modo. On génère des contenus, on recherche des informations et on analyse des informations. Alors, je ne suis pas dans le bon ordre par rapport à ce que tu viens de me dire, mais en vrai, ça coïncide.

Stephane BereuxC'est exactement ça. Non, complètement. Du coup, l'idée, c'est vraiment de se positionner sur les tâches à faible valeur ajoutée, donc pas de venir remplacer l'utilisateur, mais de le soulager de la partie pénible et mieux automatisable de son travail. Et quelques exemples, ça va être par exemple les rapports d'audit. Quand on doit analyser, par exemple quand on fait un audit RSE, on doit analyser des milliers de contrats de travail quand c'est pour une grosse entreprise, des milliers de contrats de travail pour regarder par exemple les différences salariales entre les hommes et les femmes. Du coup, il faut aller dans tous les contrats, chercher le salaire de chacun, et ensuite pouvoir les analyser. Ça, on peut l'automatiser et le faire en 5 minutes beaucoup mieux, beaucoup plus rapidement que ce qu'on aurait pu faire des utilisateurs humains qui, sinon, ils passent des semaines à ne pas dormir et à travailler jour et nuit là-dessus.

Nicolas GuyonAlors, très clair. Pour bien comprendre, Jiminy, il y a des professions du droit, donc ce n'est pas que pour les avocats, c'est aussi pour les juristes dans les entreprises.

Stephane BereuxExactement.

Nicolas GuyonDonc pour tous ceux qui travaillent sur du droit et des contrats.

Stephane BereuxAlors pas que des contrats mais sur du droit. Il y a les contrats mais il y a aussi tout ce qui va être le contentieux, tout ce qui va être expert.

16:28

Le RAG et l'ancrage dans les documents sources

Nicolas GuyonD'accord, très bien. Donc j'ai entendu ce que tu disais aussi, c'est tu ne veux pas remplacer en tout cas ces métiers, les personnes qui les occupent, les avocats ou les juristes, mais tu veux t'occuper des tâches pénibles. Et ton exemple était très bon sur des milliers de contrats. On sait que l'IA là-dessus, En fait, on se rend compte que de temps en temps, on faisait depuis des années des trucs qui étaient quasiment inhumains. Et c'est beaucoup plus efficace avec l'IA, comme tu viens de le dire, en cinq minutes de traiter tout ça.

Stephane BereuxOui, en fait, c'est plus efficace et c'est même mieux parce que, par exemple, quand c'est juste impossible, infaisable humainement, on échantillonnait. En fait, on prenait, je ne sais pas, 60 contrats au hasard et on faisait l'étude sur ce sous-ensemble de 100 contrats en se disant que c'est représentatif de l'ensemble. Là, rien n'est passé.

Nicolas GuyonBien sûr, bien sûr. Sur un cabinet d'avocats, vous avez des cabinets d'avocats avec lesquels vous travaillez, donc j'ai vu des cabinets très prestigieux, même JIT je crois, c'est ça ?

Stephane BereuxExactement, là on vient de déployer sur l'intégralité du cabinet JIT.

Nicolas GuyonFélicitations, c'est un cabinet quand même très connu, qui a une sacrée notoriété. Aussi des cabinets peut-être un peu plus.

Stephane BereuxPetits, En fait, ça a été notre philosophie de construction d'outils. Comme vous l'avez peut-être remarqué, ni Raphaël ni moi ne sommes ni avocats ni juristes, même si Raphaël connaît bien les problématiques liées au domaine. Et donc, en fait, on s'est entouré de partenaires pour co-construire ce produit, avec des partenaires dont le cabinet Gide qui nous a accompagnés. Et en fait, on a choisi des cabinets de tailles très différentes, entre des très grands cabinets ou des tout petits cabinets, et sur des verticales différentes, sur des spécialités différentes, et pareil pour les directions juridiques, également plusieurs directions juridiques. L'idée était en fait d'avoir une espèce de... Alors en machine learning, on appellerait ça du research, en fait de voir un petit peu un panorama des différents besoins que peuvent rencontrer ces utilisateurs-là, de trouver les dénominateurs communs, de comprendre les différentes problématiques auxquelles on pourrait être exposé, et de développer un outil qui s'adresse à la fois à des avocats de très grands cabinets comme JIT, comme à des avocats de cabinets unipersonnels, et à des juristes d'entreprise de direction juridique de tailles et de spécialités variées. Et donc c'est grâce à cette co-construction qu'on est parvenu à Jiminy.

Nicolas GuyonDonc des métiers, des cabinets de tailles différentes, des métiers différents dans le droit, mais tu as une idée aujourd'hui de combien de temps on peut gagner, un avocat ou une profession du droit peut gagner grâce à votre outil ?

Stephane BereuxDans les études qu'on a faites avec des cabinets partenaires, on mesure des gains qui vont de l'ordre de 20 à 22 heures par dossier, et une accélération de la rédaction qui est plus que doublée. Des gains d'apisquésité qui sont extrêmement conséquents.

Nicolas Guyon20 à 22 heures par dossier et un dossier en moyenne, ça prend combien de temps, tu sais ou pas ?

Stephane BereuxÇa dépend des dossiers. Ça peut prendre plusieurs jours.

Nicolas GuyonD'accord. Mais donc, oui, c'est peut-être de l'ordre de 20 ou 30 % de productivité.

Stephane BereuxOui.

Nicolas GuyonImaginez ça. D'accord.

Stephane BereuxLes avocats sont facturés à l'heure et les juristes ne sont pas payés à l'heure mais ont des contraintes horaires très strictes. la problématique principale à laquelle on répond, c'est ce manque de temps. Et parce que du coup, en fait, ça se transforme ensuite en travail la nuit, en heures non facturables, en beaucoup de choses pour éliminer cette charge de travail qui, en plus, n'est pas la partie sur laquelle ces personnes-là ont la vraie valeur ajoutée, parce que c'est sur le conseil client, sur la relation client, sur la stratégie, sur beaucoup de tâches, pour le coup, à haute valeur ajoutée sur lesquelles ils peuvent se concentrer mieux et allouer plus de temps.

Nicolas GuyonJe mets les pieds dans le plat volontairement, mais est-ce que les clients derrière ne vont pas dire aux avocats, vous servez de l'IA, ça vous prend moins de temps, je veux payer moins cher. On ne va pas voir ça arriver.

Stephane BereuxC'est probablement quelque chose, c'est les questions de toute manière qui vont être amenées sur la table. En fait, la réalité, c'est qu'actuellement, beaucoup d'heures n'étaient pas facturées parce que ça ne rentrait pas dans les plannings. Donc en fait, c'est énormément d'heures non facturables. C'est ce qu'on appelle les non-billable hours. Et en fait, le travail typiquement d'analyser, de relire ces milliers de contrats quand on fait un rapport d'audit ou des choses comme ça, en fait, ça ne rentrait pas du tout dans les heures de travail. Donc il y a une grande partie de ce temps-là qui, de facto, n'était pas facturé et simplement va être fait dans les trois mois.

Nicolas GuyonOui, oui, je comprends. Parce qu'en fait, je pense qu'on est en train de se poser la question, on commence à en entendre parler de plus en plus. J'en parlais juste avant, mais donc s'il y a deux lois, donc cabinet d'audit et aussi le cabinet de conseil dans la tech, qui s'est fait épingler par le gouvernement australien. dans lequel il y avait en tout cas une grosse partie qui était générée avec l'IA et qui d'ailleurs n'avait pas été vérifiée et avec plein d'erreurs. Et derrière, ils ont dû rembourser 440 000 dollars donc au client. On imagine que c'était quand même une belle mission, mais derrière, ça a fait poser, ça pose beaucoup de questions. L'utilisation d'une IA comme ça pour produire en masse quelque chose qui rapidement quelque chose qui n'est pas de qualité et le client en face, là en l'occurrence, il n'est pas satisfait.

21:49

L'audit RSE complet en 5 minutes

Stephane BereuxOui. Alors nous, ce qu'il faut bien comprendre, c'est que c'est l'avocat qui est responsable du rendu qu'il va faire au client. Nous, on assiste l'avocat, mais on n'a aucunement vocation à le remplacer ni à être utilisé pour rendre directement un travail au client. D'autre part, il y a quand même une grosse différence entre ce rapport de Deloitte et le jour de tâche sur lequel l'avocat va utiliser Jiminy, par exemple pour ce qui est de l'aide à la rédaction. En fait, actuellement, la manière dont un avocat va travailler, c'est que quand il rédige un contrat, il va repartir d'un contrat précédent qu'il avait rédigé, d'un draft, et qu'ensuite, il va venir adapter. Et en fait, ce travail d'adaptation, là, ce n'est pas l'IA qui produit vraiment la valeur. L'IA utilise du temps, mais elle utilise le travail qu'avait fait l'avocat précédemment pour l'adapter au nouveau cas. Et donc, en fait, la valeur ajoutée de l'avocat reste la même, d'une part, Et d'autre part, je pense que tu mets le doigt sur un point qui est très important, qui est la vérification. Nous, chez GQ, on a un petit peu un motto qui est, à défaut d'avoir une IA fiable, on veut avoir une IA vérifiable. Et on le sait, les LLM ont des problèmes d'hallucination. La manière dont répondent les LLM ont tendance à être très assertives, même quand la réponse peut être erronée. Nous avons une responsabilité, mais surtout l'avocat, d'être correct vis-à-vis de ses clients et nous de faciliter autant que possible la vérification des informations par le client. un vrai effort de R&D sur la fiabilité et la vérifiabilité des sources. Et alors maintenant, c'est quelque chose qui s'est pas mal répandu, mais on était pour le coup assez pionniers là-dessus, sur le fait que quand le modèle renvoie un résultat, chaque point de sa réponse est vérifiable, donc il y a une source cliquable sur laquelle on peut cliquer, ça va ouvrir le document, aller à la bonne page et surligner le paragraphe en question d'où vient l'information. Ce qui fait qu'en quelques clics, l'avocat est d'une part encouragé et peut le faire facilement et sans friction à vérifier la factualité de la réponse renvoyée. Donc c'est un jeu hyper important.

Nicolas GuyonAlors ça c'est hyper important, pour faire ça vous passez par du, c'est du RAG en fait qui vous permet de retrouver l'information comme ça ?

Stephane BereuxExactement, exactement. D'accord. L'idée de Jimny c'est que, en tout cas sur une partie des tâches d'analyse, ça va être du RAG, donc RAG c'est un terme assez générique pour, je sais pas si il faut le rappeler mais c'est... Explique-nous si tu peux le.

Nicolas GuyonRéexpliquer ou le présenter rapidement, c'est super pour nos auditeurs bien sûr.

Stephane BereuxC'est l'acronyme de Retrieval Augmented Generation, L'idée, c'est qu'on a un modèle, le modèle, on lui pose une question et il renvoie une réponse. Et là, l'utilisateur va poser sa question, il va y avoir une étape intermédiaire, on va les récupérer dans la base de données du client, les extraits pertinents qui permettent de répondre à cette question-là. C'est-à-dire qui permettent de faire de l'injection de connaissances. Et le modèle, ensuite, on va lui fournir la question de l'utilisateur et lui dire voilà les éléments qui permettent de répondre à la question. Répondre basant sur ces éléments-là. et ça a plusieurs avantages. Le premier, c'est que ça permet d'ancrer la réponse du modèle dans une donnée qui est vérifiable, parce qu'ensuite, c'est ça qui permet de sourcer la réponse du modèle, de dire voilà tel élément de tel paragraphe, tel élément de tel paragraphe. Ça permet d'injecter de la connaissance au moment de l'inférence, donc au moment de l'utilisation du modèle, parce que les modèles, en fait, ils sont entraînés, puis ensuite, ils sont figés. Par exemple, là, je ne sais pas, juin 2024, pour certains modèles de GPT, Et donc ça, ça permet d'ajouter de l'information qui est à jour, à coup zéro, et de l'information qui est fiable, parce que c'est de l'information qui est sourcée, c'est pas sur tout et n'importe quoi, c'est la donnée du client. Et alors, quand je dis que c'est un petit peu générique, c'est que là, ce que je mets sous le tapis, c'est la récupération des essais extra-pertinents. Comment on fait ? Et c'est là qu'en fait, il y a un gros travail d'ingénierie et de recherche, parce que c'est un problème qui est encore ouvert, on n'a pas de solution, personne n'a de solution magique. Et donc là, l'idée, c'est qu'il y a beaucoup de travail dessus, il y a plein de stratégies possibles pour récupérer les informations pertinentes. Par exemple, on peut utiliser ce qu'on appelle des ombuddings, donc c'est une représentation vectorielle du sens de chaque paragraphe. On va comparer le vecteur correspondant à la question au vecteur de chacun des paragraphes. Pour prendre les plus proches, il y a des approches qui sont sémantiques, des approches qui vont être plus lexicales, comme on peut avoir à l'habitude des modèles comme Google, plus anciens et anciens, avec des mots-clés. On va comparer les mots-clés de la réponse à différents paragraphes, faire plusieurs étapes de récupération, utiliser des graphes. Par exemple, si un article de loi est cité par une jurisprudence, on va exploiter ces graphes de citation.

Nicolas GuyonMerci beaucoup Stéphane. Mais donc tu réponds un petit peu à la question que j'allais te poser après en fait, mais parce qu'il y a d'autres réponses, c'est en fait on sait que, et tu le sais très bien, que ChatGPT, Cloud, progresse énormément en performance, ils ont des moyens qui sont colossaux, on parle de dizaines de milliards de dollars et en fait ma question c'était en quoi Jiminy est meilleur que ChatGPT, en quoi il est meilleur que Claude, est-ce que Claude a si je l'utilise bien, Claude 4.5 sonné, tu vois, est-ce qu'il ne peut pas se comporter aussi bien, enfin m'apporter autant de valeur que ce que va m'apporter Jiminy ? Ça peut déjà être un assistant pour un particulier ou même pour un avocat, un modèle comme ChatGPT ou comme Claude.

Stephane BereuxAlors oui et non. Le non étant, il y a une question de souveraineté. C'est des modèles qui ne sont pas souverains et les locales et les jurys sont prêts à la donnée qui est à extrêmement haute valeur ajoutée à plusieurs égards. une première barrière qui est le fait que c'est la donnée de leurs clients et donc ils ne sont pas libres de faire ce qu'ils veulent et de le mettre sur des serveurs américains. Là où nous, par exemple, c'est une solution qui est souveraine, qui est hébergée chez Scaleway, un co-producteur français.

Nicolas GuyonTout à fait d'accord avec ton argument souveraineté. C'est certain, souveraineté, confidentialité des données, ça je l'entends très très bien. Ok, d'accord.

27:22

L'hebergement Scaleway et la souverainete des donnees

Stephane BereuxOk.

Nicolas GuyonTrès bon point. Et je sais qu'il y a plein de choses que ça arrêterait. Mais je ne te parle plus sur la compétence, on va dire, dans la réponse.

Stephane BereuxOui, complètement. Non, mais voilà. Sur la compétence, en fait, Cloud, OpenAI, tout ça, c'est juste, je mets des guillemets, juste la brique modèle. Donc en fait, c'est la brique où on lui fournit une entrée et il nous renvoie une réponse. Potentiellement, on peut ajouter des documents en contexte, mais ça s'arrête là. C'est là la limite de ces modèles-là. Et là où nous, il y a deux choses qu'on va faire, c'est qu'on va proposer... En fait, on ne va pas proposer juste un modèle, on propose des outils. Ces outils sont pensés pour simplifier l'usage du client. La réponse en une phrase, c'est une réponse produit. Cette réponse produit va être sur la simplicité de ce qu'on propose. On va avoir un outil qui fait une chronologie des faits. on va avoir un outil qui fait l'auditoire SEO, donc il y a une différence produit de ce point de vue là. Dans l'intégration dans le workflow de travail des avocats, donc par exemple... D'accord, donc.

Nicolas GuyonVous préparez, vous travaillez un petit peu sur le besoin, les cas d'usage qui peuvent revenir pour un peu les préparer pour les clients.

Stephane BereuxExactement, et en fait ces cas d'usage là, c'est pas juste un appel à un modèle, c'est plusieurs appels au modèle, en fait c'est ce qu'on appelle des workflows agentiques, enfin communément maintenant, avec plusieurs appels, des itérations, etc. et une intégration produit qui va être poussée, donc il y a à la fois sur un côté purement capacité de l'outil, Donc on a par exemple un méta-outil qui s'appelle la grille d'analyse. La grille d'analyse, ça permet de poser X questions sur Y documents. Et en fait, on parallélise cette technologie de réponse sourcée fiable à plein de questions sur plein de documents. Et en fait, ce méta-outil, il y a plein de cas d'application derrière. Faire une fiche société, en fait on peut faire des sets de questions préenregistrés. et ces 7 de questions vont permettre de répondre à des cas d'usage, par exemple, je ne sais pas, faire une fiche de société, faire un audit, plein de types d'audits, un audit de taux d'accord pour faire un audit de bail, faire une chronologie des faits. En fait, tout ça, ça peut se formaliser comme une liste de questions sur une liste de documents. Avec ce genre de méta-outils, on peut le transformer et passer du comment au pourquoi. On va avoir des outils qui vont être du clic bouton très simple pour l'utilisateur, où il arrive, il est en droit des sociétés, il a un outil d'analyse de bail de CoPro, etc.

Nicolas GuyonIl peut juste cliquer dessus. Je comprends bien Stéphane. fondamentale et je pense que ça a un rôle hyper important pour aider vos clients. J'imagine que, et je crois avoir vu sur votre site, sur la solution, que aussi c'est une possibilité de se plugger à la donnée client aussi, peut-être plus facilement.

Stephane BereuxOui. Alors ça il y a un vrai enjeu d'être directement donc de réduire en fait de réduire toutes les frictions possibles et donc du coup de réduire la friction d'upload de la donnée de la part du client pour se connecter à sa base de données.

Nicolas GuyonParce que quelqu'un qui aurait cloud ou chat gpt comme ça enfin en effet à la base il n'est pas sur sa donnée on va dire.

Stephane BereuxExactement. Et donc ça, c'est un vrai enjeu.

Nicolas GuyonÇa veut dire se connecter, par exemple, à un SharePoint, un Drive ? Ils ont quoi, vos clients ?

Stephane BereuxIl y a plusieurs typologies, ce qu'on appelle des JED, c'est des outils de gestion d'espace documentaire. Il y a le SharePoint OneDrive, où ensuite il y a pas mal de iManage et SESIB, qui sont des logiciels spécialisés, très utilisés par les camions d'avocats.

Nicolas GuyonC'est des intégrations sur lesquelles on travaille. Et le RAG par rapport à ça, est-ce que c'est lié ou pas ?

Stephane BereuxLe RAG, du coup, il y a cette partie de récupération des extraits pertinents parmi des documents. Et donc la question, c'est cette recherche de documents sur quel corpus de documents elle porte. Et donc c'est particulièrement lié parce qu'une des frictions d'une technologie RAG, c'est le fait de mettre la donnée à disposition de cet outil de recherche. Il y a un travail pour régler cette friction-là.

32:43

Jiminy vs Thomson Reuters et Doctrine

Nicolas GuyonOk, je comprends bien. Donc toi Stéphane, ta question c'est, tu sais on parle très souvent et beaucoup beaucoup dans ce podcast de HDI, d'une IA qui est capable de faire aussi bien que l'être humain n'importe quelle tâche ou je disais dans l'épisode précédent 80% des tâches. Tu te dis qu'un cloud ou un ChatGPT, en fait peu importe à quel point ils sont puissants, intelligents, ils n'arriveront jamais à être aussi utiles qu'une solution comme Jimini par rapport aux forces que tu viens de présenter sur la souveraineté, mais sur ensuite la capacité de se connecter à la donnée et des promptes et des workflows agentiques existants ?

Stephane BereuxCe n'est pas une compétition. Les modèles font partie de notre solution. C'est une course en avant. 1 voire 2 pas en avant, parce qu'on anticipe les développements produits, on anticipe le fait que la capacité du modèle augmente, et donc dans ce petit coup elle augmente, c'est quoi les verrous qu'il faut qu'on débloque pour qu'une fois qu'elle a augmenté, on puisse utiliser son potentiel maximal, on va mettre en place par exemple des collecteurs de données, on va mettre en place la capacité d'éditer un document, des choses comme ça.

Nicolas GuyonVous surfez sur les modèles en fait, vous êtes par-dessus, d'accord.

Stephane BereuxExactement.

Nicolas GuyonEt ça vous met en avance, d'accord, je comprends aussi quoi qu'il arrive par rapport au développement des capacités du modèle.

Stephane BereuxOui, et ça a été un apprentissage qu'on a fait, alors je ne dirais pas dans la douleur, mais au début, il y a des choses qu'on a voulu faire nous-mêmes. Et en fait, on s'est rendu compte qu'il fallait être pragmatique. Il y a un sens de l'histoire avec des modèles qui avancent et à un moment, on travaillait sur le fine tuning de modèles d'embedding pour avoir un modèle d'embedding qui était très spécialisé, meilleur, etc. on y alloue du temps, et on avait effectivement un modèle qui était State of the Art, qui dépassait ce qui se faisait, et deux semaines après, il y a les modèles BGE, donc c'est des modèles d'embedding chinois excellents, qui sortent, et qui battaient à plat de couture tous les autres modèles, le nôtre y compris, en étant généraliste. Et c'était un peu la réalisation de se dire, OK, bon, il y a des choses sur lesquelles on est les meilleurs, il y a d'autres choses sur lesquelles il faut qu'on construise la voile qui permet de prendre le vent. Ça ne sert à rien d'essayer de souffler de neige dans la voile, parce qu'on ne la fera pas avancer plus vite. La métaphore est moyenne. Mais toujours est-il, l'idée était de se dire, OK, dans la priorisation de nos choix produits et de nos choix de recherche, il y a des sujets sur lesquels on pense qu'on a une carte à jouer, d'autres sur lesquels il faut qu'on optimise.

Nicolas GuyonOui, je comprends bien. Il y a un exemple qui était très connu au tout début, qui était celui de Bloomberg GPT. Donc Bloomberg qui avait dépensé 300 millions de dollars pour entraîner son propre modèle et en fait, Quand GPT-4 est sorti, il était meilleur que Bloomberg-GPT sur les questions financières sur lesquelles ils étaient censés avoir un edge ou un gros avantage.

Stephane BereuxC'est exactement ça. C'est exactement ça. Super.

Nicolas GuyonOui, tu m'entends ? Excuse-moi, j'avais mal configuré mon truc, j'ai eu un appel. Désolé, je vais mettre check list. Excuse-moi Stéphane. Ok, parfait. Attends, je note juste l'endroit. Ok, on reprend. Tout va bien ?

Stephane BereuxParfaitement.

Nicolas GuyonMerci beaucoup Stéphane. Et on disait Blomère que j'ai pété.

Stephane BereuxSuper.

Nicolas GuyonAlors, merci beaucoup Stéphane. Et donc tu me disais aussi, vous n'êtes pas responsable en cas d'erreur de l'IA. C'est une position que vous choisissez qui est, je pense, importante parce que ça laisse en tout cas une responsabilité, ça responsabilise peut-être l'avocat ou le juriste qui fait appel à votre solution. Parce que de la même manière, on avait entendu des histoires il y a quelques mois, il y en a tout le temps, d'avocats qui avaient utilisé Tchad GPT et qui s'étaient pointés au procès avec Tchad GPT, qui avaient inventé des jurisprudences. Tu dois la connaître, celle-là, Jean-Stéphane. Et en tout cas, vous vous mettez de l'autre côté par rapport à ça.

Stephane BereuxExactement. Et en fait, c'est Alors là, sur cet exemple en particulier, c'est un biais très fort des modèles qui produisent du texte vraisemblable et qui font des citations de jurisprudence qui sont vraiment vraisemblables, mais qui n'existent pas, et les modèles continuent à faire ça. Ça, c'est quelque chose qui n'a pas changé. Du coup, nous, on n'est pas responsable, mais évidemment que si on renvoie des réponses qui ne sont pas fiables, qui sont trop peu fiables, l'avocat arrêtera de s'en servir. Donc même si on est directement responsable, il y a un vrai enjeu de mettre tous les efforts possibles sur vérifier ce qu'on renvoie et la vérificabilité facile par l'utilisateur, par le juriste, par l'avocat, parce que lui, l'idée c'est de lui faire gagner le maximum de temps possible. Bien sûr.

37:57

L'integration avec SharePoint, iManage et SESIB

Nicolas GuyonC'est très clair. Je pense que de toute façon, on est encore dans un apprentissage sur la fiabilité de l'information. C'est un apprentissage général. On est trois ans après, mais il faut encore se souvenir qu'il y a une rélecture systématique. Il faut former les gens là-dessus, rélecture systématique, faire appel à notre intelligence humaine. On ne peut pas envoyer quelque chose aujourd'hui à quelqu'un qui est généré par l'IA directement, que ce soit un client, un collègue, un ami. Il faut toujours relire, toujours vérifier.

Stephane BereuxExactement, et donc ça c'est des enjeux et en fait on continue dans ces enjeux produits dont je mentionnais précédemment, c'est intrinsèque à la manière dont on constitue, qu'on consomme notre produit. Et d'ailleurs, pour faire un petit parallèle avec ce que tu disais sur Harvey au tout début de notre entretien, Harvey, ils ont une approche qui est très top-down, si j'ose dire. C'est-à-dire qu'ils ont une IA qu'ils vendent comme totipotente. Donc, on peut demander un petit peu n'importe quoi et l'IA sera censée savoir le faire. Là où nous on a cette approche qui est beaucoup plus marquée d'usage, et ça crée, c'est des approches qui sont différentes et qui ont chacune leurs avantages et leurs inconvénients. Il y en a une qui du coup ouvre plus le champ des possibles et est plus exaltante, mais au risque d'être déceptive, et c'est ce qui est passé, et c'est ce qui continue de se passer de temps en temps, parce qu'en fait Liane de facto ne sait pas tout faire. Là où nous, on a des cas d'usage qui sont beaucoup plus travaillés, beaucoup mieux évalués et qui fonctionnent vraiment, mais qui sont moins... Bah du coup, c'est plus focaliser les cas d'usage plutôt que de dire que c'est possible. Nous, on dit, voilà, nous, c'était possible, il va falloir rajouter.

Nicolas GuyonAh bah écoute, merci Stéphane, j'allais te demander de nous faire un petit panorama du marché justement, donc c'est parfait. Harvey donc, Harvey c'est 5 milliards de valorisation, 75 milliards d'ARR, 75 millions d'ARR de dollars, et c'est un des premiers acteurs en effet à avoir utilisé OpenAI au début, après il y a aussi des Thomson Reuters dont on parle très souvent de LexisNexis, Et après, en France, on connaît aussi Doctrine. Donc, Harvey, tu nous as expliqué un petit peu. Est-ce que tu peux me présenter un peu les autres acteurs, le marché ? Parce qu'on entend ces noms, tu vois, et j'entends Jimini aussi. Et attention, justement, on est là pour vous mettre en avant. Mais en vrai, comme ça, je ne suis pas vraiment capable de différencier les solutions, les acteurs.

Stephane BereuxDonc, ce serait super. En fait, il y a des typologies d'acteurs qui sont très différentes. Si je commence par la plus ancienne, finalement, c'est les éditeurs juridiques. Donc, les Tom Saunders, les LexisNexis, les Dallas. Donc, eux, à la base, ils vendent de l'information juridique. Donc, une donnée qu'on appelle la doctrine, c'est une sorte d'explication de la loi, de commentaire de la loi par des professeurs, par des avocats, etc. et donc c'est des outils de recherche juridique qui sont des bases documentaires d'une richesse incroyable et ils sont spécialisés sur la recherche juridique. Et ils rajoutent des briques d'IA sur cette solution-là, des briques d'IA un petit peu exogènes pour essayer de saupoudrer d'une couche d'IA une base de briques qui est déjà très pertinente. et quand j'y saupoudrais, il y a des use case plus ou moins avancés, et en fait ils se déplacent peu à peu sur les use case de productivité, mais avec ce socle qui est la recherche juridique. Ensuite, il y a des acteurs un petit peu hybrides comme Doctrine. Doctrine, c'est un moteur de recherche juridique spécialisé sur la donnée open source. Donc, ils s'appellent Doctrine, mais ils n'ont pas que Doctrine, ils ont justement de la loi et la jurisprudence. Et donc, eux, c'est une dégâte... Attends, redis-moi Stéphane.

Nicolas GuyonTu m'as dit... Désolé. Doctrine, c'était un moteur de recherche sur la doctrine juridique, c'est ça ?

Stephane BereuxNon, justement. Il y a trois couches de données. Il y a la loi, Il y a l'explication de la loi qui est la doctrine et la jurisprudence qui est tous les précédents, tous les jugements rendus, les décisions de justice rendues.

Nicolas GuyonD'accord, merci.

Stephane BereuxLa loi, c'est une donnée qui est publique, open source. La jurisprudence, c'est une donnée qui est en train d'être open sourcée, mais qui n'est que partiellement. Et la doctrine, en revanche, c'est une donnée privée et qui vaut très cher parce que c'est du commentaire fait par des professeurs, fait par des avocats, fait par des spécialistes du droit de la loi. Et c'est ce que commercialisent les éditeurs juridiques.

Nicolas GuyonTrès bien.

Stephane BereuxEt il y a une société qui s'appelle Doctrine, qui de manière un petit peu ironique ne commercialise pas de la doctrine, mais un moteur de recherche sur ces deux autres couches de données qui sont en pleine source, donc à savoir la loi et la jurisprudence. Donc eux, c'est une Legal Tech qui a développé un moteur de recherche qui fonctionne très bien. et qui rajoutent depuis maintenant un ou deux ans des features d'IA plus de productivité, donc qui se décalent sur le marché de la productivité. En rajoutant, ils ont notamment un outil qui s'appelle Doctrine Flow qui sert à faire de la productivité pour le contentionnement. Et ensuite, il y a des acteurs qui sont AI... très AI native et même Gen AI native, si j'ose dire, qui sont la vague d'acteurs qui se sont lancés au moment de ChatGPT, donc on est plusieurs.

43:57

Les hallucinations des LLM et la revision humaine

Nicolas GuyonComme vous, exactement, super.

Stephane BereuxEt ensuite, il y a nous, il y a des Suédois qui s'appellent Legora, il y a d'autres sociétés en France qui s'appellent Ordaly, qui s'appellent Haïku. Il y a de nombreux acteurs et qui sont vraiment cette vague Gen AI native et donc très orientée productivité. et à l'inverse pour qui la recherche juridique est indépendante mais n'est pas le point central et en revanche qui met tous les efforts sur le gain de productivité.

Nicolas GuyonD'accord, d'accord, c'est bon, je commence à comprendre. Mais quand on est extérieur, ce n'est pas évident. Merci de partager ça Stéphane. Et LexisNexis, dont on parle souvent, là pour le coup, c'est un éditeur juridique à la base. Et donc eux ce qu'ils vont proposer, ils vont proposer la même chose que Doctrine à la base, ils vont proposer l'accès à leurs informations avec de l'IA.

Stephane BereuxOui, sauf que l'énorme différence entre les deux, c'est que LexisNexis possède un gros fonds doctrinal, donc cette donnée qui leur est propre, qui est du commentaire de la loi, de l'expression de la loi, et en fait qui est la donnée à très très haute valeur ajoutée. là où Doctrine ne possède pas de Doctrine et donc ne possède que de la donnée open source, relativement open source, ils ont des données de jurisprudence qui ne sont pas open source, mais Doctrine ont un très bon moteur de recherche sur cette donnée open source. Et Lexis, par ailleurs, développe Lexis AI, qui est un module qui aide à faire de la productivité, mais qui notamment est très intégré avec ce moteur de recherche juridique, et donc qui permet d'interroger efficacement ce fonds doctrinal et cette base de données juridiques dont il dispose.

Nicolas GuyonTrès bien. Et est-ce que vous, dans ce cas-là, vous vous incorporez la loi et la jurisprudence, vous avez intégré ça sur vos modèles ?

Stephane BereuxOui.

Nicolas GuyonEt la doctrine aussi ou pas justement ?

Stephane BereuxLa doctrine open source, qui est exactement la doctrine fiscale, le BOFIP, qui est la doctrine open source.

Nicolas GuyonOk d'accord, merci beaucoup Stéphane pour cette présentation, pour ce panel. C'est super intéressant. OK, d'accord. Mais donc, en tout cas, ce qui est sûr, c'est que les éditeurs, ils ont intérêt, les éditeurs historiques, ils ont intérêt à intégrer de l'IA. Sinon, ils risquent d'être un petit peu dépassés. Par exemple, pour un Dalloz, c'est quelque chose de fondamental.

Stephane BereuxIls sortent des outils. Dalloz a sorti un outil qui s'appelle Génial. Lexis, du coup Lexis AI, a sorti un assistant qui s'appelle Protégé. Donc chacun sorte des outils et souvent qui sont particulièrement pertinents sur leur spécialité, à savoir la recherche géodique, parce qu'ils capitalisent sur le travail de nombreuses années et de grosses équipes.

Nicolas GuyonCe qui veut dire qu'un JIDE peut tout à fait avoir, ça a un coût, mais peut avoir un Jiminy d'un côté et Doctrine de l'autre côté, deux abonnements pour ses collaborateurs par exemple.

Stephane BereuxComplètement. Et après c'est les questions de coûts et de gains de performance. Et sachant que grâce aux récentes avancées en IA générative, il y a beaucoup de cartes en termes de performance et de manière de faire de la recherche qui sont rebattues.

Nicolas GuyonMerci beaucoup Stéphane. Petite question, donc tu dois quand même fréquenter, et avec Raphaël maintenant, et j'ai compris que c'est comme ça que vous avez construit le produit aussi, des avocats, des cabinets d'avocats. J'aimerais avoir un peu ta vision aussi sur le marché de l'emploi par rapport à ça. C'est-à-dire, tu sais, on se dit aujourd'hui avec ces outils de diagénérative, dans le monde des cabinets de conseil ou la finance, Le paradigme qui était… Le junior, il produit, il passe ses nuits blanches, tu sais, à faire de l'Excel et du PowerPoint, et il travaille comme un dingo, et en fait il va montrer ça à son senior qui valide, qui lui dit « go » ou « recommence », etc. Ce monde, on a l'impression qu'il est un peu en train de changer, en tout cas sur les métiers du conseil de la finance, moi je l'observe. Dans le droit, par rapport à ce que tu me présentes, avec vos outils de productivité, avec rien qu'un dégain de productivité de 20 à 30%, un avocat senior dans un cabinet peut certainement faire beaucoup plus facilement une grande partie du travail, avoir moins besoin de juniors. Est-ce que ça, c'est quelque chose que tu ressens ? Une question que ces partnerships, ces cabinets d'avocats, se posent un petit peu pour la construction de leur pyramide ?

Stephane BereuxC'est un vrai enjeu, ça. La manière dont moi je le vois, c'est plutôt qu'il y a un manque d'avocats. Il y a beaucoup de dossiers, il y a beaucoup de travail, donc c'est plutôt dans l'autre sens, au sens que ça va permettre de prendre plus de dossiers qu'on va avoir besoin de moins de personnes. En revanche, il y a un vrai enjeu d'accompagner ce changement. Donc, c'est des choses qui ont déjà eu lieu dans le passé, si je prends le monde de l'avocature. En fait, la recherche Internet et la recherche en ligne a chamboulé la manière de faire de la recherche juridique. Parce qu'avant, en fait, on allait dans des gros bouquins de droit, des gros annales de droit. On lisait. Et en fait, c'est une manière de se former parce que quand on cherchait le bon article, la bonne décision, mécaniquement, on en parcourait d'autres. Et donc, on lisait, on enrichissait notre approche de recherche juridique. Et au moment où il y a eu ce changement vers la recherche en ligne, une partie des anciens partenaires de l'époque étaient là, mais attendez, on ne va plus savoir, les gens ne sauront plus former correctement, ne sauront plus faire de droit. Finalement, les usages ont évolué, on a alloué moins de temps à faire ça et plus de temps à faire d'autres tâches, et je pense qu'on est encore dans une phase de transformation où il y a des tâches qui vont aller de plus en plus vite, et notamment le fait d'éplucher des contrats pour trouver le montant du salaire ne sont pas des tâches qui sont particulièrement des tâches de formation, Et en revanche, les avocats se formeront peut-être plus à l'accompagnement, à la stratégie, à d'autres tâches à plus de valeur ajoutée. Mais ce qui est certain en revanche, c'est qu'il va y avoir une évolution majeure de la manière dont on fait du droit. Et même si le fondement et la réflexion sera toujours là, je pense qu'on va avoir plus de temps à louer à la réflexion et plus de temps à louer à ces tâches fastidieuses.

49:44

L'avocat dans la poche : l'acces au droit pour tous

Nicolas GuyonTu vois Stéphane, ça me semble assez évident parce que quand je t'écoute me parler de ça, je me dis en fait, Ça me fait penser aux médecins. Aujourd'hui, avec l'HGPT, tout le monde a un médecin dans la poche. Il faut faire passer le message. C'est important de l'utiliser surtout en tant que deuxième avis. Il faut continuer à avoir l'avis d'un professionnel, en particulier quand on parle de sa santé. Mais je suis persuadé, et d'ailleurs je m'en sers, ça veut dire que tu vas avoir plein de particuliers, plein de personnes qui vont se retrouver à devoir travailler sur un contrat pour acheter un appart, pour vendre une boîte, leurs opérations courantes, et c'est sûr que ces personnes-là, ils n'auront pas forcément Jiminy, mais ils vont utiliser le ChatGPT, Claude, pour se faire un avis, tu vois, et avoir un peu un pseudo avocat in the pocket accessible quasiment gratuitement. Et ça, je pense que c'est hyper important, parce que ça veut dire qu'il y en a qui vont réussir à trouver leurs réponses de cette manière-là, et il y en a d'autres qui trouveront peut-être pas toutes les réponses ou le sujet sera trop important, et dans ce cas-là, ils iront voir un avocat, mais quand même, ils arriveront avec un certain bagage, ils seront certainement bien mieux informés qu'avant.

Stephane BereuxOui. Et en fait, pour moi, c'est quelque chose d'extrêmement positif parce qu'un des gros problèmes en France actuellement, c'est le non-recours au droit. En fait, c'est très fréquent que les gens ne fassent pas alors leur droit ou soient découragés par, en fait, ce mur psychologique, expliqué d'ailleurs, du fait de recourir au service d'un avocat. Finalement, pour moi, je vois ça plutôt comme un vecteur d'éducation et un vecteur pour dire aux gens, et c'est d'ailleurs un peu la posture qu'ont les IA généralistes actuellement, quand on leur pose des questions spécialisées, elles leur recommandent de se tourner vers un professionnel, mais c'est assez différent de se poser la question, de se dire est-ce que je suis dans mon bon droit et qu'il y a… En fait, la plupart des gens ne savent même pas qu'ils sont dans leur bon droit et même pas qu'ils peuvent faire quelque chose. Alors que si on leur dit oui, tournez-vous vers un avocat, dans ce cas-là, vous êtes dans votre bon droit et pour vous aider à faire valoir vos droits, et bien en fait on va avoir quelque chose qui est beaucoup plus souhaitable. Et si de l'autre côté, en fait, traiter le dossier ne prend plus que, je grossis le trait, 10 minutes au lieu de 2 heures, et bien en fait le coût du dossier va aussi mécaniquement baisser, et donc en fait on va avoir une prestation qui est plus abordable.

Nicolas GuyonMais en fait tu vois, mais c'est fascinant, en vrai je pense qu'on aurait pu faire un épisode sur ce sujet là. C'est sûr que depuis ChatGPT, Il n'y a jamais eu autant de gens, tu sais, qui avant se disaient, tiens, je ne vais pas me retourner contre tel service client de telle boîte parce que je ne sais pas faire. Ça va me coûter de l'argent d'avoir un avocat. Je ne sais pas comment faire et tout ça. Et aujourd'hui, ils le font. Et de l'autre côté, après tu as raison, je vois très bien que Chad Gpt, Claude et tout ça peuvent te dire en bout de chaîne et ensuite va consulter un avocat pour aller plus loin. Et ça, ça confirme ce que tu me disais, qu'au final il va y avoir de plus en plus de travail d'une certaine manière pour les avocats et peut-être à un autre niveau, plus raisonnement, stratégie. Mais je serais curieux, tu vois, je ne sais pas s'il y a des chiffres qui existent là-dessus, je suis sûr qu'autant on peut parler de l'impact de l'IA sur l'emploi, des développeurs, des professionnels du service client et des jeunes en particulier, mais le nombre, tu sais, de dossiers juridiques ouverts en plus depuis Tchad GPT ou de personnes qui ont recouru au droit, comme tu le disais tout à l'heure, et qui ne recouraient pas avant, ça doit être assez barjot, je pense.

Stephane BereuxOui, alors je n'ai pas de chiffres, mais oui, je pense complètement, oui. Et après, il y a aussi cette responsabilité qu'a l'avocat et qu'il n'a pas le modèle, qui est la responsabilité, il a une responsabilité vis-à-vis de son client, une responsabilité légale de bien le conseiller et de ne pas halluciner, de lui conseiller quelque chose de fiable. Et c'est aussi quand on engage un discours en justice, on ne peut pas l'engager sur quelque chose de bancal, il faut l'engager avec un avis éclairé. C'est pour ça que, pour moi, je vois vraiment ça comme une amélioration du respect du droit en France, parce que… De meilleure éducation.

Nicolas GuyonÉcoute, ça c'est quand même très très très positif. Merci Stéphane, je suis content qu'on en arrive là. C'est super cool. Petite question sur le rôle de l'open source sur l'IA, Mistral, la souveraineté. Tu me l'as pointé tout à l'heure un petit peu en fer de lance avec Scaleway notamment. Vous, vous utilisez des modèles open source et Mistral potentiellement ?

Stephane BereuxAlors nous on se sert en grande partie des monnaies de l'omistral, on a commencé à l'utiliser par des modèles open source et on a arrêté de s'en servir parce que c'est extrêmement compliqué. En fait les modèles open source ils sont beaucoup moins bons parce que les développeurs de modèles qui gardent propriétaire évidemment leurs meilleurs modèles. le principal problème, c'est un enjeu d'échelle. C'est-à-dire que quand on est un LLM provider, donc quelqu'un qui fournit par API des services d'IA, on peut mutualiser sur des GPU les requêtes de millions d'utilisateurs et donc on a des gains en latence, on a des gains en coûts qui sont immenses, là où c'est un coût qui est insoutenable pour une entreprise comme la nôtre de louer les GPU qu'il faudrait pour faire tourner un modèle relativement rapidement. Avec les modèles open source, c'était très long, de piètre qualité, et extrêmement cher. C'était de l'ordre de 10 fois, 15 fois plus cher que ce qu'on paie actuellement. Parce qu'en fait, louer les GPU, c'est des milliers et des milliers d'euros par mois. Louer des H200 et compagnie. Donc du coup, on a arrêté et on est passé sur des modèles par pays.

54:06

L'IA en biologie et medecine : Gemini contre le cancer

Nicolas GuyonAh oui, d'accord. Sur des modèles par pays. Excuse-moi, par API, pardon, bien sûr. Merci beaucoup Stéphane. OK, trop bien. Petite... Merci pour tout. Pour finir, je ne sais pas si tu as vu, mais en ce moment, il y a quelque chose de très intéressant et je pense que tu n'as pas pu louper ça. Sam Alkman en parlait, c'est un petit peu l'IA et la science. Et toi, avec ton expertise un petit peu sur la biologie, en tout cas tes premiers amours sur l'IA, je ne sais pas si tu as vu, mais cette semaine tu as Gemma, le modèle de Google, de Gemini, qui a permis de trouver en tout cas des pistes pour une nouvelle thérapie contre le cancer. On a un autre modèle de Google qui permet de travailler sur la stabilisation du plasma pour la fusion nucléaire. On a eu Terence Tao, le plus grand mathématicien contemporain peut-être, qui a dit qu'il avait réussi à avancer sur la résolution d'un théorème avec l'IA. Il se passe des choses. On a l'impression que ça pop, que c'est des petits soubresauts. Comment est-ce que tu vois ça, toi ? Est-ce que c'est quelque chose qui t'excite ? Et est-ce que tu penses que ça va s'accélérer ?

Stephane BereuxOuais, moi, je suis assez convaincu qu'on va aller vers une accélération de ces domaines-là. D'ailleurs, dans les innovations sympas, je ne sais pas si tu as vu passer Dolphin Gemma.

Nicolas GuyonAlors, ça va avoir bientôt... Non, non, vas-y.

Stephane BereuxC'est marrant. Ils ont entraîné un modèle pour communiquer avec les dauphins. C'est dans les innovations scientifiques.

Nicolas GuyonC'était Valentin Schmitt, un copain qui était passé sur mon podcast, qui m'avait dit On arrivera certainement avant au dog mode, avant d'arriver au god mode de l'IA. Parce qu'il voulait dire interagir avec l'animal, avec le chien ou avec l'animal. Donc ton dolphin GPT ou GMA, je comprends très bien. Oui, bien sûr.

Stephane BereuxOui, moi, je suis très convaincu que ça va permettre d'accélérer les découvertes scientifiques.

Nicolas GuyonTu as peut-être vu les travaux, le papier de Dario Amodei d'Anthropique, Machine of Loving Grace, où il te dit, en tout cas, lui c'est un ancien biologiste aussi, Dario, et il te dit qu'on pourrait avoir en 10 ans l'équivalent de 100 ans de progrès scientifique grâce à l'IA.

Stephane BereuxJe suis radicalement convaincu. En fait, il y a plein, si je repars de mon expérience perso, quand j'étais en thèse sur le micro-ondes intestinales, les méthodes les méthodes qui étaient utilisées en analyse de données étaient assez en arrière par rapport à la méthode qui était à la pointe en IA, et ce qui est normal parce que les gens travaillent sur leur domaine, mais il n'y a rien qu'en faisant les niveaux et en faisant se parler les récentes avancées d'un domaine avec celle d'un autre, on peut arriver à des découvertes et à une bien meilleure compréhension que ce qu'on a déjà. Il y a très clairement des dimensions à chercher. Ce midi, j'étais à un déjeuner où la conversation était autour du « active learning » et du « lab in the loop » notamment en biologie. Et l'idée était de se dire qu'en fait, les modèles d'IA permettent d'explorer, par exemple, des molécules à visée thérapeutique qu'on va vouloir utiliser ensuite. Ils permettent de suggérer les candidats les plus pertinents à tester. Ensuite, on les fait tester et en fait, on gagne déjà du temps. Au lieu de tester un peu à l'aveugle, on oriente nos choix parce que c'est ça qui prend beaucoup de temps. Ensuite, on fait les tests. On a le retour sur expérience et on optimise l'exploration des possibles. Et voilà. Et donc, en fait, pour moi, c'est un exemple parmi plein. Pour moi, on prend n'importe quel domaine, ça va radicalement axé à la recherche. Et je suis complètement d'accord avec ce constat-là. Et c'est ce que j'observe même à titre personnel sur les problématiques techniques où l'IA m'aide énormément et m'aide à comprendre des choses que j'avais pas prévues.

Nicolas GuyonBien sûr. C'est fascinant. Merci de nous partager ta vision à ce niveau-là, Stéphane. Pour ce qui est de NGI, intelligence artificielle générale, super intelligence, c'est des sujets qui sont liés à ce qu'on vient de dire, mais ça te parle ces deux notions ?

Stephane BereuxOui, c'est des sujets qui sont épineux au sens où j'ai l'impression que personne n'a exactement la même définition. et il y a de bonnes définitions à proposer. Il y a une phrase que j'aimais bien, je ne saurais plus dire exactement l'original, mais l'idée était, à partir du moment où on se demande si on est à AGI, c'est qu'on est à AGI. Et pour moi, si on n'y est pas, on n'en est pas loin, en tout cas les modèles sont capables de faire moult tâches que je suis incapable de faire, et en fait ça fait déjà un bout de temps.

59:53

Conclusion et perspectives

Nicolas GuyonEt je crois que tu vois, tu as raison sur cette phrase, elle est super intéressante. Si on se demande, c'est qu'on y est. Et je pense qu'en fait, après, quand on n'en parle plus, c'est qu'on est passé de l'autre côté. Le test de Turing, on l'a passé. On n'en parle absolument pas. On n'en parle plus du tout.

Stephane BereuxExactement. Alors après on peut toujours trouver des effets de bord, des cas particuliers qui ne fonctionnent pas, et puis évidemment on sait qu'il y a encore des choses avec lesquelles on n'a pas encore de world model satisfaisant, il y a plein de choses où on n'y est pas encore. Mais sur les capacités de réflexion, des derniers modèles de raisonnement, c'est absolument sidérant, je trouve. Et alors, je ne suis pas dans les secrets des laboratoires, mais ce qu'on entend quand même, c'est que c'est beaucoup de données synthétiques, d'entraînement par données synthétiques, c'est-à-dire des modèles qui génèrent de la donnée, qui s'auto-améliorent sur la donnée-là, en fait, ils génèrent des raisonnements, ils critiquent les raisonnements qu'ils ont générés pour élaguer les mauvais raisonnements. et ensuite il s'entraîne sur ses raisonnements valides et c'est comme un grimpeur qui escalade pas à pas, mais qui escalade tout seul, il n'a pas besoin d'être tracté par une chaîne ou quoi que ce soit, il monte tout seul et a priori on n'a pas encore atteint de palier, on n'a pas encore atteint de palier avec cette approche de traitement, et on a encore des réservoirs de données sous-exploitées assez conséquents. Alors on atteint bientôt la limite de la donnée textuelle parce qu'on l'a utilisée, utilisée, utilisée, mais on a ensuite tout ce qui est de la vidéo, et c'est un peu l'enjeu des role models actuellement. C'est de se dire, si on arrive à ce que les modèles aient une compréhension un peu intuitive de comment fonctionne la physique du monde, comme un humain ou un être vivant de manière globale apprend, si on arrive à injecter ce savoir-là en plus de la donnée textuelle, En fait, il n'y a pas vraiment de limite, il n'y a pas vraiment de raison qu'il y ait un plafond de verre à moi.

Nicolas GuyonBien sûr, bien sûr Stéphane. Tu as raison sur cette multimodalité. J'en parlais avec un ami récemment. Sora, Sora 2, l'application, on a tous été bluffés. Big Bang créatif. Moi, j'ai généré des vidéos dans tous les sens, dans toutes les situations pour m'amuser. Je trouve ça fou ce que ça peut faire. Ce qui est assez marrant, c'est qu'on a très peu parlé de Sora 2. Si Sora 2 existe, c'est qu'OpenAI met en place un world model. Pour pouvoir créer toutes ces vidéos, ça veut dire qu'ils ont des modèles qui fonctionnent extrêmement bien sur la compréhension du monde. ce world model et potentiellement donc même se dire que le monde peut être une simulation avec Sora 2. Et je trouve que c'est marrant, on n'en a pas du tout parlé au moment de la sortie.

Stephane BereuxNon, pas du tout. C'est clair. Et c'est des sujets qui sont méga d'actualité. Et c'est Yann Lequin qui en parle beaucoup, qui a toujours son sa conception sur les architectures des modèles où il pense que les architectures type LLM sont pas capables, type transformer sont pas capables d'être dans le modèle, d'autres gens tout aussi brillants qui pensent que c'est possible. Donc on sait que c'est un enjeu majeur du moment, il y a énormément d'argent et de moyens qui sont investis et avec des chercheurs excellents qui travaillent dessus. Et pour le coup j'ai assez peu de doute que si c'est pas déjà craqué dans les labs d'OpenAI ou dans les labs de Quen, ça le sera bientôt.

Nicolas GuyonSuper, merci Stéphane. On aura fait une deuxième partie d'épisode assez incroyable, passionnante pour nos utilisateurs. On aura mixé le droit et le progrès de la recherche scientifique, donc un grand merci à toi. Dernière question traditionnelle en deux mots, un bouquin ou un film de science-fiction à nous recommander ?

Stephane BereuxJe pense que j'ai particulièrement aimé... Je pense qu'il y a la trilogie du problème à trois corps de Lucy Jeanne qui est bien sûr, mais en science-fiction plus rêveuse et moins exotique, je pense que Le Petit Prince est un incontournable. Mais on est moins dans le scientifique et plus dans la fiction. Mais en tout cas, ça parle de l'espace.

Nicolas GuyonMerci beaucoup Stéphane, merci, merci beaucoup. Merci de nous avoir rendu accessibles tout ce qui se passe quand même sur l'IA et le droit. Ça m'a permis de comprendre un petit peu ce que vous proposiez, donc j'en suis très heureux. Ce que Toché proposait aussi avec ses grands noms, ses Harvey, ses Doctrines, ses LexisNexis dont on n'entend pas parler, dont on entend parler et on ne comprend pas trop. C'était vraiment super clair, c'était passionnant. Donc je sais que parmi nos auditeurs, il y a plein d'avocats, il y a plein de juristes, il y a plein de personnes qui passent du temps sur des contrats. Contactez donc Jiminy pour gagner énormément de temps. Vous avez vu qu'ils ont une approche excellente, une approche sur la souveraineté de vos données, une approche de responsabilité. Donc, félicitations pour ce que vous faites. Je pense que c'est aussi hyper important d'avoir des boîtes comme vous en France et en Europe. Je pense que c'est fondamental. Merci beaucoup Stéphane.

Stephane BereuxAvec grand plaisir. Merci beaucoup pour l'invitation et j'espère que ça plaira vos visiteurs.

Nicolas GuyonMerci Stéphane. Salut.

Stephane BereuxAu revoir.

📬 Recevez les meilleurs insights IA chaque semaine

Veille, analyses et cas d'usage concrets dans votre boite mail.

S'abonner a la newsletter

Questions frequentes

🎙️A propos de votre hote

Nicolas Guyon

Formateur IA & Expert en Intelligence Artificielle Generative

Animateur du podcast Comptoir IA (160+ episodes, 50 000 ecoutes/mois), intervenant BFM Business et ambassadeur du Plan National IA, Nicolas accompagne les entreprises et les independants dans leur adoption de l'IA generative pour transformer leur activite. Ses formations IA en entreprise couvrent les fondamentaux de l'intelligence artificielle jusqu'aux cas d'usage avances de l'IA generative.

Ses clients : Hermes, Naval Group, ERAM, Arkopharma, Puig, CESI, SANEF...

Episodes similaires