Comptoir IA Podcast

Episode 100

Jeff Boudier — Comment Hugging Face démocratise l'IA | Comptoir IA #100

1:01:3761 min
JB

Jeff Boudier

VP Product & Growth, Hugging Face

Resume

Jeff Boudier, VP Product & Growth chez Hugging Face basé à San Francisco, révèle comment la plateforme atteint 5 millions d'utilisateurs et 1 million de modèles open source en 2024. Il dévoile Hugging Chat, l'alternative open source à ChatGPT avec raccourci clavier Option+Shift+Entrée sur Mac, et montre comment créer un assistant IA personnalisé en 3 clics pour les PME. Jeff analyse l'écart entre modèles open et closed source qui se réduit rapidement grâce à Meta (Llama 3.2 multimodal), Mistral et la communauté. Il présente les Spaces, dont le Virtual Try-On viral, l'outpainting et les modèles text-to-3D. Jeff dévoile Le Robot, le projet de démocratisation de la robotique via l'apprentissage par démonstration. Sur le marché, il observe que 80% des panneaux publicitaires de l'autoroute Silicon Valley parlent d'IA générative. Il alerte sur les risques du closed source pour les entreprises et recommande l'open source pour garder le contrôle. L'épisode couvre aussi le départ de Mira Murati d'OpenAI et la restructuration en for-profit à 150 milliards de dollars.

Points cles de l'episode

  • 1Hugging Face compte 5 millions d'utilisateurs et plus de 1 million de modèles open source disponibles gratuitement
  • 2Llama 3.2 de Meta apporte la multimodalité (texte + images) à l'open source, réduisant l'écart avec GPT-4o
  • 3Hugging Chat propose un raccourci clavier natif Mac (Option+Shift+Entrée) pour accéder instantanément à l'IA
  • 4Créer un assistant IA personnalisé pour une PME prend 3 clics sur Hugging Chat en pointant vers l'URL du site
  • 5Plus de 100 000 organisations utilisent Hugging Face pour collaborer sur des modèles privés en entreprise
  • 6Les modèles vidéo open source comme CogVideoX des labos chinois rattrapent les solutions closed source
  • 7Le projet Le Robot vise à démocratiser la robotique via le partage communautaire de skills d'apprentissage
  • 880% des panneaux publicitaires entre Silicon Valley et San Francisco parlent d'IA générative en 2024

Transcription complete

00:00

Introduction et parcours de Jeff Boudier

Nicolas GuyonSalut Jeff. Jeff Boudier. Alors Jeff, je suis ravi de te recevoir sur Comptoir IA épisode numéro 96. Ça commence à faire pas mal. Jeff, donc toi tu travailles aujourd'hui chez Hugging Face, où tu t'occupes de product et de la growth. Tu es basé à San Francisco. Avant ça, tu as monté une boîte, une énorme super success story en France, Stupeflix avec Nicolas Stigman, qui a été racheté par GoPro. Ensuite, tu as continué chez GoPro un petit peu. Mais donc aujourd'hui, je suis ravi de t'avoir. Hugging Face à San Francisco au coeur du réacteur et on va se faire un méga épisode.

Jeff BoudierExcellent. Merci beaucoup de l'invitation.

Nicolas GuyonEt alors, pour l'anecdote, l'invitation que j'ai faite à Jeff, là, aujourd'hui, on est le 27 septembre 2024. Jeff l'a invité il y a un an et demi.

Jeff BoudierDésolé, je suis un petit peu lent. Si tu voyais le nombre d'emails non lus, tu verrais que finalement, c'est plus du push que du pull qui marche.

01:48

L'explosion de la multimodalité en IA

Nicolas GuyonQu'est-ce qui se passe dans l'IA Générative aujourd'hui ?

Jeff BoudierTellement de choses. Un thème en ce moment qui est très, très actif, c'est le multimodal. C'est-à-dire qu'on a vu des modèles de IA génératives qui créent du texte depuis pas mal de temps, tous ces chatbots, GPT, mais depuis peu on a des modèles qui peuvent générer et aussi comprendre des types de données complètement différents. Et donc maintenant il y a le nouveau Llama de Meta 3.2 qui propose non seulement de prendre en entrée des textes mais aussi des images.

Nicolas GuyonCe 3.2, il est sorti quand en fait ?

Jeff BoudierIl vient de sortir il y a deux jours. Il est multimodal et donc ça veut dire qu'il peut prendre en entrée non seulement du texte, mais aussi des images. On a un type de modèle d'IA générative qui est en énorme croissance. Ce n'est plus du tout des chatbots qui prennent du texte en entrée pour te donner du texte en sortie, mais tu peux mettre en entrée n'importe quel type de données et recevoir en sortie n'importe quel type de données.

04:50

Hugging Face : 5 millions d'utilisateurs et 1 million de modèles

Jeff BoudierAujourd'hui, Hugging Face, ce n'est plus uniquement utilisé par les chercheurs et les data scientists, c'est aussi les ingénieurs, les machine learning engineers, c'est aussi les software developers qui utilisent l'IA générative pour rajouter des briques IA dans leurs applications. Nous, on appelle ça les AI builders, tous ces gens-là, et il y en a plus de 5 millions aujourd'hui sur la plateforme.

Nicolas Guyon5 millions, c'est colossal, c'est incroyable. Mais tu sais quoi ? Bonne nouvelle, même moi, je commence à y aller. Avec les Spaces et quelques applications que je peux trouver, je commence à y aller.

Jeff BoudierHugging Face, c'est finalement la communauté de l'IA générative qui se construit autour des modèles open source. Modèle open source, ce que je veux dire, c'est des modèles qui sont accessibles, on peut récupérer les fichiers pour les utiliser nous-mêmes.

08:56

Hugging Chat : l'alternative open source à ChatGPT

Nicolas GuyonQuel est l'outil d'IA que tu utilises le plus ?

Jeff BoudierHugging Chat. Et c'est open source parce que l'application elle-même est open source. Tu peux la trouver sur github.com/huggingface/chat-ui. Tu trouves ça sur huggingface.co/chat et tu retrouves une interface de conversation avec un assistant IA. La différence, c'est que tu peux choisir le modèle, tu peux choisir le système prompt, et tu peux même créer tes assistants, tu peux même lui donner des outils avec les Spaces.

11:40

L'application desktop et le raccourci magique

Jeff BoudierDans le thème de l'accessibilité, mon truc, c'est le raccourci Option Shift Entrée. On vient de sortir une application desktop pour les Mac, qui te permet d'utiliser Hugging Chat de manière native sur ton ordinateur. Tu fais un petit Option Shift Return, tu as une mini fenêtre qui s'ouvre où tu poses la question et tu as la réponse qui s'affiche juste derrière. C'est natif, c'est instantané. Ça, j'utilise vraiment tout le temps maintenant.

Nicolas GuyonC'est hyper important d'avoir ça. Il y a aussi la possibilité d'accéder au micro et de prompter à la voix, ce que je ne peux pas faire dans le navigateur. Et ça c'est pratique quand on n'a pas envie de taper.

13:46

Créer un assistant IA pour sa PME en 3 clics

Jeff BoudierUn secret qui est encore très peu exploité, c'est la partie assistant de Hugging Chat. Tu peux créer un assistant IA qui est spécialisé sur le contenu d'un site internet, avec une manière spécifique à ta marque. Tu crées un assistant, tu lui dis va chercher les informations sur l'URL de ton site internet. Tu finis tes phrases par « sportivement vôtre ». En trois clics, tu as créé un assistant qui est expert et qui va répondre en fonction des informations disponibles sur ton site, ce qui permet de réduire tous les problèmes d'hallucination.

Nicolas GuyonJeff, je savais que c'était une très bonne idée de faire cet épisode. Tu m'apprends plein de trucs, je ne savais pas du tout que c'était possible. On a plein de small business qui nous écoutent.

16:04

L'atmosphère IA entre San Francisco et Paris

Jeff BoudierL'IA et l'IA générative depuis déjà un an à San Francisco, c'est sur tous les panneaux publicitaires. Si tu prends l'autoroute qui relie la Silicon Valley et San Francisco, 80% des panneaux publicitaires, c'est l'IA générative. Et toute boîte tech se revendique de l'IA générative.

Nicolas GuyonÀ Paris, ce n'est pas le cas. J'ai vu près du Grand Rex un panneau Anthropic. On se demandait un peu ce qu'ils faisaient là, mais ce n'est pas ce que tu décris.

Jeff BoudierCe qui est frappant, c'est que n'importe quelle boîte qui propose des produits de technologie va parler d'IA générative. On est au-delà de la Big Tech qui veut parler de Gemini ou GPT-4. Là, on est vraiment sur l'ensemble de l'univers de la technologie.

20:43

Les Spaces viraux : Virtual Try-On et Outpainting

Nicolas GuyonJ'ai vu la semaine dernière Colors Virtual Try-On. En une seconde, une photo, une photo de moi, j'arrive à revêtir n'importe quelle fringue, à faire de l'essayage virtuel. Ça cartonne. L'essayage virtuel, tout le monde s'est cassé les dents, et là je vois ce modèle qui est là sur Hugging Face, disponible gratuit.

Jeff BoudierJ'ai pris une photo de Sam Altman et j'ai rajouté un t-shirt Hugging Face. Je voulais célébrer le fait qu'OpenAI ait publié sur Hugging Face un jeu de données de manière open, ce qui est quand même assez cool. Ça montre que le narratif un peu simpliste de closed source versus open source, c'est un peu trop simplifié.

27:44

Tour du Hub : modèles, datasets et Spaces

Jeff BoudierLes modèles, il y en a plus d'un million disponibles en accès libre. Ça peut être transcrire ce que je dis dans du texte, traduire dans une autre langue, prendre du texte pour en faire une image ou une vidéo. Ensuite, il y a les jeux de données, super importants pour créer ou adapter des modèles. Et la troisième grande catégorie, les Spaces : une manière simple de créer des applications interactives.

Jeff BoudierIl y a une couche collaborative pour discuter avec le créateur d'un modèle, une couche de sécurité Enterprise Hub pour les entreprises, et une couche sociale avec la fonctionnalité Posts. Pour tout ce qui est contenu de qualité sur l'IA générative, Hugging Face est devenu le centre névralgique.

36:00

Chatbot Arena et évaluation des modèles

Jeff BoudierIl y a deux approches pour évaluer les modèles. L'Open LLM Leaderboard sur Hugging Face compare des milliers de modèles sur des benchmarks scientifiques établis comme MMLU. Mais les notes de classe ne disent pas forcément comment le modèle va se comporter dans ta boîte. Le Chatbot Arena de LMSYS a une autre approche : en mode blind test, comme avec le vin, on te donne deux réponses et tu choisis la meilleure sans voir l'étiquette. Avec des centaines de milliers de réponses, ils arrivent à ce classement basé sur la perception humaine.

Nicolas GuyonLà j'ai le O1 de OpenAI en top, suivi de GPT-4o, O1 Mini, Grok 2 en 7e position, Claude 3.5 Sonnet, Gemini, et après du Llama 3.1.

40:39

Les risques du closed source pour les entreprises

Jeff BoudierOn a un meilleur modèle, il est un peu moins cher à faire tourner, et du coup le modèle refuse de répondre aux questions. Et là, il n'y a aucun recours pour les entreprises parce qu'ils ont fait le choix d'utiliser une technologie closed source qu'ils ne maîtrisent pas du tout, via une API, et ils se retrouvent dans les choux. Si vous construisez vos propres features avec des modèles que vous contrôlez, parce qu'ils sont open source, que vous pouvez les déployer chez vous, ils ne changeront pas de version.

45:02

Vidéo, 3D et l'avancée des labos chinois

Jeff BoudierSur la vidéo, je m'attends à voir la même courbe qu'on a vue sur le texte puis l'image. Les modèles open source rattrapent de manière de plus en plus rapide l'écart avec les modèles fermés. CogVideoX du labo chinois THUDM, c'est du rendu photoréaliste, des vidéos de 6 secondes avec cohérence temporelle. Ceux qui contribuent le plus au domaine aujourd'hui, ce sont les labos chinois.

Jeff BoudierEn texte-to-3D ou images-to-3D, tu donnes une image en entrée et il te sort un objet 3D avec les textures, toute la géométrie. Pour créer des univers de jeux vidéo, de réalité virtuelle, c'est super excitant. Et il y a des choses super utiles en biologie, en chimie, un super modèle de prévision météo publié par NASA et IBM cette semaine.

50:10

Le Robot : démocratiser la robotique

Jeff BoudierAujourd'hui, avec le Machine Learning, on est capable d'apprendre des nouveaux skills à un robot, juste en lui montrant comment faire. À Hugging Face, on a Le Robot, une librairie open source sur github.com/huggingface/lerobot. On veut créer une plateforme de mutualisation de l'apprentissage des robots. Si toi tu apprends à ton robot à mettre ton iPhone sur ton chargeur, ce skill peut être utilisé par moi à San Francisco avec un bras différent. On a aussi des tutoriels étape par étape pour construire ton propre robot en imprimant tes pièces 3D.

55:51

Mira Murati quitte OpenAI et recommandations

Nicolas GuyonSam Altman, on vient d'apprendre que Mira Murati était partie d'OpenAI, il va finir tout seul sur la photo.

Jeff BoudierC'est une transformation d'OpenAI qui à la base était un labo de recherche scientifique. Tous les premiers modèles d'OpenAI étaient sur Hugging Face. Ce que je trouve significatif, c'est la restructuration de la boîte qui va devenir for profit.

Nicolas GuyonUn livre ou un film de science-fiction à nous recommander ?

Jeff BoudierMa soeur, Laure Hélène Boudier, a écrit un roman de fantasy science-fiction, Raencêul. C'est excellent. Et de manière plus grand public, Franck Herbert, qui a habité à quelques pâtés de maison d'ici. Les films Dune sont bien, mais la trilogie des romans...

Nicolas GuyonJeff, c'était génial de faire l'épisode ensemble. Merci, tu nous as ouvert les portes de Hugging Face.

Jeff BoudierMerci Nico, je te dis à dans 18 mois, quand on aura 10 millions de modèles.

📬 Recevez les meilleurs insights IA chaque semaine

Veille, analyses et cas d'usage concrets dans votre boite mail.

S'abonner a la newsletter

Questions frequentes

🎙️A propos de votre hote

Nicolas Guyon

Formateur IA & Expert en Intelligence Artificielle Generative

Animateur du podcast Comptoir IA (160+ episodes, 50 000 ecoutes/mois), intervenant BFM Business et ambassadeur du Plan National IA, Nicolas accompagne les entreprises et les independants dans leur adoption de l'IA generative pour transformer leur activite. Ses formations IA en entreprise couvrent les fondamentaux de l'intelligence artificielle jusqu'aux cas d'usage avances de l'IA generative.

Ses clients : Hermes, Naval Group, ERAM, Arkopharma, Puig, CESI, SANEF...

Episodes similaires