#212 - BlaBlaCar : Déployer un projet GenAI qui rapporte 1 million par an
Raphaël Berly est Data Science Lead chez BlaBlaCar, la licorne française qui a l’une des équipes Data les plus matures en France. Aujourd’hui, on parle de son plus gros challenge de ces dernières années : déployer un projet GenAI qui rapporte 1 million d’euros par an à BlaBlaCar.On aborde :🔥 Le contexte autour de ce projet GenAI : la modération🔥 Comment la solution fonctionne : zoom sur l’embedding🔥 Les 2 axes méthodologiques du projet, l’organisation & la stack GenAI🔥 Les plus grosses difficultés & les prochaines étapes du projet💪 VOUS AVEZ UN PROJET DATA ?DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.👉 Nous rencontrer ici📚 RESSOURCES- Le LinkedIn de Raphaël- Ses articles Medium sur la place du Machine Learning chez BlaBlaCar- Les Règles du Machine Learning de Google- L'édition spéciale "Les 40 chantiers Data & IA à lancer en 2025" de notre newsletter🎬 CHAPITRES00:00 La modération de texte chez BlaBlaCar03:00 Comment ça fonctionne ?05:45 L’embedding : définition et avantages09:32 Les 2 axes méthodologies clés du projet14:21 La stack GenAI17:03 L’orga de l’équipe18:27 Leurs plus gros challenges23:51 Les prochaines étapes du projet25:33 Les questions de la fin🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#188 - Le VP Data de BlaBlaCar partage ses 3 priorités de 2025, avec Blef#196 - Pigment : Monter l'équipe GenAI appliquée au Produit (Licorne, +230 millions levés)#192 - Gorgias : Mettre en place une approche Self-Service Analytics grâce aux IA Génératives👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
--------
28:18
#211 - Brevo : Mettre en place une approche DataOps
Antoine Tanguy est DataOps chez Brevo, la licorne française qui propose une solution de marketing automation. Arrivé il y a 4 ans chez Brevo, il a évolué du poste de SRE vers celui de Data Ops il y a 1 an et demi. Il accompagne une équipe Data de 15 personnes répartie en 3 sous-équipes : Data Science, Data Engineering et Data Analytics.On aborde :🔥 Le rôle et les missions d’un DataOps chez Brevo🔥 Les chantiers concrets : MLOps avec ZenML, Semantic Layer avec Cube.js, CI/CD avec Terraform et GitHub🔥 Les plus grosses difficultés du DataOps : cibler le besoin, comprendre son interlocuteur, rester pragmatique…🔥 Les prochaines étapes de l’équipe : renforcer le MLOps, adopter Kafka, recruter un 2ème Data Ops📚 RESSOURCES- Le LinkedIn d'Antoine- La Newsletter TLDR- L'édition spéciale "Les 100+ ressources des leaders data invités sur DataGen" de notre newsletter🎬 CHAPITRES00:00 Le parcours d’Antoine02:46 Les chantiers d’un DataOps10:23 Ses principales difficultés13:45 Ses prochaines étapes16:17 Les questions de la fin🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#184 - Brevo : Mettre en place de l’Embedded Analytics dans le Produit#142 - Brevo : Structurer l’équipe Data d’un centaure#143 - Tout comprendre sur le DataOps💪 VOUS AVEZ UN PROJET DATA ?DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.👉 Nous rencontrer ici👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
--------
19:28
#210 - Informatica : Préparer ses données pour l’IA
Are Hegdal est un Expert Data Management. Il travaille chez Informatica depuis 5 ans et est dans la data depuis presque 20 ans. Informatica est un leader mondial du secteur du Data Management. Ils ont été rachetés 8 milliards de dollars par Salesforce en 2025.On aborde :🔥 La genèse et les grandes briques d’Informatica (Intégration, Vision 360°, Data Quality…)🔥 Leur positionnement sur le marché (plateforme globale, approche neutre, R&D…)🔥 2 cas d’usage Data & GenIA dans la Pharma et l’Assurance🔥 L’impact de la GenAI sur Informatica depuis quelques années❤️ PARTENAIRECe podcast est rendu possible par Informatica, leader mondial du Data Management utilisé par des grands groupes comme Sanofi, Apple mais aussi des plus petites comme Garance en France.👉 S’inscrire aux cafés de la data d’Informatica👉 Contacter Are sur LinkedIn📚 RESSOURCES- Le LinkedIn d'Are- Le podcast Business de McKinsey- Le podcast Business du BCG- L'édition spéciale "Les 40 chantiers Data & IA à lancer en 2025" de notre newsletter🎬 CHAPITRES00:00 Informatica en quelques mots02:07 Les grandes briques d’Informatica05:04 Son positionnement face aux concurrents08:51 Les types de clients10:21 2 cas d’usage : Pharma et Assurance17:10 L’impact de la Gen AI20:32 Leurs webinars Data Management21:03 La recommandation de contenu d’Are🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#205 - La Lead Data Scientist de Pernod Ricard partage sa stratégie (orga, stack, projets)#168 - Comprendre les rôles clés de la Data Gouvernance avec Charlotte Ledoux (30K abonnés LinkedIn)#144 - Mettre en place une Data Gouvernance avec Charlotte Ledoux (20K abonnés LinkedIn)👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
--------
23:30
#209 - Mirakl : Déployer des Agents IA pour le Business
Laure Menissier est AI & Analytics Director chez Mirakl, la licorne française qui accompagne les entreprises sur le développement de leur eCommerce avec des solutions SaaS notamment pour la marketplace ou le retail media, et qui a réalisé une levée de fonds record de 555 millions de dollars.On aborde :🔥 Le contexte et le lancement d’un pilote avec Dust🔥 Des exemples d’Agents IA qu’ils ont déployés (Support, RFP, onboarding…)🔥 Les plus gros challenges : évangélisation sur les attentes et formation🔥 La stack déployée et leur objectif de l’année : 50% des collaborateurs ont créé leur agent💪 DEVENIR ANALYTICS ENGINEER AVEC DATABIRD ET DATAGENOn a lancé un bootcamp spécialisé sur l’Analytics Engineering en collaboration avec DataBird.📚 Découvrir le programme du bootcamp🎙 Regarder l’épisode 151 Devenir Analytics Engineer en 6 semainesDataGen opère ce bootcamp Analytics Engineering en collaboration avec DataBird et donc touche une commission sur les inscriptions. 🙂📚 RESSOURCES- Le LinkedIn de Laure- Les postes à pourvoir chez Mirakl- La chaîne YouTube 3Blue1Brown- La plateforme de formation DeepLearning.ai- Les meetups Generative AI Paris- L'édition spéciale Les 100+ ressources des leaders data invités sur DataGen de notre newsletter🎬 CHAPITRES00:00 Laure & Mirakl en quelques mots03:41 Le contexte autour du déploiement des Agents IA05:40 Les étapes & l’organisation du projet07:32 Les agents types qu’ils ont déployés11:51 La stack centrée sur Dust16:23 Les plus gros challenges de Laure dans le cadre de ce projet23:33 Les questions de la fin (recommandations, conseils…)🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#197 - Salesforce : Déployer des agents IA dans le Retail avec Agentforce#172 - Mirakl : Intégrer la GenAI dans le Produit #159 - Malt : Mettre en place un assistant IA pour booster l'efficacité en interne (Dust, Gemini…)👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
--------
25:42
#208 - Alan : Déployer des algorithmes pour lutter contre la fraude
Gabrielle Prat est dans l'équipe Data chez Alan, la licorne française qui a révolutionné la complémentaire et la mutuelle santé. Avec 500 millions d'euros de revenus annuels, c'est l'un des plus beaux succès de la startup nation. Aujourd’hui, elle revient sur la stratégie Data Science qu’ils ont mis en place pour lutter contre la fraude à l’assurance.On aborde :🔥 Qu’est-ce que la fraude à l’assurance et quel est l’enjeu pour Alan ?🔥 Les 4 étapes du projet : Data Mining, Rule-based, Machine Learning et UX🔥 Le déploiement d’agents IA pour augmenter l’équipe Ops🔥 La culture chez Alan (transparence radicale, peu de meetings, culture de l’écrit…)📅 VOUS AVEZ ENTENDU PARLER DE L'IA SUMMIT A LILLE LE 1ER JUILLET ?La Cité de l'IA Summit à Lille est le rendez-vous dédié à l’Intelligence Artificielle et à la Data. Il aura lieu le 1er juillet 2025 de 8h30 à 18h45 à Marcq-en-Baroeul (59). 📚 Découvrir l'événement🎙 Découvrir le programmeCeci n'est pas une collaboration commerciale. :)📚 RESSOURCES- Le LinkedIn de Gabrielle- L’article Why data-driven product decisions are hard de Andrew Chen- L'édition spéciale Les 40 chantiers Data & IA à lancer en 2025 de notre newsletter🎬 CHAPITRES00:00 Alan en quelques mots04:24 L’équipe Data chez Alan09:15 Les différents types de fraude13:06 Etape 1 : Data mining14:18 Etape 2 : Rule based17:25 Etape 3 : Machine learning18:48 Etape 4 : UX21:03 Mise en place d’agents IA25:44 La culture chez Alan29:45 Les questions de la fin (incl. ses ressources pref)🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#170 - Leboncoin : De la Data Science au ML Engineering#166 - Defacto : Déployer des algorithmes pour scorer la solvabilité des entreprises#162 - Le Lead Data Science de Back Market partage leur stratégie GenAI💪 VOUS AVEZ UN PROJET DATA ?DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.👉 Nous rencontrer ici👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
DataGen est un podcast qui permet de comprendre les stratégies data des plus belles boîtes en France. Je m'appelle Robin Conquet et chaque semaine j'invite un expert de la data pour décrypter ses problématiques. BlaBlaCar, Doctolib, Pernod Ricard, Deezer et bien d'autres, dans ce podcast, tu découvriras comment les entreprises qui réussissent utilisent la data. Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.