DATA SCIENTIST

  • Partager
  • Envoyer à un ami
  • Imprimer
DATE DE PUBLICATION17/03/2026 TYPE DE CONTRATCDI
RECRUTEURGROUPE CAISSE DES DEPOTS CATÉGORIEA
LIEUX DE TRAVAIL
Paris 13e Arrondissement
 SALAIRE
Non communiqué
CODE POSTAL
75013
 VALABLE JUSQU'AU
16/05/2026

Poste

Au sein de la Direction des prêts de la Banque des Territoires, vous rejoignez l'équipe DPHD80 Data Etudes et Pilotage en tant que Data Scientist. Votre mission principale consistera à concevoir et mettre en œuvre des outils de traitement automatique du langage (NLP) pour analyser, classifier et extraire automatiquement des informations à partir des documents textuels liés aux dossiers de prêt.
Vous pourrez être amené(e), ponctuellement et lorsque cela sera nécessaire, à participer à l'activité de production de données du service.
Les missions à réaliser seront notamment les suivantes :
1. Traitement automatique du langage et text mining
• Mise en œuvre d'algorithmes de text mining et de traitement automatique du langage sur les documents de la Direction des prêts (pièces justificatives, documents de dossier, etc.).
• Développement de chaînes de traitement pour :
• L'extraction automatique d'informations (ex. NER, extraction de champs structurés),
• La classification de documents (typologie des pièces...),
• L'amélioration de la qualité des données (normalisation...).

• Utilisation de différentes approches statistiques et de modèles de machine learning, y compris modèles les plus récents de réseaux de neurones, afin de constituer automatiquement des bases de données à partir des documents textuels et d'en fiabiliser le contenu.
Vous participerez à la conception et au développement de services basés sur ces technologies, à destination des Clients et équipes de la Direction des Prêts.


2. Industrialisation et bonnes pratiques de développement
Vous participerez à l' industrialisation et à la bonne mise en œuvre des outils de Data Science utilisés à DPHD80 :
• Gestion et structuration du code, développement de packages internes, rédaction de documentation.
• Contribution à la mise en place des bonnes pratiques (typage, qualité du code, versionnage Git/Bitbucket, etc...).
• Utilisation de Docker pour emballer et déployer les applications de data science.


3. Analyse / collecte / enrichissement de données
• Exploitation de bases de données, notamment en open data, afin d'enrichir les informations issues des documents (bases SQL, fichiers Parquet...).
• Récupération d'informations complémentaires par web scraping, lorsque pertinent.


4. Utilisation de LLM et développement de ChatBot
• Utilisation de différents LLM (Large Language Models) pour faciliter l'analyse des documents sous forme de textes ou autres (tableaux, graphiques, etc.) et constituer des bases d'entrainement de plus petits modèles.
• Participation au développement d'un ChatBot pour répondre à des questions sur les documents, les procédures ou les données disponibles et produire de courts documents (notes thématiques, mails destinés aux clients, etc.)
• Contribution à la veille sur les nouvelles méthodes et outils en NLP et IA générative.

Profil

Vous avez :
• Une formation scientifique supérieure (BAC+5).
• Une solide expérience en programmation Python.
• La maîtrise (ou une bonne connaissance) des bibliothèques suivantes est appréciée :
• Pandas, scikit-learn pour la data science,
• TensorFlow et/ou PyTorch pour les approches par réseaux de neurones.

• Une forte appétence pour la Data Science et les dernières évolutions dans le domaine de l' IA et du deep learning, en particulier pour le traitement automatique du langage.
• Une capacité à construire des solutions opérationnelles et industrialisables pertinentes pour les besoins du service.
Vous disposez des capacités personnelles suivantes :
• Qualités d'analyse, de synthèse et de rédaction.
• Bonnes qualités relationnelles et capacité à travailler avec différents interlocuteurs (métier, IT, data).
• Curiosité, rigueur, autonomie et capacité à faire des propositions innovantes.

Employeur

Qui sommes-nous ?

Nous sommes un établissement financier public remplissant des missions d’intérêt général en appui des politiques publiques. Une mission qui nous est confiée par la loi. Avec nos filiales, nous constituons un grand pôle financier à l'intersection du domaine public et du secteur privé concurrentiel.

Que faisons-nous ?

Depuis plus de 200 ans, nous jouons un rôle majeur dans la transformation de la France. Nous sommes présents sur l’ensemble du territoire et à chaque étape de la vie des Français. Face aux défis que notre pays doit relever, nous mobilisons l’ensemble de nos ressources et de nos expertises pour :

  • la transformation écologique 
  • le développement et les souverainetés  économiques (énergétique, économique, industrielle, numérique et financière) 
  • la cohésion sociale et territoriale

Qu’est-ce qui nous anime ?

L’intérêt général, la confiance et le long terme.

 

Offres d’emploi similaires à DATA SCIENTIST

GROUPE CAISSE DES DEPOTS

Responsable de périmètre applicatif – SIGMA Back-Office F/H

CDI | 09/02/2026 | GROUPE CAISSE DES DEPOTS

GROUPE CAISSE DES DEPOTS

PILOTE DE SOLUTIONS CONSIGNATIONS ET DÉPÔTS SPÉCIALISÉS F/H

Titulaire | 17/03/2026 | GROUPE CAISSE DES DEPOTS

GROUPE CAISSE DES DEPOTS

Chef - cheffe de projet - Dépt Appui aux métiers, pilotage de l'activité F/H (Paris)

Titulaire | 17/03/2026 | GROUPE CAISSE DES DEPOTS

Les informations à caractère personnel recueillies font l’objet d’un traitement par Emploipublic.fr du Groupe Moniteur RCS Nanterre B 403 080 823. Elles sont nécessaires entre autres, à la création de votre compte et sont enregistrées dans nos fichiers. Groupe Moniteur ou toutes sociétés du groupe Infopro Digital pourront utiliser ces fichiers afin de vous proposer des produits et/ou services analogues. Pour exercer vos droits, vous y opposer ou pour en savoir plus : Charte des données personnelles.