Data Scientist expérimenté en Deep Learning - H/F

A propos de l'entreprise

Au cœur des enjeux de la planète, CLS, Tech4Good company, filiale du CNES et de la CNP, est une société à mission internationale, pionnière dans la fourniture de solutions d’observation et de surveillance de la Terre.

Opérateur historique des balises Argos, CLS, depuis 1986, avec plus de 1 000 salariés dans 35 sites dans le monde et un chiffre d’affaires annuel de près de 180 millions d’euros, figure parmi les spécialistes des services satellitaires en utilisant les technologies spatiales les plus avancées, couplées au génie logiciel et à la data-sciences.

Vous souhaitez rejoindre des équipes agiles et dynamiques sur des projets innovants et ambitieux ? Explorer de nouvelles technologies ? Evoluer sur des projets transverses et variés autour des 5 secteurs d’activité de CLS ?

Ceci est possible au sein de la Direction Advanced Tech dont le défi pour soutenir la croissance de CLS est de bâtir un socle solide et partagé au sein du groupe CLS pour l’ensemble de ses systèmes et services actuels et futurs !

Le DataLab de CLS est une structure interne d’innovation transverse au sein du groupe CLS, constituée de data scientists, de développeurs et d’ingénieurs Big Data. Son objectif principal est de concevoir des produits pour enrichir et valoriser la donnée dans les solutions CLS et de développer les pratiques data/IA au sein de CLS.  

Les data scientists travaillent à la fois sur des sujets d’innovation, de R&D et de production. Dans leur rôle transverse, ils sont amenés à collaborer avec les équipes métier de toutes les business units de CLS et travailler : 

  • Avec une grande diversité de données (données satellites optiques et radars, météo, données océaniques, trajectoires, télémétrie…) 
  • Sur différentes applications (segmentation sémantique, classification, prédiction, détection d’anomalies…) 
  • Sur différentes architecture  (statistiques, machine learning, deep learning), 
  • Pour de différents cas d’usage métier (plan d’occupation des sols, analyse de trajectoires, prédiction de données environnementales, analyses de comportement…) 

Dans ce cadre, nous recherchons un(e) Data Scientist expérimenté(e) en Deep Learning, capable de concevoir, entraîner et déployer des modèles d’apprentissage profond à fort impact.

A propos du poste

En tant que Data Scientist, vous devrez : 

  • Compréhension du besoin métier : analyser les problématiques exprimées, identifier les données disponibles et les contraintes techniques ou opérationnelles associées. 
  • Exploration et modélisation : évaluer les approches possibles (ML ou DL), implémenter des modèles les plus adaptés au problème, sur mesure ou dérivés des architectures SOTA issues de la littérature scientifique. 
  • Développement de modèles : 
  • Concevoir, entraîner et optimiser des architectures adaptées aux problématiques traitées, 
  • Gérer l’ensemble du pipeline de modélisation : préprocessing, augmentation de données, tuning d’hyperparamètres, évaluation robuste,  
  • Industrialiser les modèles via des outils de MLOps pour assurer leur déploiement, leur monitoring et leur scalabilité en production. 
  • Contribution aux appels d’offres : intervenir ponctuellement dans la phase de réponse (analyse du besoin, estimation des charges, rédaction des volets techniques). 
  • Amélioration continue : être force de proposition pour faire évoluer nos pratiques en data science (qualité du code, standardisation, outils collaboratifs, etc.) au sein du Datalab et plus largement dans l’entreprise. 
  • Vie d’équipe et veille : participer activement à la dynamique collective à travers le partage de connaissances, la veille technologique et les retours d’expérience. 

A propos du profil recherché

Ingénieur de formation ou titulaire de Master statistiques, mathématiques ou data science, vous avez une expérience significative (2+ ans) en développement de modèles de Deep Learning en environnement professionnel. 

Vous êtes : 

  • Rigoureux(se), doté(e) d’un esprit analytique dans la résolution de problèmes complexes., 
  • Curieux(se) d’apprendre et découvrir de nouveaux sujets, données, thématiques, technos, 
  • Autonome et collaboratif, 
  • A l’aise pour vulgariser vos travaux auprès d’interlocuteurs non techniques, 
  • Force de proposition pour participer activement à l’amélioration continue des pratiques data/IA. 

 

Vous maîtrisez :

  • Les techniques de Deep Learning (CNN, RNN, Transformers, GANs, etc..) 
  • Python et les librairies associées (pandas, sklearn, pytest), 
  • Le framework Pytorch et son écosystème (lightning, torchgeo), 
  • L’utilisation de Git, docker et les bonnes pratiques de développement de code 

 

Bonus si : 

  • Vous avez déjà travaillé sur des problématiques concrètes liées à l’océanographie, à la météorologie ou à d’autres domaines environnementaux, en exploitant des données spatio-temporelles complexes et souvent massives. 
  • Vous êtes à l’aise avec l’industrialisation des modèles via des outils comme MLflow, dvc, Docker, et vous avez contribué à des pipelines CI/CD pour automatiser le déploiement, le suivi et la mise à jour de modèles en production. 
  • Vous avez une expérience en entraînement distribué : vous avez déjà mis en œuvre des entraînements multi-GPU en optimisant les performances sur des infrastructures locales ou cloud. 

 

Enfin si pour vous l’esprit d’équipe est primordial, que vous êtes force de proposition, et que votre motivation est sans faille, alors n’hésitez plus, et venez nous rejoindre pour participer à accroître l’impact de l’équipe du Datalab de CLS.  

Avantages salariaux

Restaurant d’entreprise
6 semaines de congés payés et environ 12 jours de RTT
Télétravail
Reconnaissance (Intéressement avec abondement, primes exceptionnelles, primes de cooptation)
Politique d’entreprise en faveur de la diversité, de l'égalité professionnelle et de l'emploi des travailleurs handicapés
Compte épargne temps
CSE attractif (sport, participation voyages, etc…)
Package régime de Santé Mutuelle et Prévoyance très favorable (participation employeur élevée)
Parking à vélo et borne de recharge véhicules électriques