Généré automatiquement par Postule AI à partir de l’offre.
À propos de Capgemini
Capgemini est un leader mondial, responsable et multiculturel, regroupant 325 000 personnes dans plus de 50 pays. Partenaire stratégique des entreprises pour la transformation de leurs activités en tirant profit de toute la puissance de la technologie, le Groupe est guidé au quotidien par sa raison d'être : libérer les énergies humaines par la technologie pour un avenir inclusif et durable.
Fort de 55 ans d'expérience et d'une grande expertise des différents secteurs d'activité, Capgemini est reconnu par ses clients pour répondre à l'ensemble de leurs besoins, de la stratégie et du design jusqu'au management des opérations, en tirant parti des innovations dans les domaines en perpétuelle évolution du cloud, de la data, de l'Intelligence Artificielle, de la connectivité, des logiciels, de l'ingénierie digitale et des plateformes.
Le poste
Au sein de nos équipes projet, vous contribuerez au développement de solutions digitales innovantes pour des clients grands comptes dans les secteurs banque, assurance, énergie et industrie. Vous intégrerez une équipe pluridisciplinaire, organisée en mode Agile, et intervenant sur des projets à fort impact métier.
Missions principales
- Concevoir, développer et maintenir des pipelines de données robustes en utilisant Scala, PySpark ou Hadoop
- Optimiser les traitements distribués et assurer la performance des jobs sur des clusters Big Data
- Intégrer et transformer des données provenant de sources variées en utilisant Hive et autres outils du stack Hadoop
- Collaborer avec les équipes Data Science et BI pour fournir des datasets fiables et scalables
- Garantir la qualité, la sécurité et la gouvernance des données dans un environnement Big Data
Profil recherché
- Diplôme en Informatique, Data Engineering ou domaine similaire
- Expérience confirmée (5+ ans) en développement Big Data avec Scala, PySpark, Hadoop et Hive
- Bonne maîtrise des concepts de traitement distribué, parallélisme et optimisation des performances
- Connaissance des écosystèmes Big Data (HDFS, YARN, Spark SQL) et des bonnes pratiques de data engineering
- Capacité à travailler en équipe, sens de l'analyse et aptitude à résoudre des problèmes complexes
Cette description d'emploi a pu être reformatée par Postule pour améliorer sa lisibilité et sa présentation. Le contenu et les informations restent fidèles à l'offre d'emploi originale. .
