Ingénieur Big Data - Scala, PySpark, Hadoop

Décryptage du poste par Postule AI

Résumé du rôle

Capgemini recherche un Ingénieur Big Data expérimenté pour rejoindre ses équipes projet à Casablanca. Vous développerez des solutions digitales innovantes pour des clients grands comptes dans les secteurs banque, assurance, énergie et industrie. Le poste requiert une expertise confirmée (5+ ans) en développement Big Data avec Scala, PySpark, Hadoop et Hive. Vous travaillerez au sein d'équipes pluridisciplinaires en mode Agile sur des projets à fort impact métier, en concevant des pipelines de données robustes et en optimisant les traitements distribués.

Exigences clés (estimation)

Concevoir, développer et maintenir des pipelines de données robustes avec Scala, PySpark ou Hadoop
Optimiser les traitements distribués et assurer la performance des jobs sur des clusters Big Data
Intégrer et transformer des données de sources variées en utilisant Hive et autres outils du stack Hadoop
Collaborer avec les équipes Data Science et BI pour fournir des datasets fiables et scalables
Garantir la qualité, la sécurité et la gouvernance des données dans un environnement Big Data

Compétences

Développement Big Data avec Scala, PySpark, Hadoop et Hive (5+ ans d'expérience)Maîtrise des concepts de traitement distribué, parallélisme et optimisation des performancesConnaissance des écosystèmes Big Data (HDFS, YARN, Spark SQL)Bonnes pratiques de data engineering et gouvernance des donnéesTravail en équipe et méthodologie AgileSens de l'analyse et résolution de problèmes complexesDiplôme en Informatique, Data Engineering ou domaine similaire

Niveau estimé

Ce poste requiert une expérience confirmée de 5 ans ou plus en développement Big Data, avec une maîtrise avérée des technologies Scala, PySpark, Hadoop et Hive, ainsi qu'une bonne connaissance des écosystèmes Big Data et des bonnes pratiques de data engineering.

Attributs détectés par l’IA (si absents de l’offre)

Type de poste: CDI
Niveau d'expérience: 5–10 ans
Fonction: Data / BI
Secteur: Informatique / IT
Niveau d'études: Ingénieur / École d'ingénieurs
Langues: Français

Cette analyse a été générée automatiquement par Postule AI à partir de l'offre.

À propos de Capgemini

Capgemini est un leader mondial, responsable et multiculturel, regroupant 325 000 personnes dans plus de 50 pays. Partenaire stratégique des entreprises pour la transformation de leurs activités en tirant profit de toute la puissance de la technologie, le Groupe est guidé au quotidien par sa raison d'être : libérer les énergies humaines par la technologie pour un avenir inclusif et durable.

Fort de 55 ans d'expérience et d'une grande expertise des différents secteurs d'activité, Capgemini est reconnu par ses clients pour répondre à l'ensemble de leurs besoins, de la stratégie et du design jusqu'au management des opérations, en tirant parti des innovations dans les domaines en perpétuelle évolution du cloud, de la data, de l'Intelligence Artificielle, de la connectivité, des logiciels, de l'ingénierie digitale et des plateformes.

Le poste

Au sein de nos équipes projet, vous contribuerez au développement de solutions digitales innovantes pour des clients grands comptes dans les secteurs banque, assurance, énergie et industrie. Vous intégrerez une équipe pluridisciplinaire, organisée en mode Agile, et intervenant sur des projets à fort impact métier.

Missions principales

Concevoir, développer et maintenir des pipelines de données robustes en utilisant Scala, PySpark ou Hadoop
Optimiser les traitements distribués et assurer la performance des jobs sur des clusters Big Data
Intégrer et transformer des données provenant de sources variées en utilisant Hive et autres outils du stack Hadoop
Collaborer avec les équipes Data Science et BI pour fournir des datasets fiables et scalables
Garantir la qualité, la sécurité et la gouvernance des données dans un environnement Big Data

Profil recherché

Diplôme en Informatique, Data Engineering ou domaine similaire
Expérience confirmée (5+ ans) en développement Big Data avec Scala, PySpark, Hadoop et Hive
Bonne maîtrise des concepts de traitement distribué, parallélisme et optimisation des performances
Connaissance des écosystèmes Big Data (HDFS, YARN, Spark SQL) et des bonnes pratiques de data engineering
Capacité à travailler en équipe, sens de l'analyse et aptitude à résoudre des problèmes complexes

Cette description d'emploi a pu être reformatée par Postule pour améliorer sa lisibilité et sa présentation. Le contenu et les informations restent fidèles à l'offre d'emploi originale. .