Entreprise :
Capgemini est un leader mondial, responsable et multiculturel, regroupant 325 000 personnes dans plus de 50 pays. Partenaire stratégique des entreprises pour la transformation de leurs activités en tirant profit de toute la puissance de la technologie, le Groupe est guidé au quotidien par sa raison d’être : libérer les énergies humaines par la technologie pour un avenir inclusif et durable.
Fort de 55 ans d’expérience et d’une grande expertise des différents secteurs d’activité, Capgemini est reconnu par ses clients pour répondre à l’ensemble de leurs besoins, de la stratégie et du design jusqu’au management des opérations, en tirant parti des innovations dans les domaines en perpétuelle évolution du cloud, de la data, de l’Intelligence Artificielle, de la connectivité, des logiciels, de l’ingénierie digitale et des plateformes. Le Groupe a réalisé un chiffre d'affaires de 18 milliards d'euros en 2021.
Poste :
Au sein de nos équipes projet, vous contribuerez à la mise en œuvre de solutions d’intégration de données pour des clients grands comptes dans les secteurs banque, assurance, énergie et industrie. Vous intégrerez une équipe pluridisciplinaire, organisée en mode Agile, et intervenant sur des projets à fort impact métier.
En tant qu’Ingénieure/Ingénieur Databricks, vous interviendrez dans des missions variées telles que :
- Concevoir et développer des pipelines de données performants et scalables sur Databricks.
- Exploiter les fonctionnalités avancées de Apache Spark via PySpark pour le traitement de données massives.
- Participer à la modélisation des données, à l’optimisation des performances et à la mise en place de bonnes pratiques.
- Collaborer avec les équipes Data Science, BI et métier pour répondre aux besoins business.
- Intégrer les solutions dans des environnements CI/CD, avec des outils comme Git, Azure DevOps, Terraform.
- Encadrer techniquement les profils juniors et contribuer à la veille technologique.
Profil recherché :
- Diplômé(e) d’un Bac+5 en informatique ou équivalent.
- Expérience confirmée (≥ 5 ans) sur un poste similaire.
- Expérience confirmée en ingénierie de données avec Databricks.
- Maîtrise de PySpark, SQL, et des environnements cloud (Azure, AWS ou GCP).
- Connaissance des outils d’orchestration (Airflow, Azure Data Factory, etc.).
- Sens de l’analyse, autonomie, rigueur et capacité à travailler en équipe.
- Une certification Databricks ou cloud est un plus.
