Data scientist

Métiers

Data scientist

Le Data scientist valorise les données massives récupérées par l'entreprise en vue d'en tirer un avantage économique, commercial et concurrentiel. Il crée de nouvelles sources de données, parfois à partir de celles existantes, et conçoit des algorithmes et autres modèles de données prédictifs.

Appelé aussi :
  • Ingénieur Big data
  • Chargé de modélisation des données
  • Ingénieur Data scientist
  • Expert marketing data
  • Data engineer
Niveau(x) de formation indicatif(s)

Métier accessible aux personnes ayant suivi ce ou ces niveaux de formation (cf. "cadre européen des certification")

CAP
Niveau 3

BAC
Niveau 4

BAC +2
Niveau 5

BAC +3
Niveau 6

BAC +5 et +
Niveau 7 et +

Activités principales

Le Data scientist identifie les données pertinentes qui caractérisent un phénomène ou qui peuvent permettre de prédire son évolution. Il adapte toute la chaîne d'acquisition, de traitement et d'exploitation des données en fonction de la ou des problématiques métiers exprimées. Ses activités principales sont :

  • Analyse des besoins des métiers de l'entreprise et identification de la technologie opportune
  • Organisation de la récupération, de la structuration et de la préparation des données pour les rendre exploitables
  • Identification et assemblage par des technologies existantes (ex. : blocs d'algorithme ou approche mathématique)
  • Développement des modèles statistiques de prédiction et communication avec des outils de datavisualisation

Différents Contextes du Métier

Pour le Data scientist, les besoins de ses interlocuteurs métiers varient selon les secteurs d'activités, notamment en termes de besoins de prises de décisions, de prédictions nécessaires et de données disponibles.

  • Aéronautique : prédictions de trajectoires de vol optimisées selon les variables de vol
  • Automobile : analyse des données de conduite enregistrées par les véhicules en vue d'une adaptation de la conception aux besoins des conducteurs.

Les technologies de Data Science qu'il utilise évoluent et se combinent pour construire des solutions de plus en plus fines.

  • Cloud : Exploitation des capacités de stockage ou de calcul croissantes pour limiter la sollicitation de l'architecture technique locale
  • Robotique / Cobotique : Intégration des systèmes robotiques et cobotiques pour automatiser et optimiser des tâches complexes
  • Internet des objets / capteurs : Collecte et traitement de données issues de capteurs et dispositifs connectés
  • Modélisation / simulation (avec une évolution possible vers le jumeau numérique) : Création de modèles virtuels pour tester, analyser et prédire le comportement des systèmes dans différents scénarios

Le Data scientist doit optimiser toutes les étapes industrielles ou de créer de nouvelles solutions non existantes.

  • Fabrication : optimisation des cadences de production en fonction de nouvelles variables externes (logistique, commerciales, météo, etc.)
  • Maintenance : traitement de données issues de capteurs placés sur le système de production en vue d'anticiper des pannes et de déclencher une maintenance dite prédictive

Le Data Scientist prend en compte une composante réglementaire et éthique qui est très présente dans son domaine. Celle-ci encadre les travaux de l'entreprise en la matière.

  • Norme Européenne : protection des données personnelles ou qui pourraient permettre d'identifier des données personnelles (RGPD)
  • Propriété intellectuelle / industrielle : définition des limites d'utilisation des données ou métadonnées

Compétences Métier Principales macro-compétences et compétences associées nécessaires à l'exercice du métier

Techniques

Collecter et préparer les données

Intégrer et traiter de grands volumes de données (structurées, non structurées, temps réel)
Créer des jeux de données d'entraînement fiables et documentés
Garantir la reproductibilité et la qualité des pipelines de données

Concevoir, entraîner et évaluer des modèles statistiques et prédictifs

Choisir les variables pertinentes pour la modlisation d'un problème métier
Choisir les algorithmes adaptés (régression, classification, clustering, NLP, deep learning, ..)
Permettre l'explicabilité de l'algorithme et de ses fonctionnalités

Déployer un modèle d'apprentissage automatique

Intégrer les modèles dans des environnements de production ou quasi-production (API, batch, temps réel), assurer leur suivi et mise à jour

Transverses

  • Transition numérique

    Par la mise en œuvre de la compétence, le métier agit positivement sur la transition écologique (picto transition écologique) ET/OU sur la performance et la pérennité de l'entreprise, grâce à l'utilisation de technologies numériques (picto transition numérique)

  • Transition écologique

    Par la mise en œuvre de la compétence, le métier agit positivement sur la transition écologique (picto transition écologique) ET/OU sur la performance et la pérennité de l'entreprise, grâce à l'utilisation de technologies numériques (picto transition numérique)

Organiser un projet

Analyser et gérer les risques globaux (industriels, projet, cybersécurité, environnement, etc.)
Planifier et répartir les tâches selon le besoin d'expertise et la charge de travail
Coordonner des équipes pluridisciplinaires et organiser une communication efficace entre les parties prenantes du projet

Mener et intégrer une veille

Organiser une veille technologique sur l'évolution des technologies, procédés et méthodes
Assurer une veille permanente sur les normes et la règlementation et suivre l'ensemble des tendances quantitatives et qualitatives autour d'une problématique
Développer l'usage de nouvelles technologies, dont des solutions d'IA, et insuffler de nouvelles méthodes de travail auprès des équipes

Contribuer à la cybersécurité de l'entreprise

Reconnaître et traiter les données sensibles notamment face à une utilisation de l'IA
Assurer la cybersécurité des données numériques
Intégrer le risque de cybercriminalité dans ses activités

Comportementales

S'adapter à des situations diversifiées

Anticiper les évolutions rapides des technologies et des usages
Adapter ses méthodes et son organisation à la diversité, à l'incertitude et à la complexité des situations
Se montrer agile et proactif dans ses démarches (intrapreneuriat)

Assurer une communication constructive avec l'ensemble des collaborateurs

Transmettre les informations utiles au projet et communiquer avec l'ensemble des collaborateurs concernés
Entretenir des relations constructives pour favoriser la collaboration entre les différents interlocuteurs
Travailler seul ou en équipe grâce à des outils et des méthodes partagées, en réseau et à distance

Transmettre des savoir-faire et des connaissances

Expliquer une méthode de travail, de manière fluide et partager les échecs et les réussites
Partager son expérience, transmettre les gestes techniques et les bonnes pratiques du métier
Assurer une montée en compétence de l'équipe de travail

Le métier en images Certaines vidéos peuvent avoir été tournées en période Covid-19, d’où le port du masque que l'on ne retrouve pas dans un contexte normal.

Voies d'accès possibles au métier

Diplômes

Liste non exhaustive, à titre indicatif

  • Master - Mention Mathématiques appliquées, statistique
  • Master - MIAGE - parcours ingénierie des données et décision/sciences des données et systèmes décisionnels/big data: décisionnel et apprentissage
  • Master - Mention Mathématiques et applications
  • Master - mention Informatique-Parcours data science/Ingénierie des sciences de données/IA et science des données/Bases de données, IA
  • Diplôme d'ingénieur - Ecole nationale de la statistique et de l'analyse de l'information

Notre site utilise des cookies pour mesurer l’audience et vous proposer des services personnalisés. Consulter la politique cookies

Gestion de mes cookies

Notre site utilise des cookies pour mesurer l’audience et vous proposer des services personnalisés.
Consulter la politique cookies

Préférences d'utilisation

Ce cookie unique nous permet de sauvegarder vos préférences en matière de gestion de cookies. Il est requis pour l'utilisation du site et ne peut être désactivé. Il expire après six mois. Vous pouvez le supprimer en supprimant votre historique de navigation.

  • Gestion des cookies

Fonctionnalités du site

Ces cookies nous permettent le bon fonctionnement de la sélection sur le site lorsque l'utilisateur n'est pas connecté à son compte.

  • Ma sélection

Mesures statistiques

Ces cookies nous permettent d'obtenir des mesures sur la fréquentation de notre site (ex. : nombre de visites, pages les plus consultées). L'Observatoire Prospectif et Analytique des Métiers et Qualifications de la Métallurgie utilise ces données pour identifier les dysfonctionnements éventuels du site, et les améliorations à apporter.

  • Google Analytics

Médias

Les cookies déposés via les services de partage de médias ont pour finalité de permettre à l’utilisateur de visionner directement sur le site le contenu multimédia.

  • Vidéos YouTube
  • Vidéos Vimeo

Réseaux sociaux

Les cookies qui sont déposés via les boutons réseaux sociaux ont pour finalité de permettre aux utilisateurs du site de faciliter le partage de contenu et d’améliorer la convivialité.

  • AddToAny

Protection du spam

Les cookies déposés via les services de protection du spam.

  • Recaptcha