Passer au contenu principal
RS5073

Analyse statistique de données avec le langage R

Page France Compétence
Description Le titulaire de la certification est capable, dans une démarche de data science menée par son organisation, d'intégrer et de traiter des données, et de produire un rapport en utilisant de manière appropriée le langage de programmation R. Le titulaire de la certification est capable de mettre en place un processus de traitement des données sous R qui est reproductible avec différents jeux de données. Cette certification permet à tous les acteurs de l'entreprise d'acquérir les compétences permettant de comprendre et valoriser les données de son organisation ou auxquelles son organisation a accès.
Objectif
  •  Importer des données dans l'environnement R, en utilisant le(s) package(s) adéquat(s) et les lignes de code adaptées aux données, afin de vérifier leur qualité et réaliser leur mise en forme
  • Visualiser des données importées dans l'environnement R sous forme de graphiques, tableaux et d'indicateurs statistiques adaptés à leur nature (moyennes, médianes et écarts-types )
  • Interpréter les indicateurs statistiques produits dans l'environnement R pour identifier des erreurs de saisie ou de collecte et les corriger à l'aide des lignes de code appropriées, afin de rendre le jeu de données complètement exploitable.
  • Sélectionner des variables et des indicateurs statistiques pertinents en fonction des données ou de la commande, produire des tableaux et des graphiques mis en forme, permettant de comprendre et interpréter les données, en rédigeant les lignes de codes adaptées, afin de produire un rapport pour un tiers.
Niveau Sans équivalence de niveau
Date de validité 27/01/2023
Domains
  • Data Warehouse
NSF
  • Informatique, traitement de l'information, réseaux de transmission
  • Informatique, traitement de l'information, réseaux de transmission des données
GFE
Rome
Nom légal Rôle