Intitulé de la matière : Programmation et analyse statistique avec R
Semestre : 02
Unité d’Enseignement : Méthodologique
Objectifs de l’enseignement :
Dans le domaine de l’analyse statistique, R est un des langages de programmation les plus utilisés et en même temps l’un des langages les plus simples à apprendre ! Il est particulièrement puissant pour l’analyse et la visualisation des données.
Ce cours va vous apprendre les bases du langage de programmation R, nécessaire pour évoluer dans le domaine de l’analyse statistique.
Vous apprendrez notamment à installer R et à appréhender l’environnement R Studio. Vous découvrirez ensuite les différents types d’objets que vous serez amenés à manipuler. Enfin, vous apprendrez à importer, analyser, exporter vos données et résultats et écrire vos propre fonctions !
Connaissances préalables recommandées :
L’étudiant doit avoir une base en statistique descriptive et maîtriser l’outil informatique
Contenu de la matière :
Chapitre1: Présentation du langage R
1) Premières instructions
2) Commandes élémentaires
Chapitre 2: Base du langage R
1)Les objets R
2) Vecteur
3) Matrice
4) Array
5) Data frame
6) Liste
7) TP's
8) Corrections des TP's
Chapitre3: Manipuler des données avec R
1) Importer et exporter des données
2) Analyser des jeux de données
Chapitre 4: Graphiques
1) Graphiques
2) TP et correction
Chapitre 5: Statistique avec R
1) Variables aléatoires.
2) Statistique descriptive avec R.
3) Régression linéaire simple et multiple avec R.
4) TP et correction.
Chapitre 6 : Structure de fonction et fonctions
1) Structure de contrôle.
2) Fonctions.
3) TP et correction.
Chapitre 7: Compléments
1) Estimation ponctuelle et tests paramétriques.
2) Application : Loi des grands nombres, TCL, Approximations des lois.
Chapitre 8 : Fonctions d'optimisation
- Fonction nlm.
- Fonction optim.
- Fonction uniroot.
Chapitre 9 : Examens et controles
Références
- (en) Ross Ihaka et Robert Gentleman, « R: A language for data analysis and graphics », Journal of Computational and Graphical Statistics, vol. 5, , p. 299-314 (DOI 10.2307/1390807, lire en ligne [archive])
- (en) Ashley Vance, « Data Analysts Captivated by R’s Power », The New York Times, (lire en ligne [archive])
- (en) Sylvia Tippmann, « Programming tools: Adventures with R », Nature, vol. 517, , p. 109–110 (DOI 10.1038/517109a)
- (en) Hadley Wickham, Ggplot2 : Elegant Graphics for Data Analysis, Springer, coll. « Use R »,
- (en) Hadley Wickham, Advanced R, Chapman & Hall/CRC, coll. « The R Series », 1re éd. (lire en ligne [archive])
- (en) Hadley Wickham, R Packages : Organize, Test, Document, and Share Your Code, O'Reilly Media, (lire en ligne [archive])
- (en) Garrett Grolemund et Hadley Wickham, R for Data Science, O'Reilly, (lire en ligne [archive])
- Millot Gaël, Comprendre et réaliser les tests statistiques à l'aide de R, Éditions De Boeck, , 806 p. (présentation en ligne [archive])
- Husson F, Pagès J et Lê S, Analyse de données avec R, Presses Universitaires de Rennes
- (en) Julia Silge et David Robinson, Text Mining with R : A Tidy Approach, O'Reilly, (lire en ligne [archive])
- https://cran.r-project.org/doc/contrib/Goulet_introduction_programmation_R.pdf
Mode d’évaluation :
Controle et examen final...
Ce cours contient 3h TP et h1:30 de cours et il a un coefficient 3 et un nombre de crédit 6