Introduction Au Traitement de Donnees Avec R

download Introduction Au Traitement de Donnees Avec R

of 57

description

Intropduction to R in French

Transcript of Introduction Au Traitement de Donnees Avec R

  • Introduction au Traitement de Donnes avec R

  • Quest-ce que cest que R?Logiciel Libre

    Logiciel de Calculs Statistiques

    Langage de Programmation

    Systme d'analyse et de Manipulation de Donnes

  • Brve Histoire de RCr par Ross Ihaka et Robert Gentleman (Professeurs de Statistiques en Nouvelle Zlande) en 1997Largement inspir dun autre langage de statistique appel SDe nos jours le dveloppement et la maintenance de R sont assurs par le Core Development Team de R

  • Comment Obtenir Rhttp://www.r-project.org/

  • Interface Graphique (Windows)

  • Caractristiques Gnrale de RLignes de commandesInterface graphique limiteLes commandes sont organise par librairiesLes librairies Base, Utils, Stat, Stat2,Graphics sont charges par dfautIl existe un trs grand nombre de librairies spcialises et gratuites.

  • Format des commandesCommande (paramtre1=valeur,paramtre2=valeur,...)Lassignement des valeurs se fait avec le signe Les comparaisons == pour gal, >= et
  • Structure des DonnesVecteur Matrice Variable Multi-Dimensionnelles (Array)Tableau de Donnes (Data Frame)List

  • Cration de Donnes> ### Creation de vecteur> vect1 vect1[1] 1.0 4.5 9.0 34.0 4.5> vect2 vect2[1] 5 6 7 8 9 10 11 12 13 14 15

  • > vect3 vect3logical(0)> vect3[1] vect3[1] 4Cration de Vecteur

  • Creation et Manipulation de Matrice>#Creation de Matrice> mat1 nrow=3,ncol=4)> mat1 [,1] [,2] [,3] [,4][1,] 1 10 4 40[2,] 2 20 5 50[3,] 3 30 6 60> mat1[2,2][1] 20

  • Creation et Manipulation de Matrice> mat1[1,4][1] 40> mat1[1,4] mat1 [,1] [,2] [,3] [,4][1,] 1 10 4 38[2,] 2 20 5 50[3,] 3 30 6 60

  • > donn1 fix(donn1)var1 var21 23 542 12 673 14 3232 12

    Creation de Tableau de Donnes

  • >## Creation de listes>A L1 L1[[6]] [,1] [,2] [,3] [,4][1,] 1 10 4 38[2,] 2 20 5 50[3,] 3 30 6 60Creation de Liste de Donnes

  • Creation de Liste> L1[[1]][1] "UAA"

    [[2]][1] 1992

    [[3]][1] 5000

    [[4]][1] "Nom"

    [[5]][1] "banane"

    [[6]] [,1] [,2] [,3] [,4][1,] 1 10 4 38[2,] 2 20 5 50[3,] 3 30 6 60

  • Importation de donnesR Importe dautre formats de logiciels statistiques (SPSS, SAS, )Importe galement les fichiers texte (ASCII) avec sparateursLe format ASCII est le format de choixLimport de fichiers est la forme la plus commune de cration de donne dans R

  • Lecture de fichiers texteNombreuses commandes disponiblesNous couvrirons 3 commandes: Read.tableRead.csvscan

  • Read.tableTest.txtAge Poids Taille12 60 15514 63 17518 70 16510 55 1455 30 1108 40 130

  • Read.table> df df Age Poids Taille1 12 60 1552 14 63 1753 18 70 1654 10 55 1455 5 30 1106 8 40 130

  • 0 030 0.00360 -0.0290 -0.0021200.0051500.0081800.002210-0.008240-0.0022700.9553000.7873300.389Test2.txt

  • > df2 df2[1:10,] V1 V21 0 0.0002 30 0.0033 60 -0.0204 90 -0.0025 120 0.0056 150 0.0087 180 0.0028 210 -0.0089 240 -0.00210 270 0.955

  • Commande scanPermet de lire un vecteur ou une liste

    Lit un fichier ou des entres clavier

    Les donnes peuvent tre organises de faon varie (colonnes, longue ligne )

  • Exemple de Fichiers TextesL1.txtUAA 10 34 UC 423 koffi kouadio 1960

    L2.txt

    12 45 43 23 98 7 8 6 12 87 34 56 67 54 30 12 65 43 89 7 8 90 54

  • > L1 L1[1] "UAA" "10" "34" "UC" "423" "koffi" "kouadio" "1960"

    Commande scan

  • > L2 L2 [1] 12 45 43 23 98 7 8 6 12 87 34 56 67 54 30 12 65 43 89 7 8 90 54

    Commande scan

  • Quelques options de scan

    scan(file = "", what = double(0), n = -1, sep = "", dec = ".", skip = 0, nlines = 0, na.strings = "NA")

  • Exemple de Session de RChanger de rpertoire par dfaut- File Change Dir.Lister les fichiers du rpertoire avec la commande: dir() Utiliser les commandes de lecture (read.table, read.csv, etc) pour importer les donnes

  • Sauver la session - File Save workspaceOn peut sauver la liste des commandes -File Save historyEquivalent commande des etape precedentes - setwd(c:\....) - save.image(c:\....)Exemple de Session de R

  • Accder a l'aideAller a Help Html Help Packages

  • Accder a l'aide

  • Accder a l'aide

  • Ecrire des Fichiers> write.table(df,file="test.txt",sep=" ")"Age" "poids" "taille""1" 12 60 155"2" 14 63 175"3" 18 70 165"4" 10 55 145"5" 5 30 110"6" 8 40 130

  • Ecrire des Fichiers> write.table(df,file="test.txt",sep=" ,row.names=FALSE)"Age" "poids" "taille"12 60 15514 63 17518 70 16510 55 1455 30 1108 40 130

  • Commandes Gnrales mean(x)sum(x)max(x)min(x)length(x)min(x)sd(x)var(x)dim(x)

  • Exemple (dim)> A [,1] [,2] [,3] [,4][1,] 1 10 4 38[2,] 2 20 5 50[3,] 3 30 6 60> dim(A)[1] 3 4

  • Exemple (length)> vect2 [1] 5 6 7 8 9 10 11 12 13 14 15> length(vect2)[1] 11

  • Manipulation de Donnees> ls()[1] "A" "df" "df2" "donn1" "L1" "L2" "mat1" "vect1" "vect2"> df Age poids taille1 12 60 1552 14 63 1753 18 70 1654 10 55 1455 5 30 1106 8 40 130

  • Manipulation de Donnees> df$Age[1] 12 14 18 10 5 8> df[,3][1] 155 175 165 145 110 130> df$[1] 155 175 165 145 110 130

  • Manipulation de Donnees> df[,2:3] poids taille1 60 1552 63 1753 70 1654 55 1455 30 1106 40 130

  • Manipulation de Donnees> df[,c("poids","taille")] poids taille1 60 1552 63 1753 70 1654 55 1455 30 1106 40 130

  • Manipulation de Donnes> df[1:3,] Age poids taille1 12 60 1552 14 63 1753 18 70 165

  • Manipulation de Donnees> df[-1,] Age poids taille2 14 63 1753 18 70 1654 10 55 1455 5 30 1106 8 40 130

  • Manipulation de Donnees> df[-2,] Age poids taille1 12 60 1553 18 70 1654 10 55 1455 5 30 1106 8 40 130

  • Manipulation de Donnees> df[,-1] poids taille1 60 1552 63 1753 70 1654 55 1455 30 1106 40 130

  • Manipulation de Donnes> vect2 [1] 5 6 7 8 9 10 11 12 13 14 15> vect2[4:8][1] 8 9 10 11 12> vect2[-2:-4][1] 5 9 10 11 12 13 14 15> which(vect2>10)[1] 7 8 9 10 11

  • Manipulation de Donnes> vect1[1] 1.0 4.5 9.0 34.0 4.5> which(vect1>10)[1] 4> which.max(vect1)[1] 4> which.min(vect1)[1] 1

  • Manipulation de Donnes> sort(vect1)[1] 1.0 4.5 4.5 9.0 34.0> rev(sort(vect1))[1] 34.0 9.0 4.5 4.5 1.0

  • Manipulation de Donnes

  • Selection de Commandes

  • Traitement de Chaines de CaracteresLes chaines de caracteres peuvent etre des nombres ou des chiffres> ch1 is.character(ch1)[1] TRUE> is.numeric(ch1)[1] FALSE> ch2 ch2[1] 12345> is.numeric(ch2)[1] TRUE

  • Traitement de Chaines de Caracteres> ch3 ch4 ch4 ch4[1] "ABCD"

  • Traitement de Chaines de Caracteres> nom substring(nom,1,5)[1] "felix"> strsplit(nom,"_")->nom1> nom1[[1]][1] "felix" "houphouet" "boigny"

  • Traitement de Chaines de Caracteres> nom2 nom2[1] "felix" "houphouet" "boigny" > paste(nom2[1],nom2[2],sep=" ")->nom3> nom3[1] "felix houphouet"

  • Traitement de Chaines de Caracteres> nom3 nom3[1] "felix houphouet boigny> nchar(nom3)[1] 22

  • Traitement de Chaines de Caracteres> nom[1] "felix_houphouet_boigny"> gsub("_"," ",nom)[1] "felix houphouet boigny"