#avant de charger un fichier, s'assurer que l'on est dans le bon répertoire getwd()#renvoie le répertoire dans lequel on travaille #setwd() pour changer de répertoire de travail, se placer là où sont les fichiers de données setwd("/Users/zani/Documents/Enseignement/L3Miage/TP/") classe=read.table("Classe.data.txt",header=TRUE) classe=classe[,2:7]#on supprime la première colonne qui ne donne aucune information head(classe) nrow(classe)#nombre de ligne sexe=classe$sexe # ou bien avec attach attach(classe) difficulte t0=table(sexe) barplot(t0) #couper la fenêtre graphique avec par(mfrow) par(mfrow=c(1,3)) plot(t0/length(sexe),ylab="freq") barplot(t0/length(sexe),col=c("red","lightblue")) pie(t0/length(sexe)) #mode =H dep<-classe$departement t1=table(dep) par(mfrow=c(1,1)) barplot(t1/length(dep),cex.names=0.5,col=c("grey","purple","pink","yellow","red","blue")) #on trouve la syntaxe avec ? barplot par(mfrow=c(1,3)) plot(t1/length(dep)) barplot(t1/length(dep),cex.names=0.8,col=c("grey","purple","pink","yellow","red","blue")) pie(t1/length(dep)) #mode=Loiret serie=classe$serie serie mean(serie)#une variable qualitative n'a pas de moyenne!! t2=table(serie) par(mfrow=c(1,3)) plot(t2/length(serie)) barplot(t2/length(serie),cex.names=0.8,col=c("grey","purple","pink","yellow")) pie(t2/length(serie)) #mode: S diff=classe$difficulte summary(diff)#les quantités numériques médiane, etc..n'ont pas de sens ici #la variable est qualitative mais considérée comme quantitative par R Dif=as.character(diff) mean(Dif) t3=table(Dif) par(mfrow=c(1,3)) plot(t3/length(Dif)) barplot(t3/length(Dif),cex.names=0.8,col=c("grey","purple","pink","yellow","red","blue")) pie(t3/length(Dif)) #Mode: 3 #table des fréquences de Dif freq=table(Dif)/length(Dif) round(table(Dif)/length(Dif),2) freqcum=cumsum(freq) freqcum round(freqcum,3) par(mfrow=c(1,1)) boxplot(diff)#en repassant aux valeurs considérées comme numériques pour Dif, on peut définir une médiane, 1e quartile, 3e quartile #extraire la matrice des difficultés et séries avec seulement "S" et "ES" diffS=classe[classe$serie=="S",6] DifS=as.character(diffS) diffES=classe[classe$serie=="ES",6] DifES=as.character(diffES) summary(diffES) #barplot des données tableS=table(diffS) tableES=table(diffES) par(mfrow=c(1,2)) barplot(tableS/length(diffS),cex.names=0.8,main="difficulté S",col=c("grey","purple","pink","yellow","red","blue")) barplot(tableES/length(diffES),cex.names=0.8,main="difficulté ES",col=c("grey","purple","pink","yellow","red","blue")) par(mfrow=c(1,2)) boxplot(diffS,main="Difficulté S") boxplot(diffES,main="Difficulté ES")