#################### TD ACP exercice 2, 2018 ################# ########## UE 7 (Statistiques), Master SVS #################### ########## Patrick Coquillard, 2019 #################### ########## exemple emprunte en partie à #################### ###########Ricco.Rakotomalala (univ. lyon 2)################### from <- read.table(file.choose(),sep="\t",header =T, row.names=1) summary(from) head(from) # noter la coorelation lipides x calories # noter les groupes proteines x cholesterol pairs(from) #centrage réduction des données #pour éviter que variables à forte variance pèsent indûment sur les résultats from.cr <-scale(from,center=T,scale=T) from.cr #matrice des distances entre individus d.from<-dist(from.cr) #CAH -critère de Ward #method= «ward.D2» correspond au vrai critère de Ward #utilisant le carré de la distance cah.ward<-hclust(d.from,method="ward.D2") #affichage dendrogramme plot(cah.ward) #dendrogramme avec matérialisation des groupes rect.hclust(cah.ward,k=4) #découpage en 4 groupes groupes.cah <-cutree(cah.ward,k=4) #liste des groupes print(sort(groupes.cah)) #k-meansavec les données centrées et réduites #center = 4 -nombre de groupes demandés #nstart= 5 -nombre d'essais avec différents individus de départ #parce que les résultats sont dépendants de l’initialisation groupes.kmeans<-kmeans(from.cr,centers=4,nstart=5) #affichage des résultats print(groupes.kmeans) #correspondance avec les groupes de la CAH # peut varier d'un ordinateur à l'autre # voyez-vous pourquoi ? print(table(groupes.cah,groupes.kmeans$cluster)) #----------------après une ACP----------------------- #--A voir avec Mr Bailly-Bechet---------------------- #---------------------------------------------------- # FactoMineR developpe par # F. Husson, J. Josse, S. Lê et J. Mazet. #-------------------------------------------------------------# # verifier que FactoMineR est installee # sinon install.packages("FactoMineR", dependencies = TRUE) # puis eventuellement le R commander : # install.packages("Rcmdr", dependencies = TRUE) # voir un descriptif (tutorial) du Rcommander # avant toute utilisation # http://sebastien.ledien.free.fr/unofficial_factominer/index_fr.html #--------------------------------------------------------------# library(FactoMineR) # On fait une ACP res.pca <- PCA(from, scale.unit = TRUE) # La function dimdesc() indique les variables et categories les plus # caractéristiques par rapport aux dimmensions résultantes d'une PCA (ou autre) lapply(dimdesc(res.pca),lapply,round,3) #Puis on calcule une matrice de distance à partir des coordonnees factorielles d.from <- dist(res.pca$ind$coord) d.from # et maintenant le dendrogramme cah.ward <- hclust(d.from, method = "ward.D2") #distance de ward plot(cah.ward) # comparez avec : cah.upgma <- hclust(d.from, method = "average") #UPGMA plot(cah.upgma) ####------------------------------------------------------#####