Catalogue en ligne Bibliothèque centrale

Code-barres	Cote	Support	Localisation	Section	Disponibilité
15/264721	L/519.166	Livre	Bibliothèque Centrale	indéterminé	Disponible
15/264720	L/519.166	Livre	Bibliothèque Centrale	indéterminé	Exclu du prêt
15/264722	L/519.166	Livre	Bibliothèque Centrale	indéterminé	Disponible

BIBLIOTHEQUE CENTRALE

Nouvelle recherche

Détail de l'auteur

Auteur Tufféry Stéphane

Documents disponibles écrits par cet auteur

Affiner la recherche Interroger des sources externes

Modélisation prédictive et apprentissage statistique avec R / Tufféry Stéphane

Public

ISBD

Titre : Modélisation prédictive et apprentissage statistique avec R
Type de document : texte imprimé
Auteurs : Tufféry Stéphane
Editeur : Paris [France] : Editions TECHNIP
Année de publication : 2015
Importance : 415p
Format : 21x17 cm
ISBN/ISSN/EAN : 978-2-7108-1158-9
Langues : Français (fre) Langues originales : Français (fre)
Index. décimale : 519 Probabilités et mathématiques appliquées
Résumé : ssu de formations devant des publics variés, cet ouvrage présente les principales méthodes de modélisation de statistique et de machine learning, à travers le fil conducteur d une étude de cas. Chaque méthode fait l objet d un rappel de cours et est accompagnée de références bibliographiques, puis est mise en uvre avec des explications détaillées sur les calculs effectués, les interprétations des résultats et jusqu aux astuces de programmation permettant d optimiser les temps de calcul. A ce sujet, une annexe est consacrée au traitement des données massives. L ouvrage commence par les méthodes de classement classiques les plus éprouvées, mais aborde rapidement les méthodes plus récentes et avancées : régression ridge, lasso, elastic net, boosting, forêts aléatoires, Extra-Trees, réseaux de neurones, séparateurs à vaste marge. Chaque fois, le lien est fait entre la théorie et les résultats obtenus pour montrer qu ils illustrent bien les principes sous-jacents à ces méthodes. Mais l aspect pratique est aussi privilégié, avec l objectif de permettre au lecteur une mise en uvre rapide et efficace dans son travail concret. L exploration et la préparation préliminaire des données sont d ailleurs décrites, ainsi que le processus de sélection des variables. Une synthèse finale est faite de toutes les méthodes présentées. La mise en uvre s appuie sur le logiciel libre R et sur un jeu public de données. Ce dernier peut être téléchargé sur internet et présente l intérêt d être riche, complet et de permettre des comparaisons grâce aux nombreuses publications dans lesquelles il a servi. Le logiciel statistique utilisé est R, actuellement celui qui se développe le plus : devenu la lingua franca de la statistique et l outil le plus répandu dans le monde académique, il prend également de plus en plus de place dans le monde de l entreprise, à tel point que tous les logiciels commerciaux proposent désormais une interface avec R. Outre qu il est disponible pour tous, dans de multiples environnements, il est aussi le plus riche statistiquement et c est le seul logiciel permettant de mettre en uvre toutes les méthodes présentées dans cet ouvrage. Enfin, son langage de programmation particulièrement élégant et adapté au calcul mathématique permet de se concentrer dans le codage sur les aspects statistiques. R permet d arriver directement à l essentiel et de mieux comprendre les méthodes exposées dans l ouvrage. Table des matières : Présentation du jeu de données. Préparation des données. Exploration des données. Discrétisation automatique supervisée des variables continues. La régression logistique. La régression logistique pénalisée ridge. La régression logistique pénalisée lasso. La régression logistique PLS. L arbre de décision CART. L algorithme PRIM. Les forêts aléatoires. Le bagging. Les forêts aléatoires de modèles logistiques. Le boosting. Les Support Vector Machines. Les réseaux de neurones. Synthèse des méthodes prédictives. Annexes. Bibliographie. Index des packages R utilisés.

Modélisation prédictive et apprentissage statistique avec R [texte imprimé] / Tufféry Stéphane . - Paris (France) : Editions TECHNIP, 2015 . - 415p ; 21x17 cm.
ISBN : 978-2-7108-1158-9
Langues : Français (fre) Langues originales : Français (fre)
Index. décimale : 519 Probabilités et mathématiques appliquées
Résumé : ssu de formations devant des publics variés, cet ouvrage présente les principales méthodes de modélisation de statistique et de machine learning, à travers le fil conducteur d une étude de cas. Chaque méthode fait l objet d un rappel de cours et est accompagnée de références bibliographiques, puis est mise en uvre avec des explications détaillées sur les calculs effectués, les interprétations des résultats et jusqu aux astuces de programmation permettant d optimiser les temps de calcul. A ce sujet, une annexe est consacrée au traitement des données massives. L ouvrage commence par les méthodes de classement classiques les plus éprouvées, mais aborde rapidement les méthodes plus récentes et avancées : régression ridge, lasso, elastic net, boosting, forêts aléatoires, Extra-Trees, réseaux de neurones, séparateurs à vaste marge. Chaque fois, le lien est fait entre la théorie et les résultats obtenus pour montrer qu ils illustrent bien les principes sous-jacents à ces méthodes. Mais l aspect pratique est aussi privilégié, avec l objectif de permettre au lecteur une mise en uvre rapide et efficace dans son travail concret. L exploration et la préparation préliminaire des données sont d ailleurs décrites, ainsi que le processus de sélection des variables. Une synthèse finale est faite de toutes les méthodes présentées. La mise en uvre s appuie sur le logiciel libre R et sur un jeu public de données. Ce dernier peut être téléchargé sur internet et présente l intérêt d être riche, complet et de permettre des comparaisons grâce aux nombreuses publications dans lesquelles il a servi. Le logiciel statistique utilisé est R, actuellement celui qui se développe le plus : devenu la lingua franca de la statistique et l outil le plus répandu dans le monde académique, il prend également de plus en plus de place dans le monde de l entreprise, à tel point que tous les logiciels commerciaux proposent désormais une interface avec R. Outre qu il est disponible pour tous, dans de multiples environnements, il est aussi le plus riche statistiquement et c est le seul logiciel permettant de mettre en uvre toutes les méthodes présentées dans cet ouvrage. Enfin, son langage de programmation particulièrement élégant et adapté au calcul mathématique permet de se concentrer dans le codage sur les aspects statistiques. R permet d arriver directement à l essentiel et de mieux comprendre les méthodes exposées dans l ouvrage. Table des matières : Présentation du jeu de données. Préparation des données. Exploration des données. Discrétisation automatique supervisée des variables continues. La régression logistique. La régression logistique pénalisée ridge. La régression logistique pénalisée lasso. La régression logistique PLS. L arbre de décision CART. L algorithme PRIM. Les forêts aléatoires. Le bagging. Les forêts aléatoires de modèles logistiques. Le boosting. Les Support Vector Machines. Les réseaux de neurones. Synthèse des méthodes prédictives. Annexes. Bibliographie. Index des packages R utilisés.

Réservation
Réserver ce document

Exemplaires (3)

Code-barres Cote Support Localisation Section Disponibilité
15/264721 L/519.166 Livre Bibliothèque Centrale indéterminé Disponible
15/264720 L/519.166 Livre Bibliothèque Centrale indéterminé Exclu du prêt
15/264722 L/519.166 Livre Bibliothèque Centrale indéterminé Disponible

Auteur Tufféry Stéphane

Documents disponibles écrits par cet auteur

Réservation

Exemplaires (3)

BIBLIOTHEQUE CENTRALE

Détail de l'auteur

Bibliothèque centrale

Accueil

Sélection de la langue

Se connecter

Adresse