Python pour le data scientist - 2e éd. (2° Éd.) Des bases du langage au machine learning Coll. InfoPro
Langue : Français
Auteur : Jakobowicz Emmanuel
Si vous vous intéressez au traitement des données avec le langage Python, cet ouvrage s’adresse à vous. Que vous soyez débutant en Python ou que vous ayez une expérience significative, il vous apportera les clés pour utiliser ce langage en data science.
Ce livre répond à de nombreuses questions sur Python :
• Comment utiliser Python en data science ?
• Comment coder en Python ?
• Comment préparer des données avec Python ?
• Comment créer des visualisations attractives avec Python ?
• Comment appliquer des modèles de machine learning et de deep learning avec Python ?
• Comment passer aux environnements big data ?
Vous apprendrez à tirer parti des multiples outils Python tels que Anaconda, Jupyter, NumPy, Pandas, Matplotlib, Seaborn, Bokeh, Scikit-Learn, TensorFlow, PySpark… pour mettre en place vos traitements.
Cette deuxième édition est complétée et enrichie par des mises à jour de code liées aux évolutions de Python et des packages de data science. Des données plus récentes sont aussi utilisées.
L’ensemble du code compris dans cet ouvrage est disponible sous la forme de notebooks Jupyter dans le repository public de l’auteur : https://github.com/emjako/pythondatascientist
Ce livre répond à de nombreuses questions sur Python :
• Comment utiliser Python en data science ?
• Comment coder en Python ?
• Comment préparer des données avec Python ?
• Comment créer des visualisations attractives avec Python ?
• Comment appliquer des modèles de machine learning et de deep learning avec Python ?
• Comment passer aux environnements big data ?
Vous apprendrez à tirer parti des multiples outils Python tels que Anaconda, Jupyter, NumPy, Pandas, Matplotlib, Seaborn, Bokeh, Scikit-Learn, TensorFlow, PySpark… pour mettre en place vos traitements.
Cette deuxième édition est complétée et enrichie par des mises à jour de code liées aux évolutions de Python et des packages de data science. Des données plus récentes sont aussi utilisées.
L’ensemble du code compris dans cet ouvrage est disponible sous la forme de notebooks Jupyter dans le repository public de l’auteur : https://github.com/emjako/pythondatascientist
Python, ses origines et son environnement. Histoire, origines et évolution : de la naissance à la version 3.9. Python vs R vs le reste du monde. Comment développer en Python ?. Les outils pour coder en Python. Les packages pour la data science. Python from scratch. Principes de base. Les interpréteurs : Python et IPython. La base pour commencer à coder. Les structures (tuples, listes, dictionnaires). La programmation (conditions, boucles…). Les fonctions. Les classes et les objets. Les packages et les modules. Aller plus loin. Python et les données (NumPy et Pandas). La donnée à l’ère de la data science. Les arrays de NumPy. Les objets series et dataframe de Pandas. La préparation des données et les premières statistiques. Présentation des données. Les outils pour charger les données. Décrire et transformer des colonnes. Extraire des statistiques descriptives. Utilisation du groupby pour décrire des données. Aller plus loin : accélération. Data visualisation avec Python. Construction de graphiques avec Matplotlib. Seaborn pour des représentations plus élaborées. Quelques bases de cartographie. Les graphiques interactifs avec d’autres packages et outils. Différentes utilisations du machine learning avec Python. Le machine learning, qu’est-ce que c’est ?. Comment faire du machine learning avec Python. Le processus de traitement en machine learning. L’apprentissage supervisé avec Scikit-Learn. L’apprentissage non supervisé. L’analyse textuelle avec Python. Le deep learning avec Keras. Python et le big data : tour d’horizon. Est-ce qu’on change tout quand on parle de big data ?. Comment traiter de la donnée massive avec Python. Récupérer des données avec Python. Utilisation d’Apache Spark avec pyspark en Python.
Emmanuel Jakobowicz est data scientist, développeur et formateur Python depuis de nombreuses années. Il est fondateur de Stat4decision, entreprise spécialisée en conseil et formation en data science, et co-organisateur du Meetup PyData Paris. Spécialisé dans la création et l’implémentation de méthodes avancées d’analyse de données, il a un doctorat en statistique appliquée.
Date de parution : 03-2021
Ouvrage de 320 p.
17.6x25 cm
Épuisé
Thème de Python pour le data scientist - 2e éd. :
© 2024 LAVOISIER S.A.S.