Python Spark and Machine Learning

Udemy Python Spark and Machine Learning

Register & Get access to index
jdYh5GO.jpg

RDD, Supervised and Unsupervised Learning, Mlib, Spark SQL, Hive, Hadoop


What you'll learn
  • Create robust processing pipelines by testing Apache Spark jobs
  • Configure a local instance of PySpark in a virtual environment
  • Explore regression, classification and clustering models available in the ML module
  • Use DataFrames to transform data used for modeling
  • Learn Linear Regression, Logistic Regression, and Cluster Analysis
  • you’ll learn how to abstract data with RDDs and DataFrames

Requirements
  • No requirements

Description
Apache Spark est un framework de traitement parallèle open source qui existe depuis un certain temps maintenant. L'une des nombreuses utilisations d'Apache Spark est pour les applications d'analyse des données sur les ordinateurs en cluster

Vous apprenez à obtenir des données à partir de toutes les plaques-formes d'hébergement de données populaires, y compris HDFS, Hive, JSON et à gérer de grands ensembles de données avec PySpark pour acquérir une expérience pratique du Big Data.

nous couvrons l'installation et la configuration de PySpark, les opérations RDD, le nettoyage et le traitement des mégadonnées, et l'agrégation et la synthèse des données dans les rapports utiles. Vous apprenez également comment implémenter certaines techniques pratiques et éprouvées pour améliorer certains aspects de la programmation et de l'administration dans Apache Spark.


À la fin, vous serez en mesure de créer des solutions analytiques et d'apprentissage machine Big Data en utilisant les différentes offres PySpark et également de l'optimiseur efficacement.
Who this course is for:
  • any student interested in machine learning with quality performance
Author
TUTProfessor
Downloads
20
Views
644
First release
Last update
Rating
0.00 star(s) 0 ratings

More resources from TUTProfessor