Translations:Apache Spark/2/en: Difference between revisions

← Older edit

Translations:Apache Spark/2/en (view source)

Revision as of 20:50, 7 December 2018

85 bytes removed , 5 years ago

no edit summary

Stubbsda

Bureaucrats, cc_docs_admin, cc_staff

2,318

edits

Revision as of 14:23, 4 December 2018 (view source) FuzzyBot (talk \| contribs) (Importing a new version from external source)		Latest revision as of 20:50, 7 December 2018 (view source) Stubbsda (talk \| contribs) No edit summary
Line 1:		Line 1:
	Apache Spark ~~est une framework de calcul distribuée~~ open source ~~initialement développé par l'~~AMPLab ~~de l'Université~~ Berkeley~~, et maintenant un projet de la fondation~~ Apache. ~~Contrairement à l'algorithme~~ MapReduce ~~implémenté par~~ Hadoop ~~qui utilise le stockage sur disque~~, Spark ~~utilise des~~ primitives ~~conservées en mémoire lui permettant d'atteindre des performances jusqu'à 100 fois plus rapide pour certaines~~ applications. ~~Le chargement des données en mémoire permet de les interroger fréquemment ce qui fait de~~ Spark ~~une~~ framework ~~particulièrement approprié pour l'apprentissage automatique et l'analyse de données~~ interactive.		Apache Spark is an open source framework for distributed computation initially developed by the AMPLab at Berkeley University and is now a project sponsored by the Apache foundation. Unlike the MapReduce algorithm implemented by Hadoop that uses disk storage, Spark makes use of primitives which are stored in memory, thereby achieving up to 100x the performance of Hadoop in certain applications. Loading data in memory allows them to be queried frequently, making Spark a framework especially appropriate for automated learning and interactive data analysis.