Apa itu AWS MapReduce?
Apa itu AWS MapReduce?

Video: Apa itu AWS MapReduce?

Video: Apa itu AWS MapReduce?
Video: Introduction to Amazon Elastic MapReduce 2024, Mungkin
Anonim

Amazon Elastis PetaKurangi (EMR) adalah Amazon Web Services ( AWS ) alat untuk pemrosesan dan analisis data besar. Amazon EMR memproses data besar di seluruh cluster Hadoop server virtual di Amazon Elastic Compute Cloud (EC2) dan Amazon Simple Storage Service (S3).

Dengan cara ini, bagaimana cara kerja AWS EMR?

Layanan memulai sejumlah instans Amazon EC2 yang ditentukan pelanggan, terdiri dari satu master dan beberapa node lainnya. Amazon ESDM menjalankan perangkat lunak Hadoop pada instance ini. Node master membagi data input ke dalam blok, dan mendistribusikan pemrosesan blok ke node lain.

Selain di atas, apa perbedaan antara EC2 dan EMR? Tidak seperti ESDM , EC2 tidak mengkategorikan node budak menjadi node inti dan tugas. Ini meningkatkan risiko kehilangan data HDFS jika node dihapus/hilang. EC2 menggunakan perpustakaan Apache (s3a) untuk mengakses data pada s3. Di samping itu, ESDM menggunakan kode kepemilikan AWS untuk memiliki akses lebih cepat ke s3.

Selain itu, apakah AWS EMR sepenuhnya dikelola?

Amazon Elastis PetaReduce ( ESDM ) adalah sepenuhnya dikelola Platform Hadoop dan Spark dari Amazon Layanan web ( AWS ). Dengan ESDM , AWS pelanggan dapat dengan cepat memutar kluster Hadoop multi-node untuk memproses beban kerja data besar.

Apakah AWS menggunakan Hadoop?

Amazon Layanan web menggunakan Apache sumber terbuka hadoop teknologi komputasi terdistribusi untuk memudahkan akses daya komputasi dalam jumlah besar untuk menjalankan tugas-tugas yang membutuhkan banyak data. hadoop , versi open-source Google MapReduce, sudah digunakan oleh perusahaan seperti Yahoo dan Facebook.

Direkomendasikan: