Bagaimana pelokalan data dicapai di Hadoop?
Bagaimana pelokalan data dicapai di Hadoop?

Video: Bagaimana pelokalan data dicapai di Hadoop?

Video: Bagaimana pelokalan data dicapai di Hadoop?
Video: Menteri Desa PDTT : Strategi Pelokalan SDGs Global Menjadi SDGs Desa 2024, November
Anonim

Lokalisasi data di dalam hadoop . Ambil contoh Wordcount contoh, di mana sebagian besar kata telah diulang selama 5 Lacs atau lebih kali. Dalam hal ini setelah fase Mapper, setiap keluaran mapper akan memiliki kata-kata dalam kisaran 5 Lacs. Proses lengkap menyimpan output Mapper ke LFS disebut sebagai Lokalisasi Data.

Dengan mengingat hal ini, apa itu pelokalan data di Hadoop?

Konsep dari Data lokalitas di Data Hadoop lokalitas di PetaKurangi mengacu pada kemampuan untuk memindahkan perhitungan mendekati tempat yang sebenarnya data berada di node, bukannya bergerak besar data untuk perhitungan. Ini meminimalkan kemacetan jaringan dan meningkatkan throughput sistem secara keseluruhan.

Juga, bagaimana data besar disimpan? Kebanyakan orang secara otomatis mengaitkan HDFS, atau Sistem File Terdistribusi Hadoop, dengan Hadoop data gudang. HDFS menyimpan informasi dalam cluster yang terdiri dari blok yang lebih kecil. Blok-blok ini adalah disimpan secara fisik di tempat penyimpanan unit, seperti drive disk internal.

Jadi, bagaimana data disimpan di Hadoop?

Pada suatu hadoop klaster, data dalam HDFS dan sistem MapReduce ditempatkan di setiap mesin di cluster. Data adalah disimpan di dalam data blok pada DataNodes. HDFS mereplikasi itu data blok, biasanya berukuran 128MB, dan mendistribusikannya sehingga direplikasi dalam beberapa node di seluruh cluster.

Bagaimana file disimpan dalam HDFS?

HDFS mengekspos a mengajukan namespace sistem dan memungkinkan data pengguna menjadi disimpan di dalam file . Secara internal, mengajukan dibagi menjadi satu atau lebih blok dan blok-blok ini adalah disimpan dalam satu set DataNodes. NameNode dijalankan mengajukan operasi namespace sistem seperti membuka, menutup, dan mengganti nama file dan direktori.

Direkomendasikan: