Hadoop'ta veri yerelleştirmesi nasıl sağlanır?
Hadoop'ta veri yerelleştirmesi nasıl sağlanır?

Video: Hadoop'ta veri yerelleştirmesi nasıl sağlanır?

Video: Hadoop'ta veri yerelleştirmesi nasıl sağlanır?
Video: Hadoop Rack Awareness 2024, Mayıs
Anonim

Veri yerelleştirme içinde Hadoop . Kelimelerin çoğunun 5 Lacs veya daha fazla kez tekrarlandığı örnek Wordcount örneğini alın. Bu durumda Eşleştirici aşamasından sonra, her eşleyici çıktısında 5 Lacs aralığında kelimeler olacaktır. Eşleştirici çıktısını LFS'ye depolamanın bu eksiksiz süreci olarak adlandırılır Veri Yerelleştirme.

Bunu göz önünde bulundurarak, Hadoop'ta veri yerelleştirmesi nedir?

kavramı Veri yerellik Hadoop Verileri yerellik Harita indirgeme hesaplamayı gerçek değerin yakınına taşıma yeteneğini ifade eder. veri büyük hareket etmek yerine düğümde bulunur veri hesaplamaya. Bu, ağ tıkanıklığını en aza indirir ve sistemin genel verimini artırır.

Ayrıca, büyük veriler nasıl saklanır? Çoğu kişi, HDFS'yi veya Hadoop Dağıtılmış Dosya Sistemini otomatik olarak Hadoop ile ilişkilendirir. veri depolar. HDFS, bilgileri daha küçük bloklardan oluşan kümelerde depolar. Bu bloklar saklanmış yerinde fiziksel depolamak dahili disk sürücüleri gibi birimler.

Aynen öyle, veriler Hadoop'ta nasıl saklanır?

üzerinde Hadoop küme, veri HDFS içinde ve MapReduce sistemi, kümedeki her makinede bulunur. Veri NS saklanmış içinde veri DataNode'lardaki bloklar. HDFS bunları çoğaltır veri genellikle 128 MB boyutunda olan bloklar ve bunları kümedeki birden çok düğüm içinde çoğaltılmaları için dağıtır.

Dosyalar HDFS'de nasıl saklanır?

HDFS bir dosya sistem ad alanı ve kullanıcı verilerinin saklanmış içinde Dosyalar . Dahili olarak, bir dosya bir veya daha fazla bloğa bölünür ve bu bloklar saklanmış bir DataNodes kümesinde. NameNode yürütür dosya açma, kapama ve yeniden adlandırma gibi sistem ad alanı işlemleri Dosyalar ve dizinler.

Önerilen: