Amazon Elastic MapReduce'un arkasındaki veri işleme motoru nedir?
Amazon Elastic MapReduce'un arkasındaki veri işleme motoru nedir?

Video: Amazon Elastic MapReduce'un arkasındaki veri işleme motoru nedir?

Video: Amazon Elastic MapReduce'un arkasındaki veri işleme motoru nedir?
Video: Veri Bilimi Neden Geleceğin Bilimi? - Veri Bilimi Hakkında Her Şey @istanbuldatascienceacademy938 2024, Mayıs
Anonim

Amazon EMR'si dağıtılmış olarak Apache Hadoop'u kullanır veri işleme motoru . Hadoop, aşağıdakileri destekleyen açık kaynaklı bir Java yazılım çerçevesidir. veri -büyük kümeler üzerinde çalışan yoğun dağıtılmış uygulamalar ile ilgili emtia donanımı.

Ayrıca Amazon Elastic MapReduce nedir?

Amazon Elastik HaritaKüçült ( EMR ) bir Amazon Web Hizmetleri ( AWS ) büyük veri işleme ve analiz aracı. Amazon EMR'si üzerindeki bir Hadoop sanal sunucu kümesinde büyük verileri işler. Amazon Elastik Hesaplama Bulutu ( EC2 ) ve Amazon Basit Depolama Hizmeti ( S3 ).

Ayrıca, Amazon EMR tam olarak yönetiliyor mu? Bu bir tamamen yönetilen veri depolamayı bilgi işlem kaynaklarından ayırabilen ve bunun yerine işlem kümelerini ölçeklenebilir, isteğe bağlı olarak kullanılabilecek hale getiren ve birden çok kümenin aynı veri kümelerine aynı anda erişme yeteneğini içeren veri gölü hizmeti.

AWS EMR nasıl çalışır?

Genel olarak, verileri işlerken Amazon EMR'si , girdi, seçtiğiniz temel dosya sisteminde dosyalar olarak depolanan verilerdir; Amazon S3 veya HDFS. Bu veriler, işleme sırasında bir adımdan diğerine geçer. Son adım, çıktı verilerini belirli bir konuma, örneğin bir Amazon S3 kova.

ec2 ve EMR arasındaki fark nedir?

farklı EMR , EC2 bağımlı düğümleri çekirdek ve görev düğümleri olarak sınıflandırmaz. Bu, bir düğümün kaldırılması/kaybolması durumunda HDFS verilerini kaybetme riskini artırır. EC2 s3'teki verilere erişmek için Apache kitaplıklarını (s3a) kullanır. Diğer yandan, EMR s3'e daha hızlı erişim sağlamak için AWS'ye özel kod kullanır.

Önerilen: