Parke veri formatı nedir?
Parke veri formatı nedir?

Video: Parke veri formatı nedir?

Video: Parke veri formatı nedir?
Video: Python Saati #121 - Big Data - Apache Parquet ile Veri Formatlama 2024, Kasım
Anonim

Apaçi Parke ücretsiz ve açık kaynaklı bir sütun odaklıdır veri depolamak biçim Apache Hadoop ekosisteminin Çoğu ile uyumludur veri Hadoop ortamında işleme çerçeveleri. verimli sağlar veri karmaşıklığı işlemek için gelişmiş performansa sahip sıkıştırma ve kodlama şemaları veri toplu olarak.

Basitçe, parke dosya formatı nedir?

Parke , açık kaynak dosya formatı Hadoop için. Parke iç içe geçmiş veri yapılarını düz bir sütunda saklar biçim . Verilerin satır yönelimli yaklaşımda depolandığı geleneksel yaklaşımla karşılaştırıldığında, parke depolama ve performans açısından daha verimlidir.

Ayrıca, parke ne için kullanılır? Parke Hadoop ekosistemindeki herhangi bir proje için kullanılabilen açık kaynaklı bir dosya biçimidir. Apaçi Parke CSV veya TSV dosyaları gibi satır tabanlı dosyalara kıyasla verimli ve performanslı düz sütunlu veri depolama formatı için tasarlanmıştır.

Ek olarak, parke formatı verileri nasıl depolar?

VERİ BLOK Dizideki her blok parke dosya saklanmış sıra grupları şeklinde. Yani, veri içinde parke dosya birden çok satır grubuna bölünmüştür. Bu satır grupları, sırayla, bir sütuna karşılık gelen bir veya daha fazla sütun parçasından oluşur. veri Ayarlamak. NS veri sayfalar şeklinde yazılmış her sütun öbeği için.

Parke insan tarafından okunabilir mi?

ORC, Parke , ve Avro da makine- okunabilir dosyaların anlamsız gibi göründüğünü söylemek için ikili biçimler insanlar . Eğer ihtiyacın varsa bir insan - okunabilir JSON veya XML gibi bir biçime sahipseniz, muhtemelen neden Hadoop'u ilk etapta kullandığınızı yeniden düşünmelisiniz.

Önerilen: