Parquet ውሂብ ቅርጸት ምንድን ነው?
Parquet ውሂብ ቅርጸት ምንድን ነው?

ቪዲዮ: Parquet ውሂብ ቅርጸት ምንድን ነው?

ቪዲዮ: Parquet ውሂብ ቅርጸት ምንድን ነው?
ቪዲዮ: БЕДЫ С БАШКОЙ. Финал! ► 6 Прохождение Cuphead (Пк, реванш) 2024, ሚያዚያ
Anonim

Apache ፓርኬት ነፃ እና ክፍት ምንጭ አምድ-ተኮር ነው። ውሂብ ማከማቻ ቅርጸት የ Apache Hadoop ሥነ ምህዳር. ከአብዛኞቹ ጋር ተኳሃኝ ነው ውሂብ በ Hadoop አካባቢ ውስጥ የማቀነባበሪያ ማዕቀፎች. ቀልጣፋ ይሰጣል ውሂብ ውስብስብ ለማስተናገድ ከተሻሻለ አፈጻጸም ጋር የማመቅ እና የመቀየሪያ ዕቅዶች ውሂብ በጅምላ.

እንዲያው፣ የፓርኬት ፋይል ቅርጸት ምንድነው?

ፓርኬት ፣ ክፍት ምንጭ የፋይል ቅርጸት ለሃዱፕ. ፓርኬት በጠፍጣፋ አምድ ውስጥ የጎጆ ውሂብ አወቃቀሮችን ያከማቻል ቅርጸት . መረጃ በረድፍ ተኮር አቀራረብ ከተከማቸ ባህላዊ አቀራረብ ጋር ሲነጻጸር፣ parquet በማከማቸት እና በአፈፃፀም ረገድ የበለጠ ውጤታማ ነው.

በተጨማሪም, parquet ምን ጥቅም ላይ ይውላል? ፓርኬት በHadoop ስነ-ምህዳር ውስጥ ላለ ማንኛውም ፕሮጀክት የሚገኝ ክፍት ምንጭ ፋይል ቅርጸት ነው። Apache ፓርኬት እንደ CSV ወይም TSV ፋይሎች ካሉ በረድፍ ላይ ከተመሰረቱ ፋይሎች ጋር ሲነጻጸር ቅልጥፍና ላለው እና አፈጻጸም ላለው ለጥ የአምድ ማከማቻ ቅርጸት የተሰራ ነው።

በተጨማሪም፣ የፓርኬት ቅርጸት ውሂብን እንዴት ያከማቻል?

ዳታ በ ውስጥ ያለውን እያንዳንዱን እገዳ አግድ parquet ፋይል ነው። ተከማችቷል በረድፍ ቡድኖች መልክ. ስለዚህ፣ ውሂብ በ ሀ parquet ፋይሉ በበርካታ የረድፍ ቡድኖች ተከፍሏል. እነዚህ የረድፍ ቡድኖች በተራው ውስጥ ካለው አምድ ጋር የሚዛመደው አንድ ወይም ከዚያ በላይ የአምድ ቁርጥራጮችን ያቀፈ ነው። ውሂብ አዘጋጅ. የ ውሂብ በገጾች መልክ ለተፃፈው ለእያንዳንዱ የዓምድ ቁራጭ.

ፓርኬት ሰው ሊነበብ ይችላል?

ኦአርሲ፣ ፓርኬት እና አቭሮ እንዲሁ ማሽን ናቸው- ሊነበብ የሚችል ሁለትዮሽ ቅርጸቶች, ይህም ማለት ፋይሎቹ gibberish ይመስላሉ ማለት ነው ሰዎች . የሚያስፈልግህ ከሆነ ሰው - ሊነበብ የሚችል እንደ JSON ወይም XML ቅርጸት፣ ከዚያ ምናልባት Hadoopን በመጀመሪያ ለምን እንደሚጠቀሙ እንደገና ያስቡበት።

የሚመከር: