የትኛው የሃዶፕ ፋይል ቅርጸት የአምድ ውሂብ ማከማቻ ቅርጸትን ይፈቅዳል?
የትኛው የሃዶፕ ፋይል ቅርጸት የአምድ ውሂብ ማከማቻ ቅርጸትን ይፈቅዳል?

ቪዲዮ: የትኛው የሃዶፕ ፋይል ቅርጸት የአምድ ውሂብ ማከማቻ ቅርጸትን ይፈቅዳል?

ቪዲዮ: የትኛው የሃዶፕ ፋይል ቅርጸት የአምድ ውሂብ ማከማቻ ቅርጸትን ይፈቅዳል?
ቪዲዮ: 🔴 አዲስ የንስሓ ዝማሬ " የትኛው ስራዬ " ዘማሪ ዲያቆን አቤል መክብብ @-mahtot 2024, ታህሳስ
Anonim

የአምድ ፋይል ቅርጸቶች (ፓርኬት፣ RCFile )

ለHadoop iscolumnar ፋይል ማከማቻ በፋይል ቅርጸቶች ውስጥ ያለው የቅርብ ጊዜ ሙቀት። በመሠረቱ ይህ ማለት እርስ በርስ የተያያዙ የውሂብ ረድፎችን ብቻ ከማስቀመጥ ይልቅ እርስ በርስ የተያያዙ የአምዶች እሴቶችን ያከማቻሉ. ስለዚህ የውሂብ ስብስቦች በአግድም እና በአቀባዊ የተከፋፈሉ ናቸው።

ከዚህ ጎን ለጎን ሃዱፕ መረጃን በምን አይነት ፎርማት ይይዛል?

በርካቶች አሉ። ሃዱፕ - የተወሰነ ፋይል ቅርጸቶች በተለይ ከMapReduce ጋር በደንብ ለመስራት የተፈጠሩ። እነዚህ ሃዱፕ - የተወሰነ ፋይል ቅርጸቶች በፋይል ላይ የተመሰረተ ውሂብ እንደ ቅደም ተከተል ፋይሎች, ተከታታይነት ያሉ መዋቅሮች ቅርጸቶች እንደ Avro, እና columnar ቅርጸቶች እንደ RCFile እና Parquet.

እንዲሁም አንድ ሰው የአምድ ፋይል ቅርጸት ምንድነው? ረድፍ እና አምድ ማከማቻ ለ ቀፎ. ORC ሀ columnar ማከማቻ ቅርጸት በ Hadoop ለ Hivetables ጥቅም ላይ ይውላል. ቀልጣፋ ነው። የፋይል ቅርጸት መዝገቦች ብዙ ዓምዶችን የያዙበትን ውሂብ ለማከማቸት። ለምሳሌ የድር ጣቢያ እንቅስቃሴን እና አፈጻጸምን ለመተንተን የ Clickstream (ድር) ውሂብ ነው።

በተመሳሳይ፣ በ Hadoop ውስጥ የፋይል ቅርጸት ምንድነው?

መሰረታዊ የፋይል ቅርጸቶች ናቸው፡ ጽሑፍ ቅርጸት , ቁልፍ-እሴት ቅርጸት , ቅደም ተከተል ቅርጸት . ሌላ ቅርጸቶች ጥቅም ላይ የሚውሉት እና በደንብ የሚታወቁት፡- Avro፣ Parquet፣ RC ወይም Row-Columnar ናቸው። ቅርጸት ፣ ORC ወይም የተሻሻለ RowColumnar ቅርጸት.

ለምንድነው የአምድ ፋይል ቅርጸቶች በውሂብ ማከማቻ ውስጥ ጥቅም ላይ የሚውሉት?

ORC ረድፍ ያከማቻል ውሂብ ውስጥ የአምድ ቅርጽ ይህ ረድፍ - የአምድ ቅርጽ ለመጭመቅ እና በጣም ውጤታማ ነው ማከማቻ . በክላስተር ላይ ትይዩ ሂደትን ይፈቅዳል፣ እና የ የአምድ ቅርጽ ለፈጣን ሂደት እና መበስበስ አላስፈላጊ አምዶችን ለመዝለል ያስችላል።

የሚመከር: