በትልቁ መረጃ ውስጥ Impala ምንድን ነው?
በትልቁ መረጃ ውስጥ Impala ምንድን ነው?

ቪዲዮ: በትልቁ መረጃ ውስጥ Impala ምንድን ነው?

ቪዲዮ: በትልቁ መረጃ ውስጥ Impala ምንድን ነው?
ቪዲዮ: Cars That Can Make 300,000 Miles and More 2024, ግንቦት
Anonim

ኢምፓላ እንደ Apache Hadoop ባሉ የተሰባሰቡ ስርዓቶች ላይ ክፍት ምንጭ በጅምላ ትይዩ ሂደት መጠይቅ ሞተር ነው። የተፈጠረው በጎግል ድሬሜል ወረቀት ላይ በመመስረት ነው። እንደ Hadoop Distributed File System (HDFS) ላይ የሚሰራ በይነተገናኝ SQL አይነት የመጠይቅ ሞተር ነው። ኢምፓላ HDFS እንደ መሰረታዊ ማከማቻው ይጠቀማል።

ይህንን በተመለከተ ኢምፓላ እና ቀፎ ምንድን ናቸው?

Apache ቀፎ ለ SQL-in-Hadoop ውጤታማ መስፈርት ነው። ኢምፓላ ከጎግል ድሬሜል በኋላ የተሰራ ክፍት ምንጭ SQL መጠይቅ ሞተር ነው። Cloudera ኢምፓላ በHBase እና HDFS ውስጥ የተከማቸውን መረጃ ለማስኬድ የ SQL ሞተር ነው። ኢምፓላ ይጠቀማል ቀፎ megastore እና መጠየቅ ይችላል ቀፎ ጠረጴዛዎች በቀጥታ.

ከዚህም በላይ የትኛው የተሻለ ቀፎ ወይም ኢምፓላ ነው? Apache ቀፎ ለበይነተገናኝ ኮምፒውቲንግ ግን ተስማሚ ላይሆን ይችላል። ኢምፓላ በይነተገናኝ ማስላት ማለት ነው። ቀፎ ባች ላይ የተመሰረተ Hadoop MapReduce ቢሆንም ኢምፓላ ነው። ተጨማሪ እንደ MPP የውሂብ ጎታ. ቀፎ ውስብስብ ዓይነቶችን ይደግፋል ነገር ግን ኢምፓላ አላደረገም. Apache ቀፎ ስህተትን መቋቋም የሚችል ቢሆንም ኢምፓላ ስህተት መቻቻልን አይደግፍም።

እንዲሁም ኢምፓላ ለምን እንጠቀማለን?

ኢምፓላ የማህደረ ትውስታ መረጃን ማቀናበርን ይደግፋል፣ ማለትም፣ ያንን ውሂብ ይደርሳል/ይተነተናል ነው። የውሂብ እንቅስቃሴ ሳይኖር በ Hadoop የውሂብ አንጓዎች ላይ ተከማችቷል. ትችላለህ መረጃን መድረስ ኢምፓላ በመጠቀም SQL መሰል መጠይቆች። ኢምፓላ ከሌሎች SQL ሞተሮች ጋር ሲወዳደር በኤችዲኤፍኤስ ውስጥ ላለው ውሂብ ፈጣን መዳረሻ ይሰጣል።

በትልቅ መረጃ ውስጥ ቀፎ ምንድን ነው?

Apache ቀፎ ነው ሀ ውሂብ የመጋዘን ስርዓት ለ ውሂብ ማጠቃለያ እና ትንተና እና ትልቅ መጠይቅ ውሂብ በክፍት ምንጭ ሃዱፕ መድረክ ውስጥ ያሉ ስርዓቶች። የ SQL መሰል መጠይቆችን ወደ MapReduce ስራዎችን በቀላሉ ለማስፈፀም እና እጅግ በጣም ትልቅ መጠን ያለው ሂደት ይለውጣል ውሂብ.

የሚመከር: