ቪዲዮ: በ Scala ውስጥ RDD ምንድን ነው?
2024 ደራሲ ደራሲ: Lynn Donovan | [email protected]. ለመጨረሻ ጊዜ የተሻሻለው: 2023-12-15 23:42
መቋቋም የሚችል የተከፋፈሉ የውሂብ ስብስቦች ( አርዲዲ ) የስፓርክ መሰረታዊ የመረጃ መዋቅር ነው። የማይለወጥ የተከፋፈለ የነገሮች ስብስብ ነው። አርዲዲዎች ማንኛውንም አይነት Python፣ Java፣ ወይም ሊይዝ ይችላል። ስካላ ነገሮች፣ በተጠቃሚ የተገለጹ ክፍሎችን ጨምሮ። በመደበኛነት፣ ኤን አርዲዲ ተነባቢ-ብቻ፣ የተከፋፈለ የመዛግብት ስብስብ ነው።
እንዲሁም ጥያቄው በ RDD እና DataFrame መካከል ያለው ልዩነት ምንድን ነው?
አርዲዲ – አርዲዲ በብዙ ማሽኖች ላይ የሚሰራጩ የመረጃ አካላት ስብስብ ነው። በውስጡ ክላስተር አርዲዲዎች ውሂብን የሚወክሉ የጃቫ ወይም ስካላ ነገሮች ስብስብ ናቸው። የውሂብ ፍሬም - ኤ የውሂብ ፍሬም በተሰየሙ አምዶች የተደራጀ የተከፋፈለ የመረጃ ስብስብ ነው። በፅንሰ-ሀሳብ ከጠረጴዛ ጋር እኩል ነው በ ሀ ተዛማጅ የውሂብ ጎታ.
በተጨማሪም፣ RDD እንዴት ይሰራጫል? የሚቋቋም ተሰራጭቷል። የውሂብ ስብስቦች ( አርዲዲዎች ) እነሱ ሀ ተሰራጭቷል በማህደረ ትውስታ ውስጥ ወይም በተለያዩ የክላስተር ማሽኖች ዲስኮች ላይ የተከማቹ ዕቃዎች ስብስብ። ነጠላ አርዲዲ እነዚህ ክፍልፋዮች በተለያዩ የክላስተር ማሽኖች ላይ እንዲከማቹ እና እንዲሰሩ በብዙ ምክንያታዊ ክፍልፋዮች ሊከፋፈሉ ይችላሉ።
ስፓርክ RDD እንዴት ይሠራል?
አርዲዲዎች ውስጥ ብልጭታ ክፍልፋዮችን ያካተቱ መዝገቦች ስብስብ አላቸው. አርዲዲዎች ውስጥ ብልጭታ በትናንሽ አመክንዮአዊ የመረጃ ቋቶች የተከፋፈሉ ናቸው - ክፍልፍሎች በመባል ይታወቃሉ፣ አንድ ድርጊት ሲፈፀም በአንድ ክፍል አንድ ተግባር ይጀምራል። ክፍልፋዮች በ አርዲዲዎች ትይዩ መሰረታዊ አሃዶች ናቸው።
የትኛው ፈጣን RDD ወይም DataFrame ነው?
አርዲዲ - ቀላል የመቧደን እና የመደመር ስራዎችን ሲያከናውን አርዲዲ ኤፒአይ ቀርፋፋ ነው። የውሂብ ፍሬም - የዳሰሳ ትንተና በማካሄድ ፣ በመረጃ ላይ አጠቃላይ ስታቲስቲክስ መፍጠር ፣ የውሂብ ክፈፎች ናቸው። ፈጣን . አርዲዲ - ዝቅተኛ-ደረጃ ለውጥ እና ድርጊቶችን ሲፈልጉ, እንጠቀማለን አርዲዲዎች . እንዲሁም፣ ከፍተኛ ደረጃ ማጠቃለያዎችን ስንፈልግ እንጠቀማለን። አርዲዲዎች.
የሚመከር:
በ Scala ውስጥ የ SBT ፕሮጀክት ምንድነው?
Sbt ልክ እንደ ጃቫ ማቨን እና አንት ለ Scala እና Java ፕሮጀክቶች ክፍት ምንጭ ግንባታ መሳሪያ ነው። ዋና ባህሪያቱ፡ የ Scala ኮድን ለመሰብሰብ እና ከብዙ የ Scala የሙከራ ማዕቀፎች ጋር ለማዋሃድ ቤተኛ ድጋፍ ናቸው። ቀጣይነት ያለው ማጠናቀር፣ ሙከራ እና ማሰማራት
በስርዓተ ክወናው ውስጥ ያለው ሂደት ምንድን ነው በስርዓተ ክወናው ውስጥ ያለው ክር ምንድን ነው?
ሂደት፣ በቀላል አነጋገር፣ የአፈጻጸም ፕሮግራም ነው። አንድ ወይም ከዚያ በላይ ክሮች በሂደቱ አውድ ውስጥ ይሰራሉ። ክር የስርዓተ ክወናው ፕሮሰሰር ጊዜ የሚመደብበት መሰረታዊ አሃድ ነው። የክር ፑል በዋነኝነት የሚያገለግለው የአፕሊኬሽን ክሮች ብዛትን ለመቀነስ እና የሰራተኛ ክሮች አስተዳደርን ለማቅረብ ነው።
በ Scala ውስጥ ተዋናዮች ምንድናቸው?
የ Scala ቀዳሚ የኮንስትራክሽን ግንባታ ተዋናዮች ናቸው። ተዋናዮች በመሠረቱ መልእክት በመለዋወጥ የሚግባቡ በአንድ ላይ የሚገናኙ ሂደቶች ናቸው። ተዋናዮች ዘዴን መጥራት ከመልዕክት መላክ ጋር በሚመሳሰልበት ጊዜ እንደ ንቁ ነገሮች አይነት ሊታዩ ይችላሉ
በ Spark Scala ውስጥ DataFrame ምንድን ነው?
ስፓርክ ዳታ ፍሬም የተጣራ ፣ የቡድን ፣ ወይም አጠቃላይ ድምርን ለማስላት ስራዎችን የሚያቀርብ በተሰየሙ አምዶች የተደራጀ የተከፋፈለ የውሂብ ስብስብ ነው እና በስፓርክ SQL ጥቅም ላይ ሊውል ይችላል። DataFrames ከተዋቀሩ የውሂብ ፋይሎች፣ ነባር RDDዎች፣ ቀፎ ውስጥ ካሉ ሰንጠረዦች ወይም ከውጭ የውሂብ ጎታዎች ሊገነቡ ይችላሉ።
በ Scala ውስጥ ስውር ክፍል ምንድን ነው?
Scala 2.10 ስውር ክፍሎች የሚባል አዲስ ባህሪ አስተዋውቋል። ስውር ክፍል በተዘዋዋሪ ቁልፍ ቃል ምልክት የተደረገበት ክፍል ነው። ይህ ቁልፍ ቃል የክፍሉን ቀዳሚ ገንቢ ለተዘዋዋሪ ልወጣዎች ክፍሉ በሚሰፋበት ጊዜ እንዲገኝ ያደርገዋል። በSIP-13 ውስጥ ስውር ክፍሎች ቀርበዋል።