ዝርዝር ሁኔታ:

Pythonን Hadoop ላይ ማሄድ እችላለሁ?
Pythonን Hadoop ላይ ማሄድ እችላለሁ?

ቪዲዮ: Pythonን Hadoop ላይ ማሄድ እችላለሁ?

ቪዲዮ: Pythonን Hadoop ላይ ማሄድ እችላለሁ?
ቪዲዮ: Data Science with Python! Analyzing File Types from Avro to Stata 2024, ግንቦት
Anonim

እንደ ጃቫ፣ ስካላ እና ፕሮግራሚንግ ባሉ ቋንቋዎች መካከል ካለው ምርጫ ጋር ፒዘን ለ ሃዱፕ ሥነ-ምህዳር፣ አብዛኞቹ ገንቢዎች ይጠቀማሉ ፒዘን ለመረጃ ትንተና ተግባራት ድጋፍ ሰጪ ቤተ-መጽሐፍት ስላለው። ሃዱፕ ዥረት ተጠቃሚው እንዲፈጥር እና እንዲፈጥር ያስችለዋል። ማስፈጸም በማናቸውም ስክሪፕት ወይም እንደ ካርታ ወይም/እና መቀነሻ ሆኖ ስራዎችን ካርታ/ይቀንስ።

በተመሳሳይ፣ Python ከ Hadoop ጋር እንዴት ይገናኛል?

Hadoop HDFSን ከ Python ጋር በማገናኘት ላይ

  1. ደረጃ 1፡ Hadoop HDFS በትክክል እየሰራ መሆኑን ያረጋግጡ። Terminal/Command Promptን ክፈት፣ኤችዲኤፍኤስ እየሰራ መሆኑን የሚከተሉትን ትዕዛዞች በመጠቀም ያረጋግጡ፡ start-dfs.sh.
  2. ደረጃ 2፡ libhdfs3 ላይብረሪ ጫን።
  3. ደረጃ 3፡ hdfs3 ላይብረሪ ጫን።
  4. ደረጃ 4፡ ከኤችዲኤፍኤስ ጋር ያለው ግንኙነት የተሳካ መሆኑን ያረጋግጡ።

በተመሳሳይ፣ በ Python ውስጥ Hadoop ምንድን ነው? ፒዘን በፕሮግራሚንግ ዓለም ውስጥ ሁሉንም ነገር ለመስራት የሚያገለግል አጠቃላይ ዓላማ የተሟላ የፕሮግራሚንግ ቋንቋ ነው። ሃዱፕ በጃቫ የተፃፈ ትልቅ የመረጃ ቋት ሲሆን ከፍተኛ መጠን ያላቸውን መረጃዎች ለመቋቋም የሚያስችል ነው። ብዙ የመስመር ላይ ተቋማት አሉ። ሃዱፕ ጋር ፒዘን ኮርሶች እንደ: Analytixlabs. ኤዱሬካ.

በመቀጠል፣ ጥያቄው በ Hadoop ውስጥ የ Python MapReduce ፕሮግራም እንዴት ነው የማሄድው?

በ Python ውስጥ Hadoop MapReduce ፕሮግራም መጻፍ

  1. ተነሳሽነት.
  2. እኛ ማድረግ የምንፈልገው.
  3. ቅድመ-ሁኔታዎች.
  4. Python MapReduce ኮድ. የካርታ ደረጃ፡ mapper.py. ደረጃ ቀንስ፡ reducer.py.
  5. የ Python ኮድን በ Hadoop ላይ በማስኬድ ላይ። የምሳሌ ግቤት ውሂብ አውርድ። የአካባቢ ምሳሌ ውሂብ ወደ HDFS ይቅዱ።
  6. የተሻሻለ የካርታ እና የመቀየሪያ ኮድ፡ Python ተደጋጋሚ እና ጄነሬተሮችን በመጠቀም። ካርታ.ፒ. ቀያሪ.py.

Hadoop Streaming jar ምንድን ነው?

ሃዱፕ ስርጭት የሚባል የጃቫ መገልገያ ያቀርባል Hadoop ዥረት . የታሸገው በ ማሰሮ ፋይል. ጋር Hadoop ዥረት , እኛ መፍጠር እና ማስኬድ የካርታ ስራዎችን መቀነስ በሚቻል ስክሪፕት. Hadoop ዥረት ከ ጋር አብሮ የሚመጣ መገልገያ ነው። ሃዱፕ ስርጭት. ለትልቅ መረጃ ትንተና ፕሮግራሞችን ለማስኬድ ጥቅም ላይ ሊውል ይችላል.

የሚመከር: