Ubuntu/Debian-da Apache Spark-y nädip gurmaly we gurnamaly


“Apache Spark” has çalt hasaplama netijelerini üpjün etmek üçin döredilen açyk çeşme paýlanan hasaplama çarçuwasydyr. Bu ýatda hasaplaýyş hereketlendirijisidir, ýagny maglumatlar ýatda işlener.

“Spark” akym, grafiki gaýtadan işlemek, SQL, MLLib üçin dürli API-leri goldaýar. Şeýle hem, Java, Python, Scala we R-i ileri tutulýan diller hökmünde goldaýar. “Spark” esasan Hadoop toparlarynda gurnalýar, ýöne uçguny özbaşdak tertipde gurup we sazlap bilersiňiz.

Bu makalada Debian we Ubuntu esasly paýlamalarda Apache Spark-y nädip gurmalydygyny göreris.

Ubuntu-da Java we Scala guruň

Ubuntu-da Apache Spark-y gurmak üçin enjamyňyzda Java we Scala gurlan bolmaly. Döwrebap paýlamalaryň köpüsi deslapky gurnalan Java bilen gelýär we aşakdaky buýrugy ulanyp barlap bilersiňiz.

$ java -version

Çykyş ýok bolsa, Java-ny Ubuntu-da nädip gurmalydygy baradaky makalamyzy ulanyp ýa-da Ubuntu we Debian esasly paýlamalarda Java gurmak üçin aşakdaky buýruklary işledip bilersiňiz.

$ sudo apt update
$ sudo apt install default-jre
$ java -version

Ondan soň, skalany gözlemek we gurmak üçin aşakdaky buýruklary işledip, amatly ammardan Scala gurup bilersiňiz.

$ sudo apt search scala  ⇒ Search for the package
$ sudo apt install scala ⇒ Install the package

Scala-nyň gurnalyşyny barlamak üçin aşakdaky buýrugy işlediň.

$ scala -version 

Scala code runner version 2.11.12 -- Copyright 2002-2017, LAMP/EPFL

Ubuntu-da Apache Spark guruň

Indi faýly gönüden-göni terminalda göçürip almak üçin resmi wget buýrugyna geçiň.

$ wget https://apachemirror.wuchna.com/spark/spark-3.1.1/spark-3.1.1-bin-hadoop2.7.tgz

Indi terminalyňyzy açyň we göçürilen faýlyňyzyň ýerleşýän ýerine geçiň we Apache Spark tar faýlyny çykarmak üçin aşakdaky buýrugy işlediň.

$ tar -xvzf spark-3.1.1-bin-hadoop2.7.tgz

Ahyrynda, çykarylan Spark katalogyny/opt katalogyna geçiriň.

$ sudo mv spark-3.1.1-bin-hadoop2.7 /opt/spark

Uçgun üçin daşky gurşaw üýtgeýjilerini sazlaň

Indi uçgun başlamazdan ozal .profile faýlyňyzda birnäçe daşky gurşaw üýtgeýjisini bellemeli.

$ echo "export SPARK_HOME=/opt/spark" >> ~/.profile
$ echo "export PATH=$PATH:/opt/spark/bin:/opt/spark/sbin" >> ~/.profile
$ echo "export PYSPARK_PYTHON=/usr/bin/python3" >> ~/.profile

Bu täze daşky gurşaw üýtgeýjileriniň gabygyň içinde elýeterlidigine we Apache Spark-a elýeterlidigine göz ýetirmek üçin soňky üýtgeşmeleriň güýje girmegi üçin aşakdaky buýrugy işletmek hem hökmanydyr.

$ source ~/.profile

Hyzmatlary başlamak we duruzmak üçin uçgun bilen baglanyşykly ikilikler sbin bukjasynyň aşagyndadyr.

$ ls -l /opt/spark

Ubuntu-da Apache Spark-a başlaň

“Spark” esasy hyzmatyny we gul hyzmatyny başlamak üçin aşakdaky buýrugy işlediň.

$ start-master.sh
$ start-workers.sh spark://localhost:7077

Hyzmat başlansoň, brauzere giriň we aşakdaky URL giriş uçgun sahypasyny ýazyň. Sahypadan meniň hojaýynymyň we gul gullugymyň başlandygyny görüp bilersiňiz.

http://localhost:8080/
OR
http://127.0.0.1:8080

“Spark-shell” buýrugyny işe girizip, “spark-shell” -iň gowy işleýändigini ýa-da ýokdugyny barlap bilersiňiz.

$ spark-shell

Bu makala üçin. Soonakynda sizi başga bir gyzykly makala bilen gyzyklandyrarys.