Hadoop Setting - Arumprimandari.files.wordpress

1y ago
17 Views
2 Downloads
2.53 MB
19 Pages
Last View : 1m ago
Last Download : 3m ago
Upload by : Rafael Ruffin
Transcription

HADOOP SETTINGArum Handini Primandari

PERSIAPANPastikan setting virtualization technologylaptop ENABLEBuka setting bios: Restart laptop Masuk ke setting bios pada saat laptop booting. Catatan:setiap merk laptop memiliki kunci masuk bios yangberbeda-beda, googling terlebih dahulu, contoh: tekanF2 pada dell ketika booting (logo dell muncul) Cari setting untuk virtualization , arahkan pada“ENABLE”. Terkadang, virtualization berada di menu“option” atau menu tersendiri.

VIRTUAL MACHINEVirtual machine (VM) dalam komputasimerupakan tiruan dari system computer yangdapat menjalankan program yang samaseperti computer biasa.Kegunaan VM: Mencoba suatu software baru. Apabila terjadikerusakan VM karena software tersebut, maka tidakakan mempengaruhi komputer aslinya. Menjalankan software yang tidak disupport oleh OSdari komputer asli.Terdapat beberapa pilihan virtual machineyang dapat digunakan, seperti vmware atauvirtualbox (dari Oracle)

INSTALL VIRTUAL MACHINEAtau vmware sktop end user computing/vmware workstation player/14 0Install vmware

INSTALL VIRTUAL MACHINEDownload virtualbox oracle:https://www.virtualbox.org/Install virtualbox

CLOUDERA kstart vms/5-13.htmlCDH: Cloudera Distributionfor HadoopPilih platform:vmware/virtualbox

MENGAKSES HADOOPMobaxtermUntuk mengakses Hadoop, client dapatmenggunakan browser, mobaxterm, atau putty.Misalkan, client (yang menggunakan OSWindows) ingin mengakses file di VM-Linux.Untuk keperluan tersebut, client membutuhkanmobaxterm.Lakukan installasi mobaxterm. Contoh: gunakanMobaXterm Installer v10.5Klik session untuk membuat sesikoneksi baru.

MOBAXTERMKlik SSH untuk membuat koneksidengan protocol SSH.Untuk terhubung dengan VM-Linux,kita membutuhkan nomor IP.Mendapatkan IP dari VM-Linux:Pada panel cloudera-quicstart, klikicon terminalKetikkan perintah: ifconfigNomor IP akan muncul pada “inetaddr”Copy nomor IP tersebut, kemudianpastekan pada mobaxterm bagianRemote host. Gunakan username:Specify username: cloudera.

MOBAXTERMGunakan perintah berikut pada terminalmobaxterm: 𝑙𝑙 digunakan untuk melihat direktori yang berada didalam linux 𝑚𝑘𝑑𝑖𝑟 digunakan untuk membuat direktori baruSelain mengakses Linux, mobaxtermdigunakan untuk mengakses Hadoop: ℎ𝑑𝑓𝑠 𝑑𝑓𝑠 digunakan untuk mengakses HDFS(Hadoop Distributed File System) ℎ𝑑𝑓𝑠 𝑑𝑓𝑠 𝑙𝑠 /𝑢𝑠𝑒𝑟 digunakan untukmemunculkan user dibawah Hadoop ℎ𝑑𝑓𝑠 𝑑𝑓𝑠 𝑚𝑘𝑑𝑖𝑟 /𝑑𝑖𝑟 digunakan untukmembuat direktori. Contoh: ℎ𝑑𝑓𝑠 𝑑𝑓𝑠 𝑚𝑘𝑑𝑖𝑟 /user/cloudera/contoh ℎ𝑑𝑓𝑠 𝑑𝑓𝑠 �� digunakan untukmeng-copy file dari local Linux ke dalam hdfsUntuk memulai, ketikkan password: cloudera.Dengan begitu, mobaxterm siap digunakan.

MOBAXTERMContoh:Buat folder “projects” dibawahfolder /home/cloudera/DocumentsUpload file “Adult.csv” ke dalamfolder tersebut. Gunakan icon“upload to this current folder” untukmengambil file dari folder di OSWindows

MOBAXTERMBuat folder dengan nama “contoh” dalam hdfsℎ𝑑𝑓𝑠 𝑑𝑓𝑠 𝑚𝑘𝑑𝑖𝑟 /user/cloudera/contohPastikan bahwa folder tersebut telah adaℎ𝑑𝑓𝑠 𝑑𝑓𝑠 𝑙𝑠 /user/clouderaCopy file “Adult.csv” dari Linux, ke dalam hdfsℎ𝑑𝑓𝑠 𝑑𝑓𝑠 //localhost/user/cloudera/contoh/Adult.csv

HUESelain menggunakan terminal,mengakses dan menjalankan hdfsdapat dilakukan denganmenggunakan user interface HUE(Hadoop User Experience)Gunakan: Username: cloudera Password: cloudera

HUEKlik icon tersebut yaitu Filebrowser dalam HUE.Folder “contoh” dan data“Adult.csv” berada di bawah/user/cloudera.

METASTORE TABLEData yang akan diolah (query)menggunakan tools yang tersediadalam Hadoop, diubah ke dalammetastore table terlebih dahulu.Langkah-langkah: Klik “Data Browser”, kemudian pilih“Metastore Table”, klik “default” (tempatpenyimpanan table) Klik icon “create a new table from file” (iconkertas dengan tanda plus) Isikan nama table name, input file (pilihlokasi tempat menyimpan file)

METASTORE TABLEIkuti setiap step. Pada step 3:define Columns, perhatikan: Nama kolomnya Tipe data kolom: Klik “create table” jika sudah selesai.

TIPE DATA INTEGER

QUERYUntuk melakukan query, dapatdigunakan tools Hadoop “Hive” ponents/180)Pada “Query Editor” pilih “Hive”Hive is a data warehouse infrastructure tool to process structureddata in Hadoop. It resides on top of Hadoop to summarize BigData, and makes querying and analyzing easy.(https://www.tutorialspoint.com/hive/hive introduction.htm)

QUERYGunakan data: AdultLakukan query, contoh: tampilkansemua kolom pada table adult, dimanaage lebih dari 25

BERTUKAR FILE ANTARA OSUntuk keperluan bertukar file antara OS Windowsdengan VM-Linux, selain menggunakan mobaxtermdapat pula melalaui beberapa cara: Drag and drop dari Windows ke Linux Pada versi lama cloudera-quickstarts, bertukar file cukup dragdari Windows ke folder di Linux Pada versi baru cloudera-quickstart, bertukar file dengan dragand drop perlu disetel terlebih dahulu. sharing folder antara kedua OS.

PERSIAPAN Pastikan setting virtualization technology laptop ENABLE Buka setting bios: Restart laptop Masuk ke setting bios pada saat laptop booting. Catatan: setiap merk laptop memiliki kunci masuk bios yang

Related Documents:

1: hadoop 2 2 Apache Hadoop? 2 Apache Hadoop : 2: 2 2 Examples 3 Linux 3 Hadoop ubuntu 5 Hadoop: 5: 6 SSH: 6 hadoop sudoer: 8 IPv6: 8 Hadoop: 8 Hadoop HDFS 9 2: MapReduce 13 13 13 Examples 13 ( Java Python) 13 3: Hadoop 17 Examples 17 hoods hadoop 17 hadoop fs -mkdir: 17: 17: 17 hadoop fs -put: 17: 17

2006: Doug Cutting implements Hadoop 0.1. after reading above papers 2008: Yahoo! Uses Hadoop as it solves their search engine scalability issues 2010: Facebook, LinkedIn, eBay use Hadoop 2012: Hadoop 1.0 released 2013: Hadoop 2.2 („aka Hadoop 2.0") released 2017: Hadoop 3.0 released HADOOP TIMELINE Daimler TSS Data Warehouse / DHBW 12

The hadoop distributed file system Anatomy of a hadoop cluster Breakthroughs of hadoop Hadoop distributions: Apache hadoop Cloudera hadoop Horton networks hadoop MapR hadoop Hands On: Installation of virtual machine using VMPlayer on host machine. and work with some basics unix commands needs for hadoop.

The In-Memory Accelerator for Hadoop is a first-of-its-kind Hadoop extension that works with your choice of Hadoop distribution, which can be any commercial or open source version of Hadoop available, including Hadoop 1.x and Hadoop 2.x distributions. The In-Memory Accelerator for Hadoop is designed to provide the same performance

Configuring SSH: 6 Add hadoop user to sudoer's list: 8 Disabling IPv6: 8 Installing Hadoop: 8 Hadoop overview and HDFS 9 Chapter 2: Debugging Hadoop MR Java code in local eclipse dev environment. 12 Introduction 12 Remarks 12 Examples 12 Steps for configuration 12 Chapter 3: Hadoop commands 14 Syntax 14 Examples 14 Hadoop v1 Commands 14 1 .

-Type "sudo tar -xvzf hadoop-2.7.3.tar.gz" 6. I renamed the download to something easier to type-out later. -Type "sudo mv hadoop-2.7.3 hadoop" 7. Make this hduser an owner of this directory just to be sure. -Type "sudo chown -R hduser:hadoop hadoop" 8. Now that we have hadoop, we have to configure it before it can launch its daemons (i.e .

Hadoop and Pig Overview Lavanya Ramakrishnan Shane Canon . Source: Hadoop: The Definitive Guide Zoo Keeper 13 Constantly evolving! Google Vs Hadoop Google Hadoop MapReduce Hadoop MapReduce GFS HDFS Sawzall Pig, Hive . Hadoop on Amazon – Elastic MapReduce 19 .

Accounting information from several branches can be merged, making decision-making easy and fast. End of Chapter Questions 1 Anti-virus software, complicated passwords. 2 Email, cloud. 3 You can save your work, easy to send to other people, calculations and templates are already there for you to use. 4 Hacking, failure in technology – power cut, some software is expensive. Exam Practice 1B .