19Nh14 102190051 Lab13 Chương Trình MapReduce Shortest Path Using Parallel Breadth First Search BFS 02
19Nh14 102190051 Lab13 Chương Trình MapReduce Shortest Path Using Parallel Breadth First Search BFS 02
Single-source all pairs shortest path using MapReduce using parallel Breadth-
First Search (BFS)
import java.io.IOException;
import java.util.*;
import java.io.*;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.*;
import org.apache.hadoop.mapred.*;
import org.apache.hadoop.mapred.Reducer;
JobClient.runJob(conf);
input = output + "/part-00000";
isdone = true;// set the job to NOT run again!
Path ofile = new Path(input);
FileSystem fs = FileSystem.get(new Configuration());
BufferedReader br = new BufferedReader(new
InputStreamReader(fs.open(ofile)));
HashMap<Integer, Integer> imap = new HashMap<Integer, Integer>();
String line = br.readLine();
▪ Xóa thư mục /inputXYZ nếu đã có, tạo mới và chép dữ liệu vào
C:\hadoop\MapReduceDijkstra> hadoop fs -rm -r /inputXYZ
C:\hadoop\MapReduceDijkstra> hadoop fs -mkdir /inputXYZ
C:\hadoop\MapReduceDijkstra> hadoop fs -put input.txt /inputXYZ
C:\hadoop\MapReduceDijkstra> hadoop fs -ls /inputXYZ
▪ Chạy chương trình Mapreduce với dữ liệu trong thư mục /inputXYZ, kết quả xuất
ra /outputXYZ
C:\hadoop\MapReduceDijkstra> hadoop jar DijikstraAlgoXYZ.jar
DijikstraAlgo /inputXYZ /outputXYZ
▪ Xem kết quả trong /outputXYZ
C:\hadoop\MapReduceDijkstra> hadoop fs -ls /outputXYZ
C:\hadoop\MapReduceDijkstra> hadoop fs -cat /outputXYZ/part-00000
C:\hadoop\MapReduceDijkstra> hadoop fs -ls /
...
drwxr-xr-x - Administrator supergroup 0 2020-05-29 21:42
/outputXYZ8410063875399
drwxr-xr-x - Administrator supergroup 0 2020-05-29 21:43
/outputXYZ8438998593800
drwxr-xr-x - Administrator supergroup 0 2020-05-29 21:43
/outputXYZ8466858608600
drwxr-xr-x - Administrator supergroup 0 2020-05-29 21:44
/outputXYZ8493736824100
drwxr-xr-x - Administrator supergroup 0 2020-05-29 21:44
/outputXYZ8521702985899
drwxr-xr-x - Administrator supergroup 0 2020-05-29 21:45
/outputXYZ8548641333699
drwxr-xr-x - Administrator supergroup 0 2020-05-29 21:45
/outputXYZ8575511550900
drwxr-xr-x - Administrator supergroup 0 2020-05-29 21:46
/outputXYZ8602344027600
drwxr-xr-x - Administrator supergroup 0 2020-05-29 21:46
/outputXYZ8630000939199
drwxr-xr-x - Administrator supergroup 0 2020-05-29 21:47
/outputXYZ8656867697199
drwxr-xr-x - Administrator supergroup 0 2020-05-29 21:47
/outputXYZ8684539938899
drwxr-xr-x - Administrator supergroup 0 2020-05-29 21:47
/outputXYZ8712262906899
drwxr-xr-x - Administrator supergroup 0 2020-05-29 21:48
/outputXYZ8738960567900
drwxr-xr-x - Administrator supergroup 0 2020-05-29 21:48
/outputXYZ8766829451500
drwxr-xr-x - Administrator supergroup 0 2020-05-29 21:49
/outputXYZ8793523778799
drwxr-xr-x - Administrator supergroup 0 2020-05-29 21:49
/outputXYZ8821352860500
drwxr-xr-x - Administrator supergroup 0 2020-05-29 21:50
/outputXYZ8848041850900
drwxr-xr-x - Administrator supergroup 0 2020-05-29 21:50
/outputXYZ8875991420900
drwxr-xr-x - Administrator supergroup 0 2020-05-29 21:51
/outputXYZ8903077597800
4. Bài tập
Mô tả quá trình thực hiện sử dụng giải thuật MapReduce theo các bước như sau:
a) Tổ chức dữ liệu đầu vào
b) Quá trình Map? Cho ví dụ minh họa
c) Quá trình Reduce? Cho ví dụ minh họa
d) Chạy chương trình với nhiều bộ dữ liệu khác.