高性能计算与云计算实验三报告

资源ID：55694374 资源大小：491.50KB 全文页数：8页
资源格式： DOCX 下载权限：游客/注册会员 下载费用：10积分【人民币10元】

快捷注册下载

会员登录下载

三方登录下载：

下载资源需要10积分【人民币10元】

邮箱/手机：
温馨提示：	支付成功后，系统会自动生成账号（用户名和密码都是您填写的邮箱或者手机号），方便下次登录下载和查询订单；
支付方式：
验证码：	换一换

下载资源需要10积分【人民币10元】

已注册用户请登录：

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，既可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰

网站客服

侵权投诉

高性能计算与云计算实验三报告

下载后可任意编辑高性能计算与云计算实验报告 Map/Reduce编程学院计算机科学与工程学院班级计算机软件3班学生姓名钟鑫旺学号 202430621083 指导老师胡金龙、董守斌提交日期 2024.1.4 1．实验目的本实验的目的是通过练习掌握Map/Reduce编程的知识和技巧 1 熟悉建立分布式高性能计算平台Hadoop的基本步骤 2 掌握用Map/Reduce编写并行计算程序的基本方法 3 了解Map/Reduce计算程序在Hadoop下的运行和调试机制 2．实验要求分组完成实验内容（2～4个人） 1 计算平台搭建 2 程序设计及实现 3 回答实验中提出的问题； 4 结果分析随实验报告，附代码、程序说明以及运行结果。 3．实验内容基于Hadoop平台通过并行计算解决串匹配的问题。 4． Hadoop计算平台搭建（1）以同组同学的多台计算机搭建一个完全分布式的Hadoop计算平台。（2）在搭建的平台上运行WordCount程序，输出结果。实验原理 Hadoop 的最常见用法之一是 Web 搜索。虽然它不是唯一的软件框架应用程序，但作为一个并行数据处理引擎，它的表现非常突出。Hadoop 最有趣的方面之一是 Map and Reduce 流程，它受到Google开发的启发。这个流程称为创建索引，它将 Web爬行器检索到的文本 Web 页面作为输入，并且将这些页面上的单词的频率报告作为结果。然后可以在整个 Web 搜索过程中使用这个结果从已定义的搜索参数中识别内容。最简单的 MapReduce应用程序至少包含 3 个部分一个 Map 函数、一个 Reduce 函数和一个 main 函数。main 函数将作业控制和文件输入/输出结合起来。在这点上，Hadoop 提供了大量的接口和抽象类，从而为 Hadoop应用程序开发人员提供许多工具，可用于调试和性能度量等。 MapReduce 本身就是用于并行处理大数据集的软件框架。MapReduce 的根源是函数性编程中的 map 和 reduce 函数。它由两个可能包含有许多实例（许多 Map 和 Reduce）的操作组成。Map 函数接受一组数据并将其转换为一个键/值对列表，输入域中的每个元素对应一个键/值对。Reduce 函数接受 Map 函数生成的列表，然后根据它们的键（为每个键生成一个键/值对）缩小键/值对列表。 5． Map/Reduce编程基于MapReduce实现以下任意一个并行算法（1）并行串匹配算法（2）平行排序算法（3）最短路径算法（4）并行矩阵乘法（简单并行算法、cannon算法、DNS算法等）实验调优（可选） [1] 选取不同个数和不同大小的实验文本，多次运行你的程序，记录不同的运行时间，并画成图表； [2] 计算不同情形下的加速比。完成关于本次课程设计的综合实验报告，并回答以下问题 a 说明并行算法设计的基本思路，并列出参考文献。 b 指出你如何通过系统配置，设置workers及任务调度，将问题分布到多个节点上运行。 c 谈谈对Map/Reduce编程的一些认识和在本实验中遇到的问题等。问题回答要包括在实验报告中。也就是说，最终需要提交的实验报告要有详细实验步骤（包括必要的截图）、源代码、运行和结果输出（截图）以及问题回答。 6．【实验方案设计】 3.1 Hadoop计算平台搭建（1）以同组同学的多台计算机搭建一个完全分布式的Hadoop计算平台。（2）在搭建的平台上运行WordCount程序，输出结果。 3.2 Map/Reduce编程基于MapReduce实现以下任意一个并行算法（1）并行串匹配算法（2）平行排序算法（3）最短路径算法（4）并行矩阵乘法（简单并行算法、cannon算法、DNS算法等）通过并行计算解决串匹配的问题【实验过程】（实验步骤、记录、数据、分析） ① 开3个虚拟机，它们的主机名分别为xiaominghupan，node01，node02 ② 在/etc/hosts追加如下内容 192.168.3.100 xiaominghupan 192.168.3.101 node01 192.168.3.102 node02 ③ 配置ssh免密码登陆 ④ 下载hadoop-1.2.1.tar.gz ⑤ 解压hadoop-1.2.1.tar.gz tar -zxvf hadoop-1.2.1-bin.tar.gz –C /opt ⑥ 修改conf/hadoop-env.sh，添加JAVA_HOME变量 vi conf/hadoop-env.sh 添加export JAVA_HOME/usr/lib/jvm/java ⑦ 执行hadoop命令 ./bin/Hadoop 说明安装正常 ⑧ 在xiaominghupan主机上配置conf/masters为如下内容 xiaominghupan ⑨ 在3台主机上都配置conf/slaves为如下内容 xiaominghupan node01 node02 ⑩ 在3台主机上都配置core-site.xml，增加以下属性 property namefs.default.name/name valuehdfs//master9000/value ------定位文件系统的NameNode /property ⑪ 配置hdfs-site.xml，增加以下属性 property namedfs.replication/name value3/value /property ⑫ 配置mapred-site.xml，增加以下属性 property namemapred.job.tracker/name valuemaster9001/value /property ⑬ 格式化hdfs hadoop namenode -at ⑭ 启动hadoop bin/start-all.sh ⑮ 运行WordCount 在eclipse中新建一个WordCount项目，把 hadoop-1.2.1/src/examples/org/apache/hadoop/examples/

注意事项

本文（高性能计算与云计算实验三报告）为本站会员（fengruiling）主动上传，蚂蚁文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知蚂蚁文库（发送邮件至2303240369@qq.com或直接QQ联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。