最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 科技 - 知识百科 - 正文

使用Python编写MapReduce作业

来源:动视网 责编:小采 时间:2020-11-27 14:28:29
文档

使用Python编写MapReduce作业

使用Python编写MapReduce作业:mrjob 可以让用 Python 2.5+ 来编写 MapReduce 作业,并在多个不同平台上运行,你可以:使用纯 Python 编写多步的 MapReduce 作业在本机上进行测试在 Hadoop 集群上运行使用 Amazon Elastic MapReduce (EMR) 在云上运行pip 的安装方
推荐度:
导读使用Python编写MapReduce作业:mrjob 可以让用 Python 2.5+ 来编写 MapReduce 作业,并在多个不同平台上运行,你可以:使用纯 Python 编写多步的 MapReduce 作业在本机上进行测试在 Hadoop 集群上运行使用 Amazon Elastic MapReduce (EMR) 在云上运行pip 的安装方


mrjob 可以让用 Python 2.5+ 来编写 MapReduce 作业,并在多个不同平台上运行,你可以:

使用纯 Python 编写多步的 MapReduce 作业

在本机上进行测试

在 Hadoop 集群上运行

使用 Amazon Elastic MapReduce (EMR) 在云上运行

pip 的安装方法非常简单,无需配置,直接运行:pip install mrjob

代码实例:

from mrjob.job import MRJob
class MRWordCounter(MRJob):
 def mapper(self, key, line):
 for word in line.split():
 yield word, 1
 def reducer(self, word, occurrences):
 yield word, sum(occurrences)
if __name__ == '__main__':
 MRWordCounter.run()

文档

使用Python编写MapReduce作业

使用Python编写MapReduce作业:mrjob 可以让用 Python 2.5+ 来编写 MapReduce 作业,并在多个不同平台上运行,你可以:使用纯 Python 编写多步的 MapReduce 作业在本机上进行测试在 Hadoop 集群上运行使用 Amazon Elastic MapReduce (EMR) 在云上运行pip 的安装方
推荐度:
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top