权术小说网

权术小说网>科技革命,从1984开始 > 第220章 大数据处理关键操作(第1页)

第220章 大数据处理关键操作(第1页)

“当然可以,你拿去看吧,有什么意见尽管跟我说。”

李卫脸上挂着温和的笑容,语气客气地说道。

秦奕接过论文,迫不及待地开始快速浏览其中的关键论述——这篇论文主要阐述了并行程序中并行、汇聚、通讯、映射及归纳等机制的语义。

看着看着,他的眼中闪过一丝惊喜,这里面描述的不正是前世互联网大数据处理框架MAPREDUCE里的基本操作吗!

前世,搜索引擎巨头谷歌在2004年前后发布了三篇奠定大数据处理基础的论文——《TheGoogleFileSystem》《MapReduce:SimplifiedDataProcessingonLargeClusters》《Bigtable:ADistributedStorageSystemforStructuredData》。

这三篇论文为大数据处理领域带来了全新的思路和方法,宛如一把火,瞬间点燃了学术界和工业界对大规模数据处理技术的研究热情,也有力推动了Hadoop等开源项目的发展。

这些项目在之后的十几年里迅速成为了大数据基础设施,对整个大数据、云计算甚至是后来的人工智能行业都产生了深远影响。

其中,《MapReduce》这篇论文里使用的核心操作Map和Reduce,与李卫这篇论文中的映射和归纳两个机制,本质上如出一辙。

秦奕不禁思索,原来早在这个时候,相关的核心操作就已经在并行程序领域得到应用了吗?

或许当时撰写那三篇论文的谷歌程序员正是从这些并行程序的论文中获得了灵感。

当然,《MapReduce》论文不只是应用了这两个关键操作,它还围绕这两个核心操作,精心设计了一套完整的系统架构和实现机制,涵盖数据划分、任务调度、容错处理、数据代码互定位等功能,确保在大规模集群上能够稳定、高效地运行。

秦奕接着又仔细看了看李卫论文里的具体实验内容,是关于Ada语言在一些单机程序中的处理。

“李卫同志,我有个疑惑。”

他抬起头,目光看向李卫。

“说吧。”

李卫挑了挑眉,他刚才让对方提意见不过是句客气话,没想到这个秦奕还真敢有想法。

“你这里的并行程序,似乎只涉及单台计算机的多处理器并行,没有涉及多台计算机的并行处理。”

秦奕认真地说道。

“多台计算机的并行处理?”

李卫低声重复着这个词,随后笑道,“这需要用到计算机网络了,是吧?”

秦奕连忙点头,回答道:“对的。”

“我理解单台计算机虽然具备低延迟通信、易于管理和调度以及数据一致性维护简单等优势,但是它的处理器数量和内存容量等硬件资源有限。”

“一旦并行任务规模持续扩大,很快就会遭遇资源瓶颈,难以满足大规模计算需求。

如果想要进一步提升其性能,往往需要采用高端的多核处理器、大容量高速内存等硬件设备,硬件成本高昂,且能耗也相对较高。”

“如果借助计算机网络来实现程序的并行,那就可以通过增加计算机的数量,轻松扩展计算能力,理论上能够满足任意大规模的计算需求。”

李卫听后,笑着反驳:“你可别把计算机网络说得太神了。

请勿开启浏览器阅读模式,否则将导致章节内容缺失及无法阅读下一章。

相邻推荐:末世来了我在安全区,爽了  末世:我的风灵月影并不是很好使  异种  娇养  我家宗主有亿点苟  大果重生将军府  名柯琴酒?尝一口,呸!恋爱脑  影视快穿,财神爷家的傲娇公主  原神:天理,开门,逐火十三英桀  神魂归!血脉醒!她抬手寂灭神魔  别逃,我的妻!  我帝皇铠甲,在末世镇压百国诸神  师尊你会爱上我吗  长安幻想鼓点  替嫁皇妃嫁到,撩拨皇子脸红心跳  凡人:职场商战  (综漫同人)穿成名柯五人组老师后  踹翻剧情后,我火速随军乐逍遥  病娇:解释你不听,分手你刀我?  被偏执女神看上以后  

已完结热门小说推荐

最新标签

武侠小说一二看书网33言情网开心小说网随梦小说随梦小说网青帝文学网要看网奇书网书香小说网TXT小说网寻书书眼看书小说网眼看书小说网