2020年3月,国家提出加快新型基础设施建设进度。数字化转型将成为新基建时代的刚需,而在数字化转型的过程中,极致强大的算力则是处理爆发式增长数据的强劲支撑。面对海量的数据,尽管有算力超强的超级电脑助力,但其高昂的费用让众多的项目与机构望而却步,而分布式计算则成了破局之法。
什么是分布式计算?
简单来说,分布式计算就是连接世界各地的闲置算力,将其用于一些需要海量的计算任务。
分布式计算其实并不是一项新的技术,说到最早的分布式计算还要追溯到二十余年前,一项名为“在家中探索外星文明”(SETI@home:Search for Extraterrestrial Intelligence at home)的分布式算力共享项目。
在上个世纪九十年代,天文学也随着科技技术爆炸而有了长足的发展,随之产生了大量的外太空观测数据。加州大学伯克利分校的几位科学家希望从这些浩繁的宇宙信号中,探寻到外星文明的消息。由于无法支付高昂的数据分析费用,研究一度搁置,直到分布式计算的想法被提出——在全世界范围内募集贡献算力的志愿者,再将海量的观测数据分割成一个个迷你的任务包分配给闲置的计算机,分析完毕后再将数据传回,从而高效地完成数据的初步分析。
伯克利开放式网络计算平台BOINC
听说能计算出新冠疫苗?
从2008年起,Rosetta@home项目就已开展蛋白质结构预测、蛋白质-蛋白质对接和蛋白质设计的研究,它侧重于进行提高蛋白质组成方法的精确性和稳固性的基础研究,并且进行关于艾滋病、疟疾、癌症、阿兹海默病以及其他疾病的病理学的应用研究。
新冠病毒爆发后,Rosetta@home项目的官方在4月份发布公告,Rosetta@home已被用于预测冠状病毒重要的蛋白质原子级结构以及产生新的稳定的蛋白,病毒蛋白现已用于指导新型疫苗和抗病毒药物的设计。
Rosetta@home设计新的蛋白质并建立其三维模型
分布式计算还能做什么?
全世界的闲置算力连接在一起,就意味着近乎无限的计算资源,这些“无限”的计算资源,能够帮助各行各业解决因为时间、成本带来的桎梏。
AI训练/视频渲染/大数据分析
视频分布式渲染
“为了渲染《阿凡达》,维塔数码动用了占地10,000平方英尺的服务器群 。其中有4,000台服务器,共35,000个处理器核心。单机渲染一帧的平均时间为2小时,160分钟的影片, 整体渲染时间需要2880000小时,相当于一台服务器要工作328年!”
在图形流水线中,将通过渲染得到模型与动画最终显示效果,计算强度很大。而通过分布式计算方式,把任务分割成N个小任务,下发给N个人同时渲染,理论上来说,渲染时间只需原来的1/N,这将大大减少视频的制作周期,降低任务逾期的风险。
AI分布式训练
让机器遵守人为制定的规则并不是真正的智能,让机器能够像人一样具有分析学习能力才是人工智能最终的目标,而深度学习则是目前实现这一目标最接近的道路。深度学习就是把学习样本直接给到机器,让机器自己去分析个中规律,在这一模式下,尽可能多的样本就能尽可能高地提升机器的智能程度。然而大量的学习样本也就意味着需要海量的算力,分布式计算的方式正好能解决这一问题,将大大提高机器学习的效率。
大数据分布式分析
大数据是通过将大量的数据进行分析处理,从而得出最优的决策方案。而想要在更短的时间内做出更准确的判断,分布式计算的分析方式是最好的捷径。
分布式计算正在化解传统计算方式中成本和效率冲突的问题,也越来越多的企业和机构依靠分布式计算的低成本高效率完成了项目。
多元弹性去中性化网络计算平台——Jack&Me
Jack&Me就是这么一家算力共享平台,在这里只需要有一台电脑,即可与天文学家一起探寻宇宙,与医学家一起研究新冠病毒的治疗方法。
在以往,分布式算力共享项目由于其公益的性质,导致算力贡献者的动力不足,使分布式计算的光芒被掩藏了二十余年。Jack&Me通过区块链技术,通过对闲置计算资源的合理分配以及精准统计,让算力贡献者能更自由、公平地收获属于他们应得的经济报酬(积分兑换系统即将盛大上线),构建更具活力的智能生态。目前,已有近万人在Jack&Me上共享了自己的闲置算力。
jackandme.io
进入Jack&Me官网(jackandme.io),免费下载软件,选择项目,一键运行,将闲置的算力用于有益于全人类的事业中,在家为人类文明做出贡献。