我国虽然鲜有顶尖级的系统软件商业公司,但我们在科技领域并不缺少世界顶尖人才和成果。以清华大学朱晓伟博士为例,他在读期间专注于图计算领域,研发的Gemini分布式图计算系统,处理速度超出学术界最快系统10倍(通常性能超出40%~50%已经是很好的优化,超出2倍就很夸张了,超出10倍,可想而知学术界的震惊情况),朱晓伟博士在2016年投稿USENIX ATC会议时,因其中一位评审专家不相信能达到这样的性能而被拒绝入选,用该专家话说,“too good to be true”。无奈,朱晓伟博士只得补充了一些其他系统性能不足的原因分析,并附上源码接受挑战,因祸得福,论文最终入选USENIX主办的OSDI(Operating Systems Design and Implementation,OS领域最好的会议之一),这也是我国第一次有高校主导的学术研究入选OSDI,如今该论文已经作为图数据领域的标杆被引用多达上百次。
系统软件的成熟需要长期的投入和积累,很难像互联网产业那样从一个商业模式快速迭代成一个TOP级的商业公司。一款成熟的系统软件需要两个必要的条件:优秀的人才和持续的积累。这些人才和积累,就是商业公司的壁垒。人才方面,顶尖的系统软件人才,在实习期,甚至在优秀论文发表进入学术界视野的时候,往往就已经被国外的技术公司“盯上了”;即便是留在国内公司,也会很分散的进入BAT(百度阿里腾讯)、TMD(头条美团滴滴)等企业作为项目负责人率队解决实用的难题或者去复刻国外系统,很难集中一批优秀的人才专注在某一领域持续创新研究。毕竟把几个顶尖人才放在一个项目里是极其奢侈的,从人力成本的角度考虑,即便大厂也不愿意做。人才的分散,使得技术积累变得更加困难,而高校积累的、曾经闪闪发光的那些研究成果,随着学生毕业进入工作环境,也会因为缺少精力维护而搁浅,被埋没或遗忘。
朱晓伟博士在毕业前同样面临着同样的困惑:Gemini系统即将被束之高阁么?这么多年的学习和研究,很可能就要作为基石,被其他国家的科学家进一步研发、商用、构建新的壁垒。“不甘心”这几个字在他心里生根发芽。
清华顶尖博士团队变革系统软件的科技格局
图数据很多人不太了解,这里简单的普及一下。图是将信息中的实体,以及实体之间的关系,分别抽象表达成为顶点以及顶点间的边这样的结构数据。图计算系统就是针对图数据处理的系统,它在图结构的数据上进行针对性优化的高效计算,尤其适合大规模的关联关系分析。相比传统的关系型数据(以Oracle为代表),图的逻辑可以很好的解决目前遇到的关联数据分析问题,如绘制用户社交关系图谱做社交影响力排名、好友推荐;通过绘制资金交易图谱做大数据征信、反欺诈等应用;构建设备关系网络图谱实现物联网建模分析、供电网络建模分析等等。