非常荣幸今天有机会作为运营商代表来智慧城市论坛做工作汇报,今天我跟大家交流分享的题目是“运营商大大数据,城市大脑中的智慧信令”,今天的主题是以人为本,作为运营商,我们是传统意义上来说在城市大脑建设、智慧城市建设中提供一些基础的网络资源和提供一些基础的网络架构。
发展到今天的时代运营商也在转型,比如说我们做智慧城市的顶层应用,像各位老师讲到的顶层架构、顶层规划,由于在逐步的涉猎。基于这个我们今天从一个点去切入。我看很多老师讲数据是一个很重要的一环,我们从这个点切下来讲运营商数据,包括联通怎么服务的我们城市,帮助决策者提高决策和提高运行。
提到传统的智慧城市我们可以讲运营商一直以来发挥的角色,比较恰当来说是神经网络的角色,像刚才有AI的厂家还有一些传统做智慧城市的安防、决策的厂家,他们可能提供外围实际的应用,包括从硬件到软件、实际的方案部署应用。运营商作为沉在下面的云、互联网、广域网、城域网、大数据、运营商云IDC基础设施,这些都构成了智慧城市、城市大脑里的神经网络,存储、传递、加工。联通大数据公司主要做数据部分,就是数智、网联、云基,我们是做数据部分,如何服务信令的建设和智慧城市的建设。
简单介绍一下联通大数据有限公司,这个公司比较新,2017年9月25日正式成立,也是国内三家运营商第一个单独成立运营的大数据公司,定位是依托于已经集中在中国全量用户数据,做唯一的对外的出口,这是大数据公司的定位。我们的目标是做数据资源的聚合者、创新应用的牵引者和产业生态的建设者,我们现在更多做创新应用牵引者,依托于我们已经有的神经网络基础,再结合我们的数据赋能智慧城市,这是我们站在联通大数据的角度做智慧城市的切入点。
2017年9月25日到现在一年半多一点,我们经历了很多对于市场前端的摸索、实际应用的落地,包括对于能力和方案也有升级和迭代。2019年我们提出未来发展的方向就是依托于数和智两个核心的基础点搭建顶层应用。
“数”,全国有200亿个终端,大家不要感到惊讶,因为200亿不只是人还有物,智慧城市里面物的概念和人是同等重要的,因为智慧城市里人是实际的应用者和使用者,物是智慧城市的载体和感知点,比如说里面很多的摄象头、银行的ATM机,包括很多城市做智慧井盖,里面都插了运营商的卡,我们在数据这侧来讲,有张SIM卡就是一个终端,不管是井盖还是摄象头或是ATM,它就是终端。全国已经有200亿的终端规模,采集的数据也是各种维度的。我们在数据上实现的是规模升级,200亿个终端每天产生数据增加的量已经超过传统意义上做通信、信息摩尔定律增加的速度。
“智”,依托于我们的数据,包括外部的行业整合数据,我们面向顶层行业做应用、服务。最典型的是在智慧城市里可以应用在智慧城市的方方面面,从交通到旅游、城市治理、安防,每个领域我们的数据都是可以发挥这样的作用,做我们的行业应用。
这是联通大数据的优势,把联通的大数据能力给大家做一下展现,现在我们已经实现了全国数据的一点汇集,我们的一点汇集是三家运营商最早,我们2014年就已经完成了数据的汇集,我们在经历了2014年、2015年、2016年三年的试商用以后,2017年条件成熟以后才单独成立的大数据公司。现在平台已经存储的数据是90PB,这个数和BAT的数不在同一个量级,他们可能有几千P的数据。请大家数据,我们的数据相对于互联网数据来说,大数据领域有两个关键词:结构化和非结构化。我们的数据是偏结构化的,基本上可以通过以人为设备号做索引,串联出一系列连续的数据,而不像是在互联网里一个图片也是一个数据,一个视频也是一个数据,我们基本上是存储以后表单化、结构化的数据,实时上线的数据处理量是130个TB,大多数是实时的信令和业务数据。我们有2000多个计算节点。
谈到大数据,核心还要落到数据上,三家运营商的数据都差不多,就是这八个维度,大家可以看一下,当然这里面包含人也包含物,我合在一起讲。对于个人来讲身份就是身份证号,对于物来讲这个身份就是像旷视科技在摄像头里开一个卡,开卡的单位是旷视科技,这个像象头就归属于旷视科技。位置是很关键的,包括社交、帐单、通信等。
数据再展开看,每天上线多少TB,每天存了多少PB,信令处理的数据是1500亿条,话单实际产生的通话、短信和数据的传送,大家在现在的10010、10086掌厅看到用户的个人帐单我们也有,每天处理的数据130TB,上网数据每天处理1000亿条,我们可以解析4亿URL,这些都是不停增加的数据。
前面讲了那么多,主要是把我们的数据能力跟各位汇报。回到今天的实际主题,怎么样构建我们的智慧城市?有了这些数据,有了这些基础的运算资源,有了下面的云、管、端,传统意义上的智慧城市神经网络。我们现在做两件事情:一是打造5W的数据价值提议,5W很好理解,用户(Who)、位置时序(when+where)、行为兴趣(what)、关系网络(with whom)。同时数据能力体系基础上,我们做5M的对外输出能力,简单来说就是数据解析、位置时序关系洞察、行为兴趣分析、关系图谱挖掘、人工智能应用。回到今天的主题“以人为本”,5W展开一个就要讲很长的时间,我们主要讲位置时序,生活在智慧城市或是非智慧城市的人,只要你是一个单体的人,大家基本有手机,手机的覆盖率早就超过百分之百,只要携带手机,无时不刻的在产生通话、上网的需求,位置和时序是直接决定了我们人的行为轨迹、行为特征。对照智慧城市的管理、智慧城市的运营这是非常关键的点。
位置时序是比较直接的,什么时间在什么地方,时间带动的轨迹,放到我们内部讲我们叫时空信令,到今天位置+时序这块,这是运营商大数据运用更多的地方,到今天为止,我们积累了31个省的3亿用户三年了历史数据,我们和西班牙电信成立了一个子公司专门叫做位置足迹,专门做位置。到现在为止联通大数据公司是国内唯一一个可以提供存储三年以上位置矩阵的企业,我们是把所有的位置数据做了加工沉淀,这是位置基础的情况。
每个人的位置是无时不刻产生,智慧城市更多关注的是群体,对照个体还有隐私保护的问题,个人隐私保护转得比较紧,放在智慧城市里,很多顶层设计我们注意到已经考虑到这个方面,尽量从城市的宏观角度使用数据,而不是对照微观的个人,比如说安防、公安,我们也考虑到这个情况,把全国960万平方公里打了两层格子,第一层250×250的正方形,第二层是150×150边长的六边形,我们结合用户的位置,用户发生通信和互联网占用基站的关系,我们会把人和时间两个要素落到每个格子里。
我们可以向上直接输出全国960万平方公里,150×150六边形的格子和250×250正方形格子里的人行为属性、爱好,我们可以上升为城市应用。后面所有的应用大部分是基于这两个,一个是基础的位置数据,一个是加工沉淀、打好格子以后的栅格化的数据。
这是位置时序大数据平台,这个图里每个柱子对应是250×250米的栅格,每个柱子区分不同的喜号和年龄,这是实际的平台,这是位置时序的平台基础能力。
1、时空信令+政务,大家肯定会提到政务,这是在北京做的,怎么样看疏解人口或是疏解低端产业以后人流的变化。从北京的某个地方到了某些区域,这个当时是给北京市的市级领导做过汇报。也可以看出来,我们是通过历史的位置数据包括时间上的连续性,我们可以看区域跨域的人流分析,我们做了北京市、京津冀和雄安,基本上是面向政府监测人口的运行、人口运行背后关联的经济行为,这是政务领域。
2、公安,我们在公安领域是非常重视用户个人的隐私信息,目前面向公安提供的都是栅格化的统计数据服务。比如说格子里大概有多少人,这些人大概是什么样的属性,这个格子里大概是做什么样的事情。这儿有一个背景,大家看到题目是“公安人口流动调查”,大家知道中国有13亿人,这13亿人是怎么出来的?以前可能有8亿人、10亿人、13亿人,以前是通过调研员挨家挨户进行统计,这个工作非常辛苦。大部分的统计工作上门时间都是在晚上六点以后到半夜十二点,白天在上班,白天找不到人,人口跨区域的流动变化特别大以后,传统人口的统计手段很难奏效的统计出真实的人口数量,这个时候基于广域覆盖的运营商数据可以比较轻型化的做出人口的统计。
有的专家可能会问,联通大概3亿、4亿的用户,怎么能代表全国的用户规模?我们全国有大概4亿的用户,移动大概是8亿,大概是我们的2倍,电信是2亿多的规模。我们在算人口全量基本上是反推,我们有全国300多个地市的占比,我们结合用户占比挨个反算,反算出全部口径。
3、这是我们在政务领域帮发改委做的,珠三角、长三角、京津冀三大都市圈的人口关系,“人口视角下的三大都市圈”,就是看三大都市圈里,城市里的人是怎么流动,人的流动导致经济是怎么样的转化运行。
4、基于位置时序在智慧城市的商业里,旷视科技也提到商业领域的应用是非常大的领域,我们这儿也是这样,刚才我提到的250×250,150×150的栅格,它可以直接面向商业做选址,这个东西已经非常小颗粒度的位置矩阵,我们在商业里做得最多的是位置的选址。这个图是走过去的概念。这端是我们做位置选址时依托的数据,做位置选址依托运营商的数据做不了,我们只有通信侧的数据和通信侧的消费数据,这个时候需要大量的行业数据依托。我们有本网的用户位置,还有异网的用户位置,我们和京东合作获得异网的用户位置,京东有3到4亿的用户,我们双方做用户样本的抽样,我们可以把在商圈位置的用户样本拿得很全,包括环境业态、竞争态势,比如说环境业态,我们找到周边同业的地产信息和商业运营的信息,这些数据具备之后,中间是选址的体系,基本上是从五个方向着手,人口、消费、环境业态、竞争和交通路网。
5、拿这个做联通的营业厅选址,单特征大概是什么样的竞争业态,几个特征加上去是什么样的竞争业态,帮助商业运营机构做选址。选址是一个方面,现在国内有很多大的地产商,因为这个涉及到商业机密我不讲名字,很多知名的地产商背后是有商业运营主体。举例来说,比如说万达地产、万科的商业地产,前端铺设了很多店铺,背后他们已经把数据决策加入进去,我们的数据就在给国内比较大的几家专门做商业地产的运营规划咨询公司提供支持,他们会实时通过我们画好的栅格,用户的属性、喜好和运行的规律,结合这些帮助商业地产做入驻商业的选型和运营策略,商业IP的打造,这些都是给他提供数据决策的支持和帮助。
5、这是另外在商业上的应用,银联的数据和我们的数据加在一起进行区域客群行为洞察,北京到店停留时长远远小于重庆。
6、这是分析商超的数据,我们分析和宝洁和联合利华在商超的用户特征,宝洁销量多、平均销售额比较低,表明产品更亲民。联合利华销量偏低但是平均的销售单价比较高,当然和两个品牌之间的错位有关系。同时我们可以看出来,不同季节的不同产品销售的波动和不同品牌、不同产品对于不同层次结构消费者吸引力也不太一样。50岁以上的进店人群都是什么时候进店,飘柔什么时间段卖得比较多?这个数据放在这儿,最后我们面向客户和面向智慧城市里的各个应用主体来说,我们提供交叉分析的决策报告、参考咨询的概念。
7、线上、线下多渠道的营销推广,结合选址和消费分析很自然地想到我们会做线上、线下的,多渠道营销推广运营商就是做通信出身,我们本身有很强的触达渠道,短信、电话我们都具备的,结合我们这一侧很完整的用户画像,叠加用户的时序和位置,我们可以比较迅速地帮助品牌、帮助商业找到触点触发消费推广。大的领域里可以做到室内景点间的预警和交通调度和突发事件的通知,都是基于位置和用户可以做的事情。
8、联合央视财经做了一期城市消费指数,还是以重庆为例,重庆的线下消费水平是最高的,线上消费水平反而比较低,这是不同城市的概念。有了这个指数,大家看到可能是简单的数字,对于政府来说,在做产业监测、产业运行就有数据的抓手。我们之前讲的政务、智慧城市,底层是缺少数据的支撑,可能更多的时候是信息化的项目,为什么?因为他没有把数据引进来了,数据没有打通,信令没有走起来。
9、基于运营商的时空位置做旅游和交通,这是我们在山东泰安分析泰安市游客流入、流出、驻留,我们原来提供给国家旅游局,现在是文旅部的信息中心,作为全国旅游态势分析数据,背后就是基于时空位置,时空位置叠加用户属性再加上一些时空的模型,面向行业做政府的决策和参考。
10、互联网+监管,这是今年两会提出的点,互联网+监管有很多法,核心要做监管的监管,监管的监管中,企业是监管的监管的主体,大的背景是工商总局做了合并成为市场监管局,市场监管局监管的时候,以前各家有各自的监管,现在需要统一起来。业务层面就会出现多个信息化系统的烟囱,这是不可避免的。横向来说监管的主体不是特明确。比如说食品药品需要归到人,商超的监控中对到的就是商场,结合我们的信令和互联网+监管的大趋势,我们做的是企业监控。我们就是监控企业的异常经营、异常的行为或是异地经营的情况。
下面有四个图大家可以看一下,这里面用到什么东西?一个是运营商的时空信令,还有一个是关系图谱,我们可以做到三度,再做到四度、五度也可以,但是对资源的消耗特别大,我们没有看到实际的应用场景。三度是什么概念?我和主持人存过电话、打过电话,主持人和后面一位专家通过电话,这个时候通过我们的分析就可以把联系人建立起来,我的一度联系人是主持人,我的二度联系人是主持人对面的专家,专家下面的联系人是我的三度联系人。消耗的运算资源非常大的量,我们做到三度联系人,反馈的时间是秒级。基于时空位置和关系通话的图谱,结合整个轨迹的判断就可以做企业异常的分析和判断。
大家看这个图,这是很好的路径,看到一个企业发生的迁移,之前通过我们关系图谱和轨迹,北京市区这个企业有42个人在这儿,117人在别的地方,这是企业发生的一次迁移,包括办公地点的撤换。面向政府的监管和工商部门可以提供企业的异常经营监控,包括董监高三类人群的关注,这是我们做的重点领域。
11、这是结合更多的外部数据,做大型工程的监控。不知道在座各位有没有做过这样的项目,很多大型的项目目前的监控通过驻场、监理、施工的督导,随着航拍和遥感技术进来以后,对于大型项目的监测手段越来越丰富、越来越立体化。我们做的事情结合已经有的遥感数据,很多大型项目是有很多的工人,再结合工人的实际情况,我们就可以分析,去看航拍一定是长周期的,一个大的项目没有一个月、半个月,在航拍图看不到太多的变化,工地上的工人我们是可以看出变化的,我们可以看这个工人的工作时间,可以看这个工人在工地停留的时间。这个工地这段时间有30个工人,每天工作20个小时,工作多少小时怎么判断?其实很简单,一个工人在工作的时候会上网看抖音吗?会刷小视频吗?不会,拿这个可以判断一个工人的大致工作时间,我们对于工程进展的监控可以结合上面的数据做立体的、丰富的、全面的监控。
上面就是我们整个所有的时空信令领域在智慧城市运用的案例、方向和一些思路。时间有限没有展开,只是把这块拿来分享,希望各位多交流,寻找我们的合作点,谢谢大家。