《 》第一期

大数据三人行

本期论题:大数据还是小数据?

主持人:郭嘉凯 赛迪集团软件和集成电路杂志社总编辑
中国大数据产业生态联盟副秘书长

嘉 宾:李红 中钢集团信息管理部总经理

田春华 昆仑数据首席数据科学家

大数据时代,这一词汇炙手可热,很多企业、用户都对大数据十分感兴趣。但是,真正成功应用大数据的案例,在企业当中似乎也并不是很多。对于大多数企业而言,传统的小数据仍然是企业最重要的数据资源。那么,对于企业而言,现阶段究竟是大数据更重要,还是小数据更有价值?

  • 李红
  • 田春华
  • 话题一:大数据更有价值,还是小数据更实用?

    我认为不能武断地说大数据、小数据谁更有价值,因为两者不是对等的概念,应该说大数据有大数据的价值,小数据有小数据的价值,取决于你对数据的用途。

  • 话题二:究竟什么是大数据、什么是小数据?

    我认为小数据一般是指我们传统对数据的使用,在过去由于受技术、资源的限制,我们在采取小数据时有明确的目的,我们对小数据的用途赋予了很明确的要求。大数据的概念是将原生态、原始的数据经过一系列的清洗、打标签、标识、建模等手段,是原始数据产生价值。大数据和小数据是不对等的,因为我们现在技术进步了,我们可以简单而又方便地应用大量数据,所以人们给数据定义了四个V(多样化、大量化、速度化、价值密度低)。所以,我的观点就是,大数据、小数据不是对等的概念,大数据和小数据都有价值,取决于在不同的领域有不同的用途。

  • 话题三:为什么大数据时代,又重新提小数据?

    目前,大数据通过互联网的发展,越来越受到各界追捧,我们一切都可以利用大数据来解决。但实际上并不是这样,我们赋予了数据的定义、内涵、算法,我们所获取的数据才会变得有价值。但是小数据和大数据的区别就是,我们舍弃了很多有价值的东西。从数据来源的角度来说,小数据是人类社会、经济社会活动的基础。大数据与小数据的不同在于,小数据只能用一些能看得到的显性数据,而大数据可以发现更深层次的东西。从数据加工来说,小数据加工简单、直观,大数据需要通过复杂地处理。小数据从采集、加工到最后的处理和分析,它有它的价值,社会的经济活动还需要小数据,而大数据给我们开辟了新的天地,提高了我们的认知能力,所以大数据的价值确实也是非常值得期待的。

  • 话题四:日常工作当中,小数据应用得更多?

    我们的社会充满数据,如何有条理、有规矩、有序地应用数据?还需要人为地把这些数据进行归类、识别、分析。所以,我们现在为了解决好效率和质量的区别,需要大量地要小数据,因为有些东西没必要。不能因为大数据的价格高,我们就忽视小数据。

  • 话题五:在传统企业中,是否也有数据应用的问题?

    在传统企业中我们也遇到了这种问题。因为大数据被理解为一种技术,它是一种新的思维、新的能力,传统企业和互联网企业是不一样的,我们现在对技术和思维能力之间存在差距。在传统企业中,大数据如何能发挥价值?在需求端、业务端、应用端他们还很难说出为什么要用大数据,用大数据干什么?大数据从哪里来?他们被这种问题困扰。所以,大数据在传统企业里面一定要找到具体的应用场景和目标,要解决数据从哪儿来,什么是大数据,大数据能干什么等问题。因为传统企业必须见到效果了,或者是感觉到了大数据的价值,才会发展大数据。

  • 话题六:大数据和小数据的关系?

    我们要重视小数据的利用价值,因为小数据事关我们的日常生活和工作,但是我们要大力推进大数据的应用发展,因为它关系到我们的产业升级、动能转化、经济转型和强国建设。所以,大数据决定我们的命运和未来。

  • 话题一:大数据更有价值,还是小数据更实用?

    我支持的数据是大数据和小数据的融合,因为数是载体,聚才是我们的目的。

  • 话题二:究竟什么是大数据、什么是小数据?

    不能从内、外这样分,从学术上讲,大数据不是一个严格的学术名词。谈道大数据,很多人混淆了数据的两个层面:大数据技术与大数据思维。从数据技术的角度来说就是四个V。目前,大家总会强调数据量的问题,在面对海量数据时,利用廉价的方式来代替昂贵的存储、商用服务器等,因为他们大量搜索低价值密度的数据,虽然数据量大,但是价值密度比较低。这时如果再用昂贵的存储,比如银行、电信等行业就无法支撑。数据思维就是如何依靠数字化转型,来帮助企业审视企业自身的业务,支持企业转型和发展。大数据、小数据二者的区别是相对的。小数据的价值密度高,大数据的价值密度低。另外从统计的角度来讲,我们从来没遇见过大数据,因为人们的好奇心永远超过数据量。

  • 话题三:如今大数据非常火,小数据该如何切入?

    我们在做大数据分析时,其实还是需要小数据的支撑,但是我们需要的是具有代表性的小数据,当我们利用小数据后再迁移到大数据进行大规模验证。其实我们一直按照从小数据和大数据的相互迭代方式,先利用小数据,再应用大数据,从大数据的应用中再回到小数据反复迭代,然后再提升,这样才能使大数据成功落地。而不是只谈大数据不顾小数据。如果脱离了小数据来谈大数据,对于企业来说具有很大的风险。

  • 话题四:从小数据入手结合大数据解决问题

    1、我们当时帮金风科技(一家世界领先的风气制造商)做载荷仿真时,我们见到的问题就是加速仿真过程,因为工矿比较多,有一千多个工矿要仿真。所以,最初始的诉求也很简单,通过智能化、小数据,把琐碎的过程自动化,还有解决计算时间较长的问题,另外,在产生后仿真文件特别多,需要把用的结果自动抽出来。这本身是一个很好的自动化小数据,但是中间用了一些大数据计划,其实更多是利用传统的小数据。用完之后,我们隐约意识到,一旦能把载荷仿真智能化之后,从业务上带来的价值不仅仅是在企业内部提升了载荷仿真团队的工作效率,而是极大地改善了认证的阶段。 2、在大部件的工程诊断当中,研发部门有很多经验模型,并且全部都验证,大家对模型的应用非常自信。但当我们上了大数据平台之后,我们发现我们以往的经验,到风机厂几乎是没有一个模型是准确的。这也是我们后来应用在小数据上做的模型,到大数据上去验证,当验证完成后,再回头修改小数据的原因。通过大数据、小数据的迭代,金风已经做了几百的模型,在全球的风机上都能使用。小数据给我们打下了很好的基础,然后再有10%的间隙用大数据去弥补。但是如果要是没有80%、90%小数据的支撑,光依靠挖掘大数据,很难保证精准度的。

  • 话题五:大数据和小数据的关系?

    我认为数据技术和业务不是割裂的关系,我们以数字化转型或者是数字化业务的视角去审视和推进整个数据建设,无论是大数据还是小数据,都应当遵循三点: 1、有明确的业务规划或者是业务场景。 2、对当前整个行业环境,包括企业的数据基础要进行摸底。业务驱动还是要寻找业务场景,一方面业务部门需要了解数据,另一方面大数据公司也应努力地寻找业务场景、业务驱动,将可行的数据用合适的方式,将高价值的信息及时推给相应的人。 3、从数据的角度审视我们的业务和问题,来完善我们的业务。当数据分析发现问题后,反过来改善业务流程,形成业务和数据的闭环。

李红 中钢集团信息管理部总经理

十六年原冶金工业部的钢铁行业管理和十五年中钢集团企业工作经历,在企业先后担任综合管理、信息化和运营改善部门负责人,拥有丰富的信息化建设经验和管理实践,获得多项部级科技进步奖和国家管理创新奖。

  • 话题一:大数据更有价值,还是小数据更实用?

    我认为不能武断地说大数据、小数据谁更有价值,因为两者不是对等的概念,应该说大数据有大数据的价值,小数据有小数据的价值,取决于你对数据的用途。

  • 话题二:究竟什么是大数据、什么是小数据?

    我认为小数据一般是指我们传统对数据的使用,在过去由于受技术、资源的限制,我们在采取小数据时有明确的目的,我们对小数据的用途赋予了很明确的要求。大数据的概念是将原生态、原始的数据经过一系列的清洗、打标签、标识、建模等手段,是原始数据产生价值。大数据和小数据是不对等的,因为我们现在技术进步了,我们可以简单而又方便地应用大量数据,所以人们给数据定义了四个V(多样化、大量化、速度化、价值密度低)。所以,我的观点就是,大数据、小数据不是对等的概念,大数据和小数据都有价值,取决于在不同的领域有不同的用途。

  • 话题三:为什么大数据时代,又重新提小数据?

    目前,大数据通过互联网的发展,越来越受到各界追捧,我们一切都可以利用大数据来解决。但实际上并不是这样,我们赋予了数据的定义、内涵、算法,我们所获取的数据才会变得有价值。但是小数据和大数据的区别就是,我们舍弃了很多有价值的东西。从数据来源的角度来说,小数据是人类社会、经济社会活动的基础。大数据与小数据的不同在于,小数据只能用一些能看得到的显性数据,而大数据可以发现更深层次的东西。从数据加工来说,小数据加工简单、直观,大数据需要通过复杂地处理。小数据从采集、加工到最后的处理和分析,它有它的价值,社会的经济活动还需要小数据,而大数据给我们开辟了新的天地,提高了我们的认知能力,所以大数据的价值确实也是非常值得期待的。

  • 话题四:日常工作当中,小数据应用得更多?

    我们的社会充满数据,如何有条理、有规矩、有序地应用数据?还需要人为地把这些数据进行归类、识别、分析。所以,我们现在为了解决好效率和质量的区别,需要大量地要小数据,因为有些东西没必要。不能因为大数据的价格高,我们就忽视小数据。

  • 话题五:在传统企业中,是否也有数据应用的问题?

    在传统企业中我们也遇到了这种问题。因为大数据被理解为一种技术,它是一种新的思维、新的能力,传统企业和互联网企业是不一样的,我们现在对技术和思维能力之间存在差距。在传统企业中,大数据如何能发挥价值?在需求端、业务端、应用端他们还很难说出为什么要用大数据,用大数据干什么?大数据从哪里来?他们被这种问题困扰。所以,大数据在传统企业里面一定要找到具体的应用场景和目标,要解决数据从哪儿来,什么是大数据,大数据能干什么等问题。因为传统企业必须见到效果了,或者是感觉到了大数据的价值,才会发展大数据。

  • 话题六:大数据和小数据的关系?

    我们要重视小数据的利用价值,因为小数据事关我们的日常生活和工作,但是我们要大力推进大数据的应用发展,因为它关系到我们的产业升级、动能转化、经济转型和强国建设。所以,大数据决定我们的命运和未来。

田春华 昆仑智汇数据科技(北京)有限公司

2004年1月清华大学自动化系博士毕业。2004年-2015年在IBM中国研究院,负责数据挖掘算法研究和产品工作,在高端装备、产品运维服务、新能源运营优化等多领域。

  • 话题一:大数据更有价值,还是小数据更实用?

    我支持的数据是大数据和小数据的融合,因为数是载体,聚才是我们的目的。

  • 话题二:究竟什么是大数据、什么是小数据?

    不能从内、外这样分,从学术上讲,大数据不是一个严格的学术名词。谈道大数据,很多人混淆了数据的两个层面:大数据技术与大数据思维。从数据技术的角度来说就是四个V。目前,大家总会强调数据量的问题,在面对海量数据时,利用廉价的方式来代替昂贵的存储、商用服务器等,因为他们大量搜索低价值密度的数据,虽然数据量大,但是价值密度比较低。这时如果再用昂贵的存储,比如银行、电信等行业就无法支撑。数据思维就是如何依靠数字化转型,来帮助企业审视企业自身的业务,支持企业转型和发展。大数据、小数据二者的区别是相对的。小数据的价值密度高,大数据的价值密度低。另外从统计的角度来讲,我们从来没遇见过大数据,因为人们的好奇心永远超过数据量。

  • 话题三:如今大数据非常火,小数据该如何切入?

    我们在做大数据分析时,其实还是需要小数据的支撑,但是我们需要的是具有代表性的小数据,当我们利用小数据后再迁移到大数据进行大规模验证。其实我们一直按照从小数据和大数据的相互迭代方式,先利用小数据,再应用大数据,从大数据的应用中再回到小数据反复迭代,然后再提升,这样才能使大数据成功落地。而不是只谈大数据不顾小数据。如果脱离了小数据来谈大数据,对于企业来说具有很大的风险。

  • 话题四:从小数据入手结合大数据解决问题

    1、我们当时帮金风科技(一家世界领先的风气制造商)做载荷仿真时,我们见到的问题就是加速仿真过程,因为工矿比较多,有一千多个工矿要仿真。所以,最初始的诉求也很简单,通过智能化、小数据,把琐碎的过程自动化,还有解决计算时间较长的问题,另外,在产生后仿真文件特别多,需要把用的结果自动抽出来。这本身是一个很好的自动化小数据,但是中间用了一些大数据计划,其实更多是利用传统的小数据。用完之后,我们隐约意识到,一旦能把载荷仿真智能化之后,从业务上带来的价值不仅仅是在企业内部提升了载荷仿真团队的工作效率,而是极大地改善了认证的阶段。 2、在大部件的工程诊断当中,研发部门有很多经验模型,并且全部都验证,大家对模型的应用非常自信。但当我们上了大数据平台之后,我们发现我们以往的经验,到风机厂几乎是没有一个模型是准确的。这也是我们后来应用在小数据上做的模型,到大数据上去验证,当验证完成后,再回头修改小数据的原因。通过大数据、小数据的迭代,金风已经做了几百的模型,在全球的风机上都能使用。小数据给我们打下了很好的基础,然后再有10%的间隙用大数据去弥补。但是如果要是没有80%、90%小数据的支撑,光依靠挖掘大数据,很难保证精准度的。

  • 话题五:大数据和小数据的关系?

    我认为数据技术和业务不是割裂的关系,我们以数字化转型或者是数字化业务的视角去审视和推进整个数据建设,无论是大数据还是小数据,都应当遵循三点: 1、有明确的业务规划或者是业务场景。 2、对当前整个行业环境,包括企业的数据基础要进行摸底。业务驱动还是要寻找业务场景,一方面业务部门需要了解数据,另一方面大数据公司也应努力地寻找业务场景、业务驱动,将可行的数据用合适的方式,将高价值的信息及时推给相应的人。 3、从数据的角度审视我们的业务和问题,来完善我们的业务。当数据分析发现问题后,反过来改善业务流程,形成业务和数据的闭环。

联系方式:

联系电话:010-88558935

邮箱:xupy@staff.ccidnet.com

本期出品方:

中国大数据产业生态联盟

Baidu
map