分享
Scan me 分享到微信

徐丽萍:从Big Data 到Smart Data

  6月10日,北京国家会议中心,以构筑地理信息新生态为主题的2015年全球地理信息开发者大会 (WGDC)在此拉开帷幕。WGDC自2012年起开始举办,四年时间里,伴随着中国地理信息产业的快速发展,WGDC已经成为位置与

  6月10日,北京国家会议中心,以“构筑地理信息新生态”为主题的2015年全球地理信息开发者大会 (WGDC)在此拉开帷幕。WGDC自2012年起开始举办,四年时间里,伴随着中国地理信息产业的快速发展,WGDC已经成为位置与空间领域最具影响力的技术创新盛会。

泰伯网

  WGDC2015下午的会议中,四维世景科技(北京)有限公司总经理徐丽萍进行了以“从Big Data到Smart Data"为主题的精彩演讲。徐丽萍指出,尽管大数据呈现海量化爆发趋势,但还不够智能,不够好用。只有能够快速用于综合分析、符合消费需求的数据才能被称作Smart Data。以下为演讲实录。

  徐丽萍:各位来宾下午好,非常高兴在开发者大会上又一次跟大家见面,大家知道我们世景公司是做数据服务的,我们主要是做地理信息,遥感这些方面的数据服务。在传统的地理信息,摇杆的产业里头,我们也发展了几年,从数据产品到数据服务,我们也形成了自己的一些特色。我们自己觉得整个这个公司发展不错,但是大数据来了,在大数据的时代面前,我们作为数据服务商,我们就要思考,在大数据时代我们能做什么?我们应该怎么做?现在我们说城市管理已经从数字城市发展到智慧城市。其实很多其他领域的技术也都从数字发展到智慧,大数据是不是也会从Big发展到Smart呢?这是我们的思考。我们思考这个问题的时候,要回过头来好好对大数据,对大数据的本身,以及对大数据的应用我们要做一些分析。我们分析以后发现大数据是非常庞大的数据体系,涵盖了很多层面,很多领域。其实地理信息在这里头真的只是很少的一部分。大数据系统里很重要的一部分是行政数据,我们的工商管理、人口分布等等,注册的,登记的有行政性质的数据是海量存在的,而且这些数据在政府手里。

  除了行政数据,还有很大一部分是商业数据,商品消费,物流配送等等,很多反映我们这个社会经济生活的重要的大数据分析的商业数据也是存在的,而且存在于商业机构手里。还有一部分是我们个人的行为数据,我们的衣食住行,吃喝玩乐,产生了大量的行为数据。当然,我们自己的行为产生的这些数据,其实不在我们手里,在那些运营商、服务商手里。我们的这些行为数据也是海量的,而且这些行为数据在大数据分析当中它起的作用也是不可替代的。

  专业数据可能是我们相对熟悉的数据,像医疗、保健、石油、电力等等。像这些行业的数据,我们说不太清楚,不太了解,但是我们地理信息的专业数据我们是说得清楚的。我们地理信息专业数据,我们有一系列的,有影像数据、三维数据、矢量数据、导航数据等等,这些都是地理信息的基础数据。我们一直说“互联网+”,我们现在说信息也要“+”,仅仅是这些基础数据不能对某个行业或者应用服务,当我们为行业真正提供应用服务的时候,我们还要结合行业的相关数据,就更麻烦了。其实行业的相关数据也无非就是我们刚才提到的各个行政层,商业层等等这些行为数据,在这些行业里头,存在了大量的地理信息服务所需要用到的这些相关的行业数据。我们做行业服务的时候,我们的用户也好,项目承担单位也好,都是深有感触的。我们其实是苦于数据的采集和数据的整理。因为这个数据存在于各种形态,结构化的、非结构化的、海量的。

  那么,这些大量的数据存在,我们知道我们可以很明确的对大数据有一个认识,就是大数据是存在的,是有的。但是这些大数据的存在并不等于大数据就可以直接应用,要想实现大数据的应用其实还有很多工作要做,不仅仅是有了数据就可以,我们首先要对数据进行采集,牵扯到很多领域,很多方面。我们采集到的数据还要对它进行处理,这个处理不仅仅是我们说我们地理信息数据处理的那种专业上的数据处理,也包括采集到的各个行业,各个领域的数据,首先要对它进行去噪,无用的数据要去掉,要使数据量能够满足大数据分析的数据模型所能够接受,所能够应用,同时还要对它进行各种转换,也不仅仅是格式上的转换,包括数据形态,数据方式的转换,最后我们经过一系列的处理之后,才有可能进入大数据的应用阶段,就是大数据的分析,大数据价值的挖掘。

  所以,总的说来,我们在这么多不同的这些行业,不同的领域,不同的数据形态,这么大量的数据存在于不同的机构。这些大量的数据存在那里,还需要经过一系列的处理转换我们才能够应用。所以,我们说数据是各个行业都有,有海量的信息有待挖掘,而且结构化的,非结构化的数据都有,用起来非常不方便。所以,目前的状况是数据足够大,但是不是好用。所以,我们说足够的Big,但是不够Smart。

  怎么样让数据耗用,怎么样让数据变得Smart?我们能做些什么?这是我们作为数据服务商要思考的问题。首先要让数据Smart,什么样的数据才是Smart的,能够快速的用于综合分析的,符合消费需求的数据,这个做起来非常不容易,而且我们现在是在探讨,有没有这种可能,我们也不太清楚,我们只是说,在大数据的浪潮下,我们做这种思考。比如我们要实现快速的、综合的,让这个数据进行综合的分析,这种情况下,我们在给用户提供数据的是应该就不是一个层面的数据了,我们光给用户提供一个领域的,或者一个地理信息层的数据是不够的。我们需要给用户提供的是跨平台,跨领域,跨行业的,包含我们地理信息在内的一个综合的数据,也就是说,Smart的数据必须得是多元的,需要把所有的这些数据要能够把它整合起来。但是我们要实现多元,就必须打破我们现在的信息孤岛,就是行业的、机构的等等,其实这里牵扯到很多问题。牵扯到政府的政策问题,数据保密的问题,牵扯到行业壁垒的问题,部门利益的问题等等。但是,如果我们不打破这种信息孤岛,可能很难做到提供Smart数据的多元化的Smart数据。

  综合分析,如果我们考虑到符合消费需求的数据,对于消费来说,它很直接的一个需求就是要及时,这个及时我们还不要说我们要能够及时快速的从不同的行业,不同的领域,不同的机构当中把这些数据获取到,不容易。我们就是说,对卫星进行编程,及时给用户获取数据都难,跟人打交道不容易,跟卫星打交道也同样不容易。所以,我们要做到及时也是有许多挑战,这种挑战在数据的采集,包括我们采集到这些信息以后,也要在大量的海量信息当中把大数据用到的数据提取出来,推送给我的客户,所以在数据的采集、提取、推送等等方面,对我们的资源、装备、技术都有非常多的挑战。

  但是,我们一直在说,有挑战就有机遇。所以,在这些领域里头,应该说给我们的行业,如果我们考虑要从Big Data到Smart Data,我们行业,企业还会有一些新的机会。要快速的用于分析,就是这个数据拿来,不要经过我们刚才说的一系列的冗长的数据处理,大数据分析的客户,拿到你给我提供的大数据,我拿来够能够分析,够能够用,所以这个数据是实用的,做到这一点,同样有很多技术上的挑战。比如数据的处理,数据的转换,比如去噪,我们这里去噪强调给精准的用户提供精准的数据需求,做大数据分析的用户不管你的信息多么有价值,只要是他不需要的,对他来说就是无用的,那就是噪音。所以,当用户给我们提出了精准的需求的时候,作为数据供应商,我们要设法给用户提供满足用户需求的精准的数据。这是我们在这里去噪所想到的。

  同样,如果我们要做到这一点,我们就需要对数据进行大数据的信息挖掘分析之前,我们首先要对大数据的结构分类进行分析和筛选。这里同样对我们的数据分析技术也会有一个挑战。当然,如果我们说我们要做Smart数据,Smart一个很重要的特征就是联想。说到这里,我们想说,可能在座大家都知道,网上流传了一个笑话,一个人想吃披萨饼,给披萨店打了一个电话,那个披萨店的接线员把他们家老老小小兜了个底儿掉。这是一个笑话,其实这个笑话里头反映我们个体的行为数据在大数据时代它的关联分析所起到的作用,这是一个调侃。

  我们作为数据供应商来说,在大数据时代,当我们给用户提供数据服务的时候,是不是也要考虑到这个数据服务有一定的关联性和联想性呢?比如有的用户跟我们要油田的影像,如果按照我们传统的这种服务方式,或者说传统的需求,用户说我要一个油田的影像,我会尽快的给卫星进行编程,尽快的获取数据,尽快的把数据交给用户。如果实现了这一点,在传统的模式下,应该说我做的已经非常好了,用户也非常满意了。但是,如果在大数据的环境下,我们应该怎么做?我觉得这种时候,再有用户跟我要油田影像的时候,我应该不是简单的就给他提供油田的影像,我应该也有一些联想,比如右边周边的地形数据,周边的生活环境数据,输油管线,油田自由运输的通道,车辆维护,甚至包括油田工人健康管理,生老病死等等,有一系列的数据供你联想,也有一系列的数据通过联想来给用户提供服务。作为数据供应商,在大数据服务时代你的服务空间是非常非常大的。

  这些数据我们要以很方便,实用的方式推送给客户。我们要想做到这一点,我们当它说到的我们要提供的这些信息,不是我们从卫星影像能够得到的,不是仅仅地理信息的数据就能够提供这些信息,我们还是需要扩大到各个不同的领域,不同的行业,不同的机构等等。也就是如果我们能够做到从Big Data到Smart Data,如果把各个行业的领域信息能够集成起来,我们就有可能实现给用户提供Smart的数据。但是即便允许你在不同的领域获取数据,其实作为数据商,要想做到这一点,对于数据的存储,数据的检索,数据的集成也同样有很多技术上的困难。

  我们一直在说从Big Data到Smart Data是我们的一种思考,是我们的一种希望,也是我们的一个想象。假如我们能够做到,未来我们在给用户提供数据的时候,我们就不是提供一个数据层了,不是说我只给你提供一个影像,我给用户提供的应该是一个数据包,而且这个数据包应该是跨平台,跨行业,跨机构的,把你用户所要的,按照你精准的需求,我给你提供一个精准的数据信息包,这是我们希望在大数据环境下,我们数据供应商应该怎么做?我们要如果真正能够做到这一点,我们会面临很多比如行业上的壁垒,技术上的挑战等等。如果我们要真的是能够实现,这对我们来说是一个非常大的想象空间。所以,我们说Big只是一个形态,Smart才是一个根本,才是我们作为数据服务商所要追求的根本,如果我们能够追求到这个根本,从Big Data到Smart Data这个过程应该会给我们整个行业带来很多新的技术上的突破,也会给我们这些企业带来很多新的发展空间。

  假如说我们假设如果有那么一个企业,或者有那么一个数据供应商,它有能力把不同的机构,不同的领域,不同形态的数据真正结合起来,而且它能够在技术上实现我们说的多元、及时、实用、关联等等。这一定是一个数据服务的根本,如果从Big Data到Smart Data催生出我们数据服务行业巨无霸,也是我们今天做这种探索和做分析的一个很好的成果,也是我们乐见的,我们不是巨无霸,我们是以高分辨绿树据和信息挖掘为主的综合服务商,我们是在摇杆卫星商业化服务领域里头,同时拥有国际上优质的高分辨率的卫星数据资源,比如我们有美国的、欧洲的、亚洲的等等一些国际的卫星资源。高分辨率的卫星数据发展到0.3米了,韩国的KOMPSAT新发射的0.5米的卫星数据已经在中频段,做热成像,在摇杆应用应该开启了新的应用领域。作为航天企业,我们义不容辞在推广我们国家的高分辨率的卫星数据,我们现在用到资源3号等等都是我们给用户推送服务的重要的数据资源。

  我们作为行业公司,有专业的同业资质,我们不是巨无霸,但是是百强里的一员,我们希望今后的发展能够更快、更强,能够有更多的机会给用户提供更好的服务。我们有我们的展位,T10,欢迎大家到我们的展位上做数据服务的体验。谢谢各位!

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

更多精选文章推荐

下一篇

1

泰伯APP
感受不一样的阅读体验
立即打开