分享
Scan me 分享到微信

王昊:澎湃大数据,极速劲引擎

各行各业也都不乏有大数据,我相信在各行各业的技术创新者他们都把大数据技术作为这个领域里面冉冉升起的红太阳。上午也听到了好多演讲,空间信息领域也是冲在比较前面的,至少从数据量来说,这个行业数据还是足够大的。

  6月11日,北京国家会议中心,以“融合 开放 智能”为主题的2014地理信息开发者大会(WGDC2014)在此拉开帷幕。地理信息开发者大会自2012年起开始举办,三年时间里,伴随着中国地理信息产业的快速发展,已经成为地理信息领域最具影响力的技术创新盛会,与跨界融合、国际交流的重要平台。

  在下午的主会场,苏州超擎图形软件科技发展有限公司常务副总经理王昊为大会带来精彩演讲。

泰伯网

  以下为演讲全文:(根据现场速记整理,未经演讲本人审核,如有疏漏,请谅解并及时与3sNews联系)

  感谢大家!去年差不多也是这个时候参加了一个演讲活动,那次活动会议的主题是"时代精神",好大的话题。我讲的主题是我喜欢的地图故事,在我后面出场的是贝塔斯曼中国区的CEO龙女士,龙女士讲的人生经历娓娓道来,讲的非常精彩。她倡导的话题就是鼓励大家很快乐的做一个小人物。

  在之前我一直觉得我的演讲水平是不错的,听了龙女士的演讲觉得她至少甩我至少300多条街。受她的启发我离开ERSI到了创业公司做一个小人物,当然不敢说我原来在ERSI就是一个大人物,至少之前的ERSI公司比我们现在的创业公司还是要大很多的。小公司不一定不能做大事情,小公司做大数据也是一个诙谐,也是一个辩证的说法。

  无论是职场上做什么,我个人的爱好是地图,喜欢用地理去思考问题,用地图去发现现象,并且用地图去讲述故事。熟悉我微博的朋友们,可能都知道我每天在微博上只发布和地图有关的博文,也结交了好多的地图爱好者。在这个过程里面,我也不断的去找这些大家喜欢地图的资源,也发现地图和大数据的结合有那么多美妙的结合点。地图能够让我们更好的理解大数据是怎么一回事,大数据也给地图增加了很多的活力。把他们两者结合在一起,像这样小小的动画视频不用我的任何语言就可以明白表述的是什么意思。人们都说如果能够把自己的爱好和事业结合在一起,那是一个很幸运的事情,恰恰我是一个很幸福的人。

  视频里面的不是鱼,而是固定线路跑的船,大家也可以理解波斯湾为什么有好的位置,这就是大数据和地图可视化结合在一起的魅力。说到大数据,这也是大家眼熟能详的文字云图了,有点唬人。无论是三维还是四维,我觉得大数据最重要的是做了很多原来不敢想象的事情。1994年我拥有第一台电脑,大家和我一样,我们这一代人都算是互联网的第一代人,更不要说移动互联网了。20年前咱们都没有不会想到未来有一天世界上有成千上万台机器在关注我们个人的用户行为,关注我们个人的信息,把他们汇集起来,然后来预测我们自己。大数据的趋势使得一个个人、组织、机构,甚至一个国家可以去分析过去,也可以预测未来,这是大数据的魅力所在。

  各行各业也都不乏有大数据,我相信在各行各业的技术创新者他们都把大数据技术作为这个领域里面冉冉升起的红太阳。上午也听到了好多演讲,空间信息领域也是冲在比较前面的,至少从数据量来说,这个行业数据还是足够大的。

  举一个小例子,这是NASA的地球观测数据信息系统EOSDIS,这里面有一张图片,一共有15颗卫星,每天在采集大量的数据,然后分享给全世界的人来使用。多数都是遥感的科学家专业的应用工作者,这个数据量是多少呢?7.5PB。按照NASA的说法是"一般般啊",按照和这个行当的人来比7.5PB不是多大的数据量。但是在过去是不可想象的,之前我们是ZB,中间一个是EB,这都是乘以几个零的关系。一共有150万个用户,第二名8%就是中国用户,所以在中国有很多粉丝,确实我们在大量使用他们的数据做科学研究。

  我们想1ZB,所有装微信的用户一秒拍摄一个图片,一个月什么也不敢就拍图片上传,这一个月下来就是一个ZB的数据,其实也没有多大。NASA想做大数据的事是什么?就是分享,每天有20TB的流量拿出来给全世界的用户分享,这件事情是困难的。如何保证这么多的数据快速到用户手里面,这是他们想要解决的问题。

  上午也说了小卫星这件公司,下面说大说公司,这个是借来的图片,再过两个月这个卫星就要发射了,也算是商业卫星比较靠谱的,离我们近的最高分辨率水平了。这个数据也会给我们带来一些惊喜,也算是影像里面大数据的典范了。收购的GRL1是我们能够拿到比较吸引眼球的数据,这是0.41全色影像。这个地图是首钢的一块地产,也是矿产,当然这不在国内,是在秘鲁收购的铁矿。这个图片也不是原始的影像,但是能够看到矿里面的车的情况,人很少,可能又去罢工了,刚收购了之后总是闹罢工。

  我们可以看到非常清晰的影像数据带来的效果,这是咱们国产的高分一号拍摄的辽宁舰,虽然说质量还有待提高,但是可用性已经非常强了。至少我感觉高分一号的可用性比辽宁舰的可用性好一些。

  咱们国家发射卫星影象的未来规划的卫星量是非常大的,十几颗,甚至几十颗,这么多大量的数据涌现出来该怎么去处理?展现,以及该怎么使用。我每年参加遥感协会的时候大家讨论怎么应用才是最关键的,我认为有一些关键的能力必须去解决才能够去做到好的应用。首先是信息的迅速发布和处理,先有处理然后去发布。我的创业伙伴们做的事情就是这样,让它不用去做影像金字塔、压缩,就可以快速到用户手中去,就可以快速在互联网条件下得到分享。尤其是在移动互联网,从收取下来经过简单的流程就可以快速的在互联网上进行传播。进而才可以有数据的提取和挖掘,因为影像要首先被大众看到、被专家看到,也被其他的计算机看到,在这上面我们也继续去大幅的提升挖掘和提取信息的能力。

  我们认为这是一项非常关键的能力,当我们在这个时代去拓展业务的时候发现,其实不是我们这个领域需要的能力,在很多领域也一样需要。这是《清明上河图》,是故宫博物院扫描的版本,不是台北故宫博物院的版本,所以看起来比较暗淡一些。这个扫描图片有1.9G,大家在互联网上没有看到分享,下载下来放到笔记本里很难展现。但是经过我们技术的小小优化,就可以在互联网上和iPad上轻松的去看,它可以不消化巨大的流量,而且可以无缝的去漫游、放大、缩小,可以看到每一个细节和每一个人脸,这些操作是有极高的用户体验,这是我们想提升的,在大数据时代可视化所具有能力的水平提升。

  更不要说在传统的遥感影像了,毕竟跨境的领域大的数据还没有多,但是在遥感影像这张图片是10.9G,放在服务器上不用做任何处理,就可以在iPad上或其他设备上看到这个效果。

  可视化的优化,前两天互联网的女皇Mary Meeker在讲到大数据趋势里面第四条是有极好的用户体验,互联网的三大支柱分别是内容、社区、商业,内容主要以传播图片为主。她说的数字,我是引用她的数字,全世界一天上传和共享的数据照片是18亿张。如果说用了一些合适的压缩传播技术,如果每一张图片都减少10K容量的话会节省多大?一天可以减少18PB的传播容量,就是带来18PB容量的减轻,就是刚才提到NASA整个系统的将近三倍。在大数据可视化的优化上还是有很多文章可做的。

  除了用户上传的,还有整个在做互联网服务里面提供基础服务的数据,今天大家也听到了很多厂家都在做街景,有很多企业做了联盟,这种数据已经有了很大的重复。这种数据仍然有优化的空间,可以看到更清晰一些。这是立得提供的清晰的影像,原始的更高一些。在互联网上传播要进行很多的缩减,我们希望用我们的技术可以看到更清晰,如果不保护隐私的话可以看到每张人脸,所以这是在移动互联网的时代可以做的很多图形、可视化、优化的地方。当然也包括3D,如果在移动端上去展示,除了传统的在桌面端的良好技术之外,我们为移动端做更多的优化,使得在普通的手机上也可以很快速的去享受像天下图、倾斜测量采集的数据,而且这些数据是非常大的,而且有巨大的纹理。当然也包括传统对象性的3D展示,我们都放在移动端去做,流畅的效果是会极大的增强互联网公司提供用户的效率和效果。

  当然背后也有好多激光、雷达测量的数据,没有人把激光、雷达测量的数据直接拿出来给用户看。我们在后台也大量去优化这样的信息提供可视化的效果。

  即便在传统的2D领域,其实也映现出很多需求,比如个性化的地图。我们不想看到千篇一律都是Google、百度的地图,希望看到的是自我创造的,这些地图能够让自己所带来生命力的提升,这些是需要矢量的优化。大家生成的地图很难变更,但是可以用在矢量的优化改变个性化地图的问题。

  随着可穿戴设备的产生,还有更多的开放平台提供的带地理标签的SDK,开发者和个人可以很快的汇集个人的数据。这是跑步软件汇集的北京跑步的地图,红的地方是跑步比较热的,得出来的结论是离水比较近,跑步环境也好。如果我们在北京买房的话,尽量靠近这些地方。但是在北京大家肯定不考虑这些问题了,还是想尽可能便宜一点、性价比高一点。

  下面图是在苏州骑车的路线,如果汇集了众多大众的信息,在做地图可视化的时候都会遇到瓶颈的问题,我们是帮助做传统地理信息不能有强力的基础人员的创业公司,他们收集的数据拿出来做可视化分享给别人做参照。

  即便在海量目标监测上我们仍然可以做很多文章,在地图上去监测动态目标的时候可以更流畅的播放、显示,以及更流畅的和业务系统结合。

  在传统的Flash上做专题图,还有一些可以去提升、优化以及更美妙的地方,比如说有一个例子,这个是整个中国地市一级GDP指标,立起来可以看到新的信息,通过客户端制图的优化很流畅表达信息。立起来的值是人均消费水平,我们看到克拉玛依很高,东莞很高,北上广也是很高的。这个指标是除去了买房以后的消费水平,其实在北京的同志们生活的不怎么样,我们的消费水平可能不如克拉玛依这样的城市。

  去年在大数据时代的洞察或者是洞见的大会上,大家总结了几点整个大数据的需求。我们不需要数据,更多的是需要想法。我们希望数据有形,能讲故事,而不是说藏在机器后面的死板的。我们希望看到的是能够有大数据的洞悉,90%的问题其实是无法看到大数据到底带来了什么。我们还希望这些信息更加丰富,而不是数据更丰富。这是大数据报告年会上大家总结的一些需求。

  给出来一个大趋势就是可视化,因为它可以讲故事,可以分析问题。把分析问题的结果呈现出来,这是总结出来的一个趋势。

  有了这些需求,我相信未来很多领域都会在分析、洞悉大数据,并且去讲故事,通过故事发现大数据,这是确定无疑的方向上。

  我在超擎的愿景,不敢说做大数据的所有方方面面,但是会不断去提升能力,争取在大数据里面做的更多。现在首先解决的是让图形图像更快,能够在互联网拉近图形图像和你的距离,让可视化也更有意义,让它变得贴近你,为你解决问题,为大数据也增加澎湃的引擎。

  无论你喜欢不喜欢大数据就在眼前,无论你的隐私暴露不暴露,大数据是可以和可视化世界结合在一起,这种结合让大数据更美妙。这个世界其实就一直在你手中,希望像我一样的创新的技术让你把世界看得更清楚、把握的也更牢、享受的也更美妙。

  谢谢大家!

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

更多精选文章推荐

下一篇

郑宇:大数据与城市计算

泰伯APP
感受不一样的阅读体验
立即打开