分享
Scan me 分享到微信

圆桌论坛:人工智能+遥感大数据的下一场革命

人工智能是遥感的未来,把握未来才能生存。

  6月14日,第六届WGDC大会在北京国家会议中心隆重开幕。大会由空间信息产业创新创业服务平台泰伯主办,秉承不断引领和促进空间信息技术创新与变革的宗旨,WGDC已走过五个年头,如今已成为全球最具前瞻性的跨界创新风向标。

泰伯网

  在本届大会的卫星+大数据峰会上, 河海大学地理信息科学与工程研究所所长、地球科学与工程学院副教授张晓祥、云游九州联合创始人、中科院西光所大数据应用工程中心副主任李振宇、佳格天地联合创始人兼产品副总裁、原NASA国家实验室数据科学家顾竹、商汤科技高级研究员、香港中文大学计算机视觉博士石建萍共同参与了圆桌讨论,以下为演讲实录。(内容未经本人审核):

  张晓祥(主持):今天请到的三位嘉宾,李振宇博士正在做数据的获取;石建萍博士是在做数据的分析;顾竹博士做的是农业的大数据遥感,从数据的获取到数据的分析。他们都有很多的建树,分享他们的观点。请三位嘉宾讲个人的情况,你们公司的产品能不能做一些简要的介绍。

  李振宇:我们现在做的东西比较偏门,主要是解决什么问题呢?现在的数据越来越多,已经超过我们能够管理的极限了,这里边所需要变化的是什么呢?我们的数据管理模式要发生很大的变化才能适应这种方式,原来我们是遍布管理,然后下载使用,其实只管理了文件的目录,而并没有管理文件的内容,所谓大数据应用或者机器学习当中,这个模式是不可以的,我们是怎么来解决这个问题的,换一种思路先构建了一个覆盖全球的32级的网格体系,这是作为一个基本的空间框架,我们为所有的数据来建统一的网格索引,或者理解为我用网格存储所有的信息,包括遥感信息。

  这样存储了以后,我下面任何的应用,上面的分析也好,搜索也好,我都面向网格,而不面向文件,这样的话未来我们说大数据也好,机器学习、人工智能也好,顶层的数据组织变得有了一种新的模式,才能够适应现在越来越多的数据获取的频度,目前我们做的产品是一个一体机,在现在能解决什么问题呢?比如说像唐主任刚才讲的那么多的问题,快速的检索,里边有哪些数据就出来了;第二个可以在线来分发,看到了这个数据,我可以免签让你快速看到;第三个你要是要这个数据,可以画一个框原始数据可以下载下来;第四个任何的遥感分析完全可以在线,不需要面向文件,所有的直接面向网格分析。

  石建萍:我们公司是一家人工智能型服务的公司,我们想要做到的是帮助各行各业提升他使用人工智能获取信息的能力,目前有非常多成功的行业,主要的三大行业,安防监控、互联网金融验证、身份验证平台、手机和娱乐化的服务,刚才没有讲到的,我们在手机和娱乐化上也做了非常多的工作,最近一些很火的APP,包括直播厂商用的人脸识别的功能,大部分都是我们提供的。整个技术本身并不分行业,我们也在发掘非常多很有潜力的下一代的人工智能行业,这些行业大部分是劳动力集群的行业,需要大量的数据理解和信息提取功能,未来包括有无人驾驶的行业,包括智慧医疗、遥感行业,我们也是希望在这些行业中能够帮助他们把数据价值提取出来,提供数据理解和数据分析。

  顾竹:简单说一下佳格公司,我们几个人是在美国回来,之前在航天部、农业部做了很多关于大数据、遥感、气象方面的工作,科研类的工作、工程类的工作都做了很多,我们在湾曲,在硅谷,我们周围也很多的互联网公司,我们也看到他们成功的把各种各样的互联网技术应用到商业上,取得了很大的商业成功。

  回过头来看,您做地理信息业做了很多年,在上世纪八十年代,这其实是我们人类在进行数据抽象时候非常大的进步,人类在认知世界的时候是以栅格形式认识的,图片也好,画画也好,都是山格。一张遥感影象非常大,几十兆、几百兆,我们地理信息界的人就已经想到了如何解决大数据的存储、分析与管理的问题。但是,我们经过这么多年发现,突然认识到地理信息可以取得商业成功,这个时候传统的地理信息界,传统的遥感界被放在后面了,或者说觉得我们有点落后了,我们一直在思考这个问题,如何把已有的模型、算法也可以专业化,我们是可以站在最前面,甚至是打败facebook,我们的技术层面不比他们差。

  也是经过很长时间的讨论放弃了以前的工作,回来以后做更多有关遥感数据商业应用的工作,遥感数据需要大量的处理,存储包括算法,刚才您提到的数据管理系统,综合所有的技术主要面向农业与环境做更多的应用,找了很多的应用场景,比如说估产,比如说健康状况的分析,比如说作物的分类与展示,遥感系统里面这些不算是新东西,但是我们用更快、更准、更迅速的方便,比如说提供SaaS服务,让大家迅速获取这些数据,而不是停留在实验室和数据库里,让数据活起来,从中获得商业利益。

  我说一下一个小故事,是我当时进公司的面试,我的上司问我深度学习能在遥感影像里面有什么应用?深度学习可以抓抽象概念,现实世界数据变得很多,浅层的算法没有办法抓住抽象的东西,会被一些细碎的特征干扰,它的效率不高;深度学习的好处就是可以抓住很多抽象的东西,比如说房屋,这个地球上的房屋有各种各样的形状,包括像CCTV的形状,鸟巢的形状,会场的形状,有各种各样房屋的形状,不可能穷尽每一个房屋的形状告诉机器,深度学习是帮助我们进行这么一个层面的操作,通过深度学习,把所有的大棚数出来,我们数过汽车、玉米、火龙果,各种各样这样的应用很多很广泛。

  张晓祥:我们对未来有一些思考,三位专家原来做的是数据的存储管理,还有做数据的应用、提取,第三个是做数据的挖掘,考虑上下游的整合,做数据的往上面延伸,石博士是做技术提取层面的,往上游或者下游延伸,这方面能不能分享一下您的感受。

  李振宇:可以先理解一下人工智能和大数据的关系,人工智能是什么?是一个有无限潜能的婴儿,怎么能长大呢?大数据就是奶粉,吃了这些奶粉它才能够长大,人工智能要想做好必须有大量的数据供它来用。现在的问题是什么呢?

  有大量的空间数据没有被很好的管理好、组织好,到人工智能的通道是不通的,或者是有很多障碍是不好跨越的。这个问题一个是从政策的层面、产业合作的层面,有一定的问题,但是我们更多的觉得是技术本身,也是存在问题的。还有第二个概念,原来搞空间的人,80%的信息是空间信息,实际上不对,世界上百分之百的信息都是空间和时间信息,没有空间、没有时间就不存在信息。

  那就涉及到一个问题了,在人工智能当中,所有的数据都应该是我的数据源,自己搞空间信息的人,自己搞一个跟别人不一样的东西,数据格式都不认识,怎么把空间数据和我们认为的非空间数据把它很好的整合到一起。同时更重要的是我们怎么能把各种各样认为是空间数据的,把他们整合到一起,能够供给机器学习,作为它的奶粉,遥感数据作为奶粉的话远远不够,还得吃菜、吃肉,这个人才能茁壮成长,这里面从我们的角度考虑,在大数据时代我们要有一种新的时空数据模型,这种时空数据模型应该是什么?

  独立于任何的具体数据之外而存在的,就像我们买一个空的柜子,这个柜子放蔬菜也可以,放衣服也可以,放什么都可以,我们必须有这样一个新的模型来承载这样的数据,而我们现在就在努力的做这个的研发,取得了一点的进展,未来还要跟大家一起合作。只有把数据组织的问题解决了,上边所有的学习、成长可能会变得更好一些。

  张晓祥:李总选择了专注做数据,以后数据生产不需要人了,我也这样认为,最近十年我就没怎么搞数据,我认为没有太多机会了,要搞分析建模,想听一下专门搞分析提取的石博士的意见。

  石建萍:我们现在做的技术模块和算法,在做的一件事情就是帮助人或者代替人去看图、理解图、提取其中的信息,目前在遥感行业有非常多的工作、信息提取的工作,还是靠人去手动看的,这个过程中首先它非常耗精力和人力,准确率在工作非常多的情况下也很难保证,处理的数据也是有限的。

  在这个过程中有非常大的机会,机器达到一个点,性能匹配人或者是基本接近人超过人的水平的时候,机器可以用我们的算法帮助提升生产效率。未来有几个层次,目前的算法起辅助的作用,帮助人验证,人再做二次复查;下一个层级,体系工作由机器完成,这个阶段我们需要针对机器,现在能做到的程度,或者说现在的一些特性去重新对整个标准输出、中间环节做一些调整,现在大部分是基于人工解义的方案,这些原则机器的算法不太容易达到的话,需要上下游整个做配合。

  在这个阶段之后,未来当我们有这样一个机器去做数据理解的能力后,未来大部分信息流通的方式并不是在原始数据上,而是在数据理解加工层面之后的信息上。其实我们现在有非常多的算法是做在手机端,可以在手机端做非常多的图像任务,包括人脸识别、关键点的分析,特效的处理都可以在手机端完成。

  未来这样的算法可以放在卫星端或者是机构上,其他的客户买到的信息就是提取过的信息,可以让整个产业速度加快。在之后,假如说我们有了这样的平台,未来可以联合多方的数据再去做更深入信息化的理解,我们真的能从大数据中分析出非常有意思的发现了。

  张晓祥:用手机端就可以处理遥感大数据,以前我非常开心的是下载数据,我的第一个电脑才600多兆的硬盘,装W要300兆,可以下载无数的东西方到电脑里,很少使用,不太方便。有的时候未来是一种数据不动、软件动,爬到数据端去做,做完了之后再返回,这是非常有意思的。请顾博士介绍一下上下游的整合方面。

  顾竹:说到整合的话,我们应用端是最着急的,客户的需求永远都是你明天就给我,或者下午就给我,我们需要的是非常强劲的数据管理以及非常快速的数据分析,这也是我们一起可以去合作做的事情。比如说,现在我们有一些政府部门,他们需要做违规建设的产品,建筑在遥感影像里面是直接一类,做完就好了,但是建筑是不是违规,我现在还没有想到一个很好的办法从遥感影像上看,建筑是不是违规,是不是加了一层,不知道,这是客户真实的应用场景,如何通过遥感数据、无人机数据发展更智能或者多样化的算法解决这样的问题,给我们提出了很大的挑战。

  农业方面需要长期的持续数据,做农业的大数据分析,长期的持续数据需要非常好的管理系统去做,我指定了时间、指定了范围,我如何在时光数据库里面快速的进行运算,把结果拿出来,同时这个结果还可以做到统计、展现,这都是我们需要去解决的问题,我们面临一个很好的时代,大家在开源,在共享,我们有各种各样代码的集散地,可以去分享我们的知识,这是我们的好机会,抓住这个机会把遥感数据的应用做下去。

  张晓祥:谢谢顾竹博士,他讲到了开源的问题,很多的程序我们有时候没有想到,那么多网上有很多雷锋,有很多数据非常好,从数据获取、存储,通过开元的东西做到实验成果,有90%以上都是这样的,都说是自己开发的,我觉得很多东西都是开元的,科研需要很多人协助,我们都在巨人身上在做。从个人的角度,都有不同的理解。

  第三个问题,这次论坛,流体,我今天也非常荣幸,如果我们过几秒钟有一个的话,这个数据怎么办?我们现在要实时监控,马路上监控拍到你超速不超速,高分4号天空挂了一个灯笼,每时每刻监控中国的发展,这个数据是巨量的,我们到几个月、几天,现在几个小时,气象局几个小时,现在是及秒钟,实时来做的话数据太多了,时空一体化的数据方面,对未来的展望。对环境污染、海洋、河流、湖泊。

  李振宇:从我们的角度看,我们整个遥感影像获取能力,中国到2020年是30分钟一次,2030年10分钟一次,这已经很恐怖了,我们一年出四期,一天就无数期,按照传统的模式来处理和使用数据,根本行不同,最多有2%的数据用过、看过,大部分数据都没有看过。怎么解决这个问题从卫星的角度,星地的联合,你从地面要知道你的需求,发射到星上,星上可以控制,第二个是星上处理或者是机上处理,把星上有些东西处理好的,或者在星上认为不好的数据就不要往下传了。

  第二个是数据组织上,现在的问题是这个数据来了以后,要经过好多的流程才可以,漫长让所有的数据堵在那根本出不来,像张总刚才讲的华浩的机器的处理,一定是一个方向,面对机器处理和机器的识别,从我们的角度讲,就是数据组织和IT基础架构,要有一个非常大的架构,有一家做大数据的公司,一天要处理10T的实时数据,在大数据当中有5%的计算和95%的IO,其实计算能力很多,关键是数据抓不到,从我们的角度问怎么解决,从IT存储的角度怎么构建,另外一个,空间数据,空间数据有自己的特点,怎么适应IT的顶层架构做你的分布,比如说上层的手续,非常快的不管是处理,所得即所需,才能解决一条产业链上的问题。

  张晓祥:李总还是配菜环节,做菜环节请石博士分享一下。

  石建萍:监控行业,卫星相当于一个驾在天上的卫星摄像头,这些数据大部分也是一个死数据,现在一般碰到重案要案的时候才会有警力一个一个查数据,看嫌疑人做了什么事情,对于普通的案件根本不会有人帮你做这个事情,即使这个数据已经存在里边了。

  现在的解决方案,我们帮整个行业把数据的存储方式,从原始视频的方式变成了结构化的信息方式,我们存储之后,比如说监控视频里面有多少个行人、车辆,他们的属性是什么样的,白色行人在时间点上过了这个地方,下次获取信息的时候就不需要所有的视频再逐个的看,只需要有一个快速的检索方式就可以了,现在在做的工作就是和地方的公安局尝试在我们的系统中不仅有基本属性的知识,我们配合人脸识别的算法和摄像头的位置、时空信息,自动的把其中的一个人和到下一个摄像头的做关联,希望在未来达到电视剧里看到的状态,输入一串身分证号,就可以知道人在什么时间段走到什么地方,这也是我们一直努力的。

  对遥感方面,还是有一些不一样的点,天上的卫星覆盖面积和周期有很多事情很难做,第二个卫星的分辨率会有一些特别细节的东西是看不到的,我们也希望上下游一起推动,把信息化和自动化理解的平台搭建起来。

  张晓祥:刚才是配菜环节和做菜环节,吃菜的时候不同的人有不同的需要,怎么按照需要做,这是应用层面的,请顾博士分享一下。

  顾竹:在我这个层面我的观点是,我一定都不着急这个事,只要有人在那吃菜,自然就会有人去配菜和做菜,现在我们有开元,从我的经验来讲你的市场和需求摆在那,像李总就开始做这样的工作了,自然有人把这些东西整理做出来,我们回顾一下,因为这是需求的驱动,而不是我们坐在那拍脑袋说做一个这样的东西出来,肯定不是,是需求倒逼。

  数据全堵在那,是因为我们有很多的环节需要人,我们在谈的人工智能,这些数据将来也都是人工智能去处理的,像石总刚才提到的监控数据一直都有,每秒都有大量的数据过来,到时候自然会有人工智能,训练出人工智能帮我们挑选敏感的,剔除掉不必要的数据,这个过程也是可以人工智能化的,这需要更多人的经验。到以后我们把挑选数据和选取数据的经验让机器去学。

  观众提问:人工智能+遥感大数据的下一场革命,我觉得人工智能进入了遥感,和它的技术融合肯定有一些改变的,革命可能革的就是传统做遥感的传统企业,从您的角度,目前还没有加入人工智能的传统遥感企业,他们应该怎么办?如果他们想有一些人工智能的基因或者转型,他们应该怎么做?

  石建萍:现在这个时间段没有一家公司会把所有的技术做完备,比如说我们在做系统的方面,不会从GPO的环节开始做,会依赖其他的公司做,对于下游的应用,对于我们这样一家公司,没有办法把所有的应用领域研究的非常好,或者有非常深入的接触,我们也会依赖下游的公司一起去做行业的突破,在这个点上来说,我们是一家技术的提供商,我们应该一起去开拓这个市场,而不是有这样大规模的竞争。

  在现在这个时间点,需要整体一起培育这个市场,让这个市场有人工智能的概念,明白大量的数据其实是可以通过算法做自动的处理。教育市场的过程中,其实需要大家一起努力,不是一家公司努力就可以完成的事情。

  观众提问:我想请问一下,现在的数据越来越多,无论是光学或者SAR,卫星遥感数据我们也做了深度学习,也跟很多单位合作过,获取的结果不是太理想,刚才看到石老师的土地类型,因为土地类型非常多,有十大类,26小类,我们提取的精度是在什么样的条件下,在什么样的条件下获取到精度,准确率是多少,虚拟率是多少,有没有大面积的走向光学化的应用,结合起来让它使用落地。

  石建萍:我们现在在做的案例,基本希望在光学化的方向做,也做了非常多具体案例的点,在云雪识别上精度达到95%以上,包括检测率都可以达到,对于水体的识别也可以达到这样的精度,对于飞机键盘的检测针对不同的数据和应用条件有偏差,非常多算法,和整个数据的针对算法。现在人工智能的算法推像是用有几个阶段,大家要达成共识。

  第一个阶段是人工智能辅助,假如说现在想要得到一个非常高精度的,非常漂亮的顶图,应该去在这个层面上有大量的数据和算法的积累,应该是可以达到的,在下面的一个阶段,我们共同的去磨合出一套新的数据格式,或者信息存储的格式,或者是信息的表达方式。

  张晓祥:稍微总结一下今天的论坛,邀请三位嘉宾分享他们对人工智能遥感数据的理解,包括他们企业的产品,对上下游产业的整合,包括他们现在比较流行的流态数据的管理,它可能真正是一场革命,最近我做了一些功课,在IT领域,对我们的行业冲击非常大,我们没有意识到太多新的技术,有谷歌的横空出世完全促进了行业的进步,有一些官员还不太愿意公开数据。在人工智能领域后来我也想了一些事情,我们这个行业,遥感卫星这个行业,看上去感觉很高大上、很高科技,我觉得我们90%的工作实际上是劳动力的工作,这个领域的发展真正对90%的层面有一些冲击,现在要做一些准备,真的过来以后对行业低端领域的企业有冲击,这是我个人的一些看法。

  李振宇:非常同意张老师说的,如果讲地理信息产业是一个巨大的冲击,相当部分的人要失业,因为大家都认为遥感影像会成为空间数据的主要来源,而大量的人还在做自主,那个东西越来越少,因为跟不上,十分钟一次,你那个一年一次,没有意义了,及早准备还是需要的。

  顾竹:我也很同意您刚才说的,确实有很多的劳动密集型的工作,对我们来说也是一个机会,咱们有很多的地方可以探索,可以通过,从我的角度上我也不担心,这些人力会有更多的地方去工作。

  石建萍:两个方面,第一,人工智能本身需要人来教机器是一个什么东西,我们公司也有三百多人的团队做体力活,告诉机器什么地方是什么这样的一个事情,未来每一次技术的突破和产业的变革,都会催生非常多新的就业机会和新的发展,比如现在不需要非常多的人去做非常枯燥的事情,我们在做很多很高级的事情,我们觉得未来肯定会有更多的机会等我们。

  张晓祥:再回到主题、李开复、库克,他们主题的演讲并不是说人工智能有多么可怕,我们中国的产业,咱们国家做一带一路,很多外国人做的都是中国人的事情,叫地理事情,中国人很能忍耐,是很枯燥的,我觉得还是一个机会,是一个危机,也是机会,未来这个领域可能会带来行业逐步往上提升,这样就真正高大上了。非常高兴跟大家交流到这里。

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

更多精选文章推荐

泰伯APP
感受不一样的阅读体验
立即打开