分享
Scan me 分享到微信

超过2000员工的百度地图, 开始搞AI测绘

如果不看这些数据,你很难意识到百度也是一家测绘公司,而且规模庞大。

  国家测绘地理信息局公布的数据显示,截止到2016年底百度共拥有在册测绘人员224名,其中包括了百度自身的56人和其于2013年收购的、拥有“电子导航地图制作”甲级测绘资质的长地万方的168人。此外,百度地图事业部员工超过2000人。

  刘玉亭就是百度这只测绘大船的掌舵人之一。也许看看他的其他身份会更了解他:上海杰图软件的股东,长地万方的法人代表。创业邦称,他也是上海杰图软件的联合创世人。这两家单位,都是在国家测绘地理信息局注册的甲级测绘资质单位。根据资料,刘玉亭在杰图软件中直接领导并主持了360度全景图“城市吧”项目的策划,该项目与“谷歌街景”极为类似。

泰伯网

百度地图事业部副总经理刘玉亭

  2013年加入百度的刘玉亭,现在的职务是百度地图事业部副总经理。在AI当道的今天,他于12月20日正式宣布百度地图开启第三代制图生产工艺,并可以上线。这标志着这百度地图进入了AI+加速跑的时代。

  在他宣布这一消息的同时,还对记者详细解释了AI在地图数据生产方面的重要意义,并且提供了诸多“干货”。

泰伯网

  刘玉亭认为,地图的原始使命就是把现实世界映射到数字空间中去,同时更重要的一点是:如何快速感知真实世界中的变化,并反映到产品上?

  第一代地图生产工艺:人员是核心

  大概在十几年前,当时的地图数据采集流程非常简单。以道路生产为主,基本上是一辆车、一个司机,副驾驶上一位采集员。采集员要观察车外面的现实世界是什么样子,再对比数字地图。如果发现有不一致,说明现实世界发生了变化。他就要在地图上加上标签:这里多了一个限速牌,那里多了一个电子眼。以采集员的视角来观察世界的变化并记录,传到室内,进行内业的加工。在那个时代,映射世界完全是靠外业作业来完成。现实世界的变化也是靠采集员来判断。这是第一代生产工艺,强调的是外业的能力,外业人员的质量最终决定了产品的质量。

  第二代:影像识别是核心

  在第二代生产工艺中,解放了外业采集员。只需开一辆车,在公路上行驶就可以了。

  360度全景照片是2013年前后记录世界最好的方式,也是可视化制图领域效率最高的一种方式。采集车平均每10米左右采集一张360全景照片就可以记录世界。那时候的数据采集不再需要两个人。

  随后要进行内业识别。这其中涉及很多自动化应用。比如通过对影像、图像的识别,来判断这个世界中有哪些道路出现,车道线是什么样的,红绿灯在哪,最高限速是多少……这种方式效率非常高,可以迅速把现实世界映射到虚拟世界中。但第二代生产工艺依然存在缺点:难以感知世界的变化。虽然可以地毯式进行全国范围的采集,但无法解决第二遍何时去采的问题,因此也无法解决变化问题。

  第三代:AI是核心

泰伯网

  随着AI的到来就迎来了第三代地图生产工艺。它核心解决的问题就是感知这个世界发生的变化。采用大数据的手段,首要做到轨迹数据挖掘。

泰伯网

  大量的定位数据会产生轨迹数据,人们可以进一步通过轨迹数据来判断变化。例如:道路通还是不通,是一条新路还是正在修路,是临时封路还是马上要解除封路。又例如,以前路口左拐可以调头,现在不允许了,像这样传统工艺上的交限变化,这些信息让我们感知到这个世界的变化。它们通过传统的数据采集很难快速感知,通过轨迹挖掘就可以分析出来。

  轨迹挖掘主要解决现实世界变化问题,也比较容易解决。但这不是全部,例如交管部门非常关心阻断信息。当发布一个阻断,它如何快速进入到产品中,并且快速让用户感知到?

  这些变化并不能够百分百地、自动化地进入到产品中,好多需要再次确认。因此轨迹挖掘为现实世界发生变化提供情报线索。线索驱动二次采集。传统车采基本上采用地毯覆盖式的采集。现在则有了更多的方式。而未来地图要求映射世界的速度非常快,不光解决车导航的问题,还要解决出行问题,还要解决无人驾驶的问题,甚至要解决海洋河流中的导航问题。这些都要有对应的快速采集方式。

泰伯网

  室内目前也是人们汇集非常多的一个聚集地,怎么样对其快速映射?一个商场每年大概要发生30%到40%的变化,也必须要有高效的采集工具。

  数据二次采集后,还要进行图像识别。图像识别是一个很古老的话题。但是现在地图里的识别不仅仅是文字识别,而是结合场景的行为识别。

泰伯网

  我国有200多种国家标准的交通标志,几乎每一种都有十多种不同的表现形式。有地方标准,有临时标准,有些是现实世界中不是标准的标准。它们导致现实世界非常复杂,必须要把它们识别出来。这都是地图图像识别的任务。对于文字识别,路牌上的文字比较简单,但是还有大量的复杂场景。有些是繁体字,有些文字中包含不同字体。另外,一些交通限制要通过俯视图像来识别,如虽然收集到了车道信息,如何将信息和对应路段绑定?这些都需要AI技术进行大量的判定。

  当有了轨迹挖掘得到情报,进行二次采集,最后生产地图。我们既能映射现实世界,又能感知现实世界的变化。这一切看起来很美好。但是数据量太大了,每一次运算都需要大量的资源。运算瓶颈就出来了。这就提到了自动化编译模型。

泰伯网

  怎样自动化完成上述过程?这里引入一个现实库的新概念。线上的产品中除了现实库,还包含其他信息,比如大量交通规则,比如很多地方的交限和立交桥。这个是现实世界没有表达的。

  现实世界的80%是可以在现实库得以表达的。也就是说,如果把现实世界映射到虚拟世界中,也才仅仅完成了80%的要素。距离用户能够使用的产品,还有很多没有表达。这就要保证这80%的部分要自动化识别。否则一个地区快速地、多次地、加频地采集,更加难以保证。

泰伯网

  拿百度地图举例,每天以道路采集为主每天处理千万张照片。这就需要有足够的终端运算能力。在影像中发现少量的细节变化,把变化更新到现实库,现实库再自动化地映射到产品中,被用户感受到。这就是自动的生产流程,而当自动化结果比较准确时,甚至不需要再去验证。获得变化线索,很快就能反映到产品上。

  要把AI技术应用到数据生产中来。至少在百度产生的大数据中,基本上有40%是跟位置相关的。要做好位置大数据的架构,同时地图大数据也要能反馈到大数据库中,让AI得到更好的学习。

  最后刘玉亭认为,地图与AI的结合,一定要向其他行业开放。不仅向AI开放,向开发者开放、也要向无人驾驶等新兴行业开放。更多人拿到这些信息更好地运算,提出更好的算法,地图的生产效率才能更加强大。

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

更多精选文章推荐

泰伯APP
感受不一样的阅读体验
立即打开