分享
Scan me 分享到微信

极海夏君天:GeoHey·极海一站式地理云平台的行业实践

行业应用里面的事情需要继续探索各方的需求,在技术口不断丰富可用的数据和模型算法的基础上,我们在平台中拓展越来越多的场景。

  2017年 6月13日,由泰伯网主办、主题为“空间大数据的崛起”的WGDC2017,在北京国家会议中心盛大开幕。大会由空间信息产业创新创业服务平台泰伯主办,秉承不断引领和促进空间信息技术创新与变革的宗旨,WGDC已走过六个年头,如今成为全球最具前瞻性的跨界创新风向标。

  14日,空间大数据+人工智能峰会(极海纵横专场)开幕。峰会上,来自GeoHey·极海的夏君天发表了以“GeoHey·极海一站式地理云平台的行业实践”为题的精彩演讲。以下为演讲实录(未经本人核实):

泰伯网

  夏君天:大家好,我在极海是负责商业咨询,今天想给大家分享几个项目的实例,这张logo墙上落了很重要的一个客户,因为跟他们的保密协定非常的强,没有办法把他们的名字放上来。所以今天,我会用一些模拟的数据把这个案例带给大家。

  刚才我同事讲到说,人工智能是一个很古老的概念,但是到近年在技术发展支持下才迎来他的井喷,其实位置智能也是一样的,如果说我们还停留在数据找不到,或者质量差,没有办法去满足传统分析模型的要求这个阶段,那就没有办法再往后谈应用了。所以我们首先需要的就是今天我同事也反复提到的这些新时代的技术储备,来搭建起这个桥梁。这个桥梁它通向哪里?位置智能我们这么谈,它到底是不是一个真命题呢?我们来看看技术先行者的美国。因为我知道来GeoHey这边工作之前就是在美国做地理信息建模的工作,那边这个行业的发展已经是非常惊人了,这几个数字是来自几年前波斯顿咨询集团的一份权威的行业报告。地理信息服务,年产值达到了百亿美元的级别。为什么他能做到这么大的规模,而且还在持续的增长,就是因为在这几十年中很多分析优化的方法已经探索成熟,而且已经被无数次证实了,它能在各个行业中提决策的支持。

  在这里,我强调决策的支持,具体来说,是比如我这个产品要不要进入一个城市?我这个地产项目如果说在这儿开发能够带来多少的收益,或者我这个城市想修一条地铁线,怎么样设置线路,能在最大程度上疏解城市的交通。为什么强调决策,因为我们做一站式的平台用户可以查询可以展示,这些都是在效率提升的层面上,以前我们做得到,而现在我们做的更快,更加方便,这本身是一件非常有价值的事情。但是与此同时,我们还想到下一个层面去做以前做不到的事情,也就是人工智能的引入。现在这张图是我们做城市板块分析的截图,我可以去查询比较每一个板块上各个维度的信息,而人工智能给它增加的是什么呢?是通过机器来学习所有这些信息,按我们现在的数据量,有几百个维度,我能去提取出它的特征,能预测,所以这些板块对银行业务的需求有多少,它对烟草销售的需求有多少,从而做网点布局做优化的时候我们就能基于这个数据准确的给出结论了。

  这些项目我们现在实际中在做,加入人工智能之后,任何一个位置,除了有原始信息,提炼一个标签然后再到提炼一个预测的结果。我接下来讲的案例帮沃尔玛做选址的项目,之所以找到我们也是一个挺有意思的项目,刚才提到在美国地理信息这个行业现在的发展,作为一家美国公司,沃尔玛他们觉得要选址就必须做位置智能,觉得在中国大家为什么不这样做呢?

  其实为什么不做原因也很简单。这张图大概说明了在美国,效果很好的位置智能市场细分的模型是怎么建立的。它先要把人群细分,比如这组代表的就是中产有孩子的家庭,平均三个人他们住在独栋的房子里面已经30多岁,另外这一组年轻躁动,收入中产,两个人住在公寓里,不到30岁,他们真的把人群划分到这么细致的程度,都把街区上都标识出,到底哪些人群住在这里。我是做快餐的,我只要建立关联,知道我的顾客是来自哪个人群,我知道去哪儿开店或者去哪儿宣传我的店。所以沃尔玛高层他们的想法也是一样的,他们对于自己的客群有定位,然后碰到了瓶颈,去哪儿找这些人呢?比如我要不要去天津开店,如何开,开几家,在哪儿,在中国,他们习惯用的数据是没有的,前一半已有客群的画像只能依靠自己去希望扫街,发问卷。后一半潜在客群的寻找更加难做通。后来沃尔玛找到我们,利用极海这边地理大数据和机器模型的算法,能不能做出类似于美国那样的分析,于是我们帮他们做了这件事情。

  这张图依然说的是人群的事儿,你会发现它的描述方法变了,我没法直接的知道在这个街区里面家庭的年收入是多少万美元,就像刚才看到的数据。用什么代替它呢,比如用房价靠谱吗?我们最初以为房价对人群指控性是非常高的,我们把它交给机器学习,反而淘汰了。拿北京为例,四环以里,这些人一直住在这儿,可是房价已经高到什么程度了?在沃尔玛他们想关心人群的购买力,最终模型发现什么样的指标重要呢?比如说这个街区有两家干洗店还有三家品牌咖啡厅,机器学习告诉我们说,这个街区的人是我们的潜在客群。

  另外一个,有两家宠用品物店,街地面还有一个还有婴儿孕托,机器发现他们也是潜在客群,他们的会员转化率比上一个街区还要更高。我们最终类似这样的方式做出了中国数据特色的机器学习模型,能够找到每个街区里面通过这种特征,它能产生多少商用店的潜在的客户。

  这张图是我们模型效果和传统分析的对比,横轴上一共10几家的商店,纵轴是他的会员数,蓝色的两条线是商圈内的会员数字,深蓝是实际的数值,浅蓝是我们模型数值的数值。黄色的线通过我们的机器学习模型来预测,依然在每家店的商圈内,但是他想说的是最大的会员潜力是多少。意思如果他都不嫌远,每家街区边上都有一家店,转化成会员的数字是多少?潜力数字比实际数字也高不了多少。A店和B店他们之间差异非常大,我们这边作为技术的提供方,最开始只是看机器算出来的数,最后我们双方做解读的时候他们发现我们的结果非常对,B点这个城市他们本来怀疑可能城市的潜力已经开发尽了,所以他们觉得剩余的潜力不大了。A的城市他们本来能预期,能像旁边那个高点,最高的这一家城市一样好,可是实际上,他的表现差了好多。根据我们的模型告诉他,上线确实也是有那么高,因为整个城市都是国际化,这里人有太多购买进口商品的选择了,也可能因为这个城市的人开车比较少,所以稍微远一点不一定到商店买东西了。灰色的线,很中规中矩的一个数值,黄色的预测是在我们机器学习精度够的情况下得到的大胆的分析,也是很庆幸的得到了客户的认可。

  下面说另一个例子,刚才的模型可以认为对静态人群的分析,我把北京划分成两千个街区,按每个街区我计算你的居民对某一个行业的需求,这个例子则是动态研究的分析,想象一下,如果我想考虑的目标不是说三个会员店,而是普通的沃尔玛购物超市,红色的圆就是一家一家的超市,如果有人每天下班路过我的店门口是不是他成为我顾客的机会就会特别高呢?在方案设计模型选择的阶段对需求场景的认识非常关键,大多数人都是周末从家里开着车集中采购大量的商品,所以我们关心的就是这些人住在哪儿,他开车过去有多远,对于普通的沃尔玛超市很多人就是下班路过,他去买点菜,买点日用品,不会大老远的开车过去,就要追踪他们日常移动的轨迹。

  在这里我们接入的从移动设备轨迹点,上面的图显示每个城市每天接入的数据的条数,多的时候达到上千万的级别,最后通过大数据的建模识别出每个设备工作日的朝九晚五在哪里?他通常的轨迹是什么样子的?我就可以看哪些轨迹会经过这附近,然后我去追踪他住在哪儿,在哪儿上班,我可以非常有针对性的宣传,去搞活动,去投放广告,这类项目我们现在验证也是非常的成功。

  回到这张图,举一个我们自己觉得挺有意思的例子,在东边我们分析北京东四环的超市,发现很多周边的人流来自通州,这很好理解,还有相当的人流他们住在顺义,但是数据告诉我们说,确实顺义那边很多人会南下来上班,成为了我们的潜在客群。所以我可能真的想到那边宣传我的店。

  之前说的居住人群模型,人流模型,其实可以把他们都想象成是人工智能平台的组建,发散一下评估一个位置适不适合开一家新的沃尔玛超市,我可以先用人流模型定位路过的人住在哪儿,然后这些模型看这些人是什么样的群体,有多大的转化率,包括其他分析,像是新店和老店的竞争,一个城市的市场容量等等,我们建过模型,提供解决方案,还是去落到最早说的去支持决策。

  行业应用里面的事情需要继续探索各方的需求,在技术口不断丰富可用的数据和模型算法的基础上,我们在平台中拓展越来越多的场景。我这部分就结束了,待会儿龙老师从用户的角度谈一谈我们的平台在规划里面的实践。谢谢。

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

更多精选文章推荐

泰伯APP
感受不一样的阅读体验
立即打开