分享
Scan me 分享到微信

张京涛:如何用地理大数据实现商业智能?

在大数据时代,我们所要处理的数据它的特点就是量大人多。自主知识产权可以让我们把这个平台的功能不断的做一些增加,这样可以更好的来响应客户的需求。

  2017年 6月13日,由泰伯网主办、主题为“空间大数据的崛起”的WGDC2017,在北京国家会议中心盛大开幕。大会由空间信息产业创新创业服务平台泰伯主办,秉承不断引领和促进空间信息技术创新与变革的宗旨,WGDC已走过六个年头,如今成为全球最具前瞻性的跨界创新风向标。

  14日,空间大数据+人工智能峰会(极海纵横专场)开幕。峰会上,来自GeoHey·极海的张京涛发表了以“如何用地理大数据实现商业智能?”为题的精彩演讲。以下为演讲实录(未经本人核实):

泰伯网

  张京涛:非常感谢大家还能继续听我们的分享,我是极海负责合作伙伴和商务的张京涛,提到人工智能我自己还是蛮感慨的,为什么这么说呢?去年的时候大家见面聊的还是大数据,怎么今年人工智能在两会上写入政府的工作报告了,可以说发展的太快了,不进则退。同时我自己非常的有压力,我非常的庆幸在新技术不断的涌现的时代,在座的每一个人机会非常多,在新技术面前,只要谁接触的更早,谁可能成功的机率就更大。在这个环节我和我的同事夏君天,用我们的一些案例和大家一起聊一聊,看一看我们极海用哪些新技术,做了一些什么样的有意思的项目。

  我们作为一个技术型公司,虽然现在取得了一些小小的成绩,但是我们不能忘掉初心。极海这个团队95%都是技术人员。可以说是一个典型的以技术为驱动的公司。我们的这些小伙伴,每天都在做着技术的讨论。我看到大家的进步都非常的快。其中包括我,自己虽然一直做商务,现在也可以用机器学习,直接和客户进行一些交流。我们这些学霸型的小伙伴们,用了大量的精力,在今天正式推出了最新版的,还具有完全自主知识产权的一站式地理云平台。

  我们为什么要强调完全自主知识产权呢?在大数据时代,我们所要处理的数据它的特点就是量大人多。客户的需求也是在不断的变化,所以传统的GIS平台和互联网地图不太能适应这种比较新的需求。自主知识产权可以让我们把这个平台的功能不断的做一些增加,这样可以更好的来响应客户的需求。

  第二点,在今年的6月1号,我们过的也不平凡,它不仅是一个六一儿童节了,还发生了菜鸟和顺风为了数据的互怼,现在企业用户对数据的安全性也是越来越重视。我们只有自主知识产权的平台才能把我们的云平台离线的部署在客户那里,以私有云的方式满足政府和企业级客户对数据安全的要求。

  第三点,现在只用企业的内部数据,假如不用外部数据好像不能称为一个真正意义上的大数据的项目。我们现在樵夫难为无米之炊,这些外部的数据就是米,所以我们极海又为大家准备了丰富的地理标签数据。我们是希望通过一站式的地理云平台,给大家做到万事俱备,只要你有想法,就可以切实的体会到地理大数据给您带来的价值,这就是我们核心的初衷。

  说到我们极海服务的第一批客户,是这些大数据公司,像信佰,量子他们都是行业大数据公司,在商业、零售等这些行业,都已经做了很多的大数据项目。可以说自身的技术实力也非常的强。只不过在地理的维度上有所欠缺。术业有专攻,因此他们选择了和极海合作,来弥补他们自身地理方面的短版,我们共同给客户提供服务,而实现共赢。第一步做的工作需要把他们自身海量的数据线做上图,本身他们对数据蛮敏感的,因此要求我们把地理编码的平台离线的部署在企业内部,他们自身的数据容量都是几千万级。比如说信佰有几千万个商业会员,商场会员的文字地址,量子有几千万的企业的注册地址,我们需要把这些文字的地址转化为经纬坐标,同而在地图上展示出来,这个环节说起来容易,做起来真的蛮难,我前边的两位同事都提到了地理编码,为了提高上图的精度,并没有采用传统的模型,而是采用了机器学习的模型,对地址进行切割和标注。至于上图的精度,用过的这些大数据的公司对我们的反馈是,还是优于互联网地图公司提供的在线地理编码服务。

  在做完了客群上图以后,很自然下一步的工作,就要进行画像。说到画像,我们必然的就会用到外部的地理数据。来做什么呢?来看一看这些商场的会员他住在哪个小区,还需要知道这个小区是高档小区吗,看看企业注册的写字楼是否是甲级写字楼,同时也给我们提出了反向数字编码的要求,我们给平台输入一个经纬坐标,需要平台反馈给这个属性和其他的标签。我们扔进去一个经纬度,他告诉我们这个是绿茶茶厅,绿茶经营的是广东菜,他的客单价是87一位。地理编码和数据标签这两个产品听起来蛮简单的,但是它应用的场景非常的广。后来我们在做包括政府的智慧城市项目,我们接触到的地理数据绝大多数都是文字地址,要做地理大数据第一步先从上图开始,上完图以后我们进而在智慧城市中对城市进行绘画,就需要对地打标签,对人打标签。我们感觉做大数据还是要修炼好自己的一个基本功。像地理编码和数据标签可以说是地理大数据的基本功。

  第二个案例和大家分享一下房地产的案例,熟悉我们的朋友都知道,在最近两年来,我们给十几个房地产上市公司做了几十个城市地图,在房地产上肯定有些心得,我不太过多的去谈现在做的这几十个城市地图,我随着第一位发言的思路,谈一谈最近一个广州的房地产集团公司为什么选择了极海?

  总部在广州的房地产集团公司,有20几个城市分公司,这些城市分公司做的一项非常重要的工作,就是每一个季度,都要出城市的投资报告,这个投资报告,既要给区域的老总汇报,也要上交给集团公司的投策部门,左边的这幅图,是他们绝大多数城市分公司,从互联网地图上做了一个截图,然后再用photoshop在地图上做一些标注的工作。截出来放在PPT里,再发给集团的投策部门,看到这种图比较困惑,他对这20几个城市也是特别的熟悉。

  有的地方,他需要放大地图来看一看这个板块的细微的情况。有的时候他需要缩放的地图看看整个城市的宏观。但是这个图片又没法起到这个作用,而且这些每一个分公司用的统计方法,分析手段非常的不一样。这样让集团公司就会觉得很是头疼,他们听说我们极海做了很多的城市地图给其他的公司,就找到我们,跟我们聊。在聊的过程中他发现我们不仅可以直接的投报告,而且我们的公有云平台,即使他们没有专业的GIS平台,做点数据图,面状图,空间分析的工具和方法,对他们来说也是易如反掌,非常的简便。而且在做的过程中每一个环节都可以把这个地图的成果分享出来,能达到组内对整个工作的协同。可以说,我们这次是没有给他们做一个完整的城市地图的投策报告,但是他们用我们极海的云平台的原因,一个是操作简便,第二是分析方法可以让各个分公司一致。第三地图可以按阶段随时分影出来,实现协同办公,让三点让他们集团和20多个分公司都买了我们的公有云帐号。

  这是他在我们的框架下基于数据自己配置出来的广佛的城市地图,左边能看到它有很多的指标,这些指标肯定有数据才能给它做出来。以前他们做数据的方式也是每个城市自己用自己的渠道去购买城市的数据,这样参差不齐,后来接触过程中发现极海的数据具有几个特点。第一个我们的数据是多源数据,多源数据必须做到清晰。前边很多人都说在互联网上数据太多了,但是太多的数据质量并不好。我用房产数据举一个例子,房产数据来源于链家、搜房、安居客,我说的这些房地产可能大家不是特别清楚,要说还有,我要搜房很多很多。我们需要把这些数据给它整理加工成我们极海自己的房地产数据。这个前边同时也讲了,也是用到很多机器学习的方式。有了数据肯定需要定期的更新,定期的更新也是考验一个公司他的数据积累的能力。因为我们有的时候想三年前的数据,你要没更新怎么能有三年前的数据呢?我们现在的数据有的按月更新,有的按天更新,有的按季更新,这样可以找到整个一个阶段的历史性数据。第三个特点是它的分类清晰,我们接触的很多数据,有的说十大类,二十多类,我们实际使用过程当中,自己可以想一想,一个全聚德烤鸭店和黄焖鸡米饭他们是不一样的。

  第四个特点,是我们的数据的标签非常齐全。我们不仅有千鹤家园,小区的经纬度,还有它的名称,还有千鹤家园他的物业,他的建筑面积,它的总户数,有了标签维度丰富的数据才能让你做更多的指标的可能。

  昨天很多专家也都讲到,今天之所以能进入到人工智能这个时代,是因为不仅仅有了海量的数据,也是因为有了这种高质量的数据,我们能在这两年之间,和十几个房地产公司展开合作,最主要的一个根源,也因为我们有这种高质量,多维度的数据。

  在做完数据的工作之后,目前我们在和广州总部在谈,用这种机器学习的算法,来做什么呢?来做多源数据的融合。怎么更好的给板块画像,怎么更好地给板块聚类,甚至怎么更好的去预测板块未来的招拍挂的价格。

  最后,我们会给他们推出一个让机器自动写报告,解决投策人员工作的成果,这是在去年,2016年我们给北京一个做商半地产的房产中介公司已经推出的机器写报告的工作平台。我们把数据每个月更新,机器会自动利用30多大类数据做400多项小指标的运算,生成一份一百多页的PPT报告,你觉得生成一份一百多页的报告大约需要多长时间?就用一分钟,而且不仅一分钟,本身我们把北京分成了两千多个交通小区,可以说在一分钟之内能同时出两千份一百页的PPT投策报告。我们希望跟房地产公司,跟各行业的客户合作,通过这些新技术,把他们从以前不熟悉的技术工作中解脱出来。让他们把自己更多的精力,投入到他们更擅长的专业里边去,真正做到术业有专攻,共赢,提高他们的工作效率,也同时大大的促进他们的工作成果。

  现在企业自己内部的业务数据自然是越来越多,外部的多源的数据获取的手段也是越来越容易,价格越来越便宜。我们怎么把这些多源的大数据进行整合,是否能真正有效的挖掘他们的价值?根据这些数据能否做出预测?这个是我们有了人工智能才敢想到的。很庆幸,我们极海的这些小伙伴们,对人工智能的算法很早就非常的痴迷。我们在2016年的时候实实在在的把这种机器学习的算法,带入了几个在地理方面领域,前面我的同事徐翔用了很大的篇幅来讲,我们也用人工智能做影像的地物识别,已经给中科院做了很多的项目。在下面一个环节,我的同事夏君天也会讲我们怎么把人工智能用在大型的零售商的选址过程中来。

  从2015年的3月份,我们给第一个用户信佰这家大数据公司提供第一个服务开始,到2017年的6月,我统计了一下,我们给以上的客户一共提供了72个服务,可以说我们的革新的初心收到了客户的反馈,也得到了客户的信任。在此我们也非常期望在座的各位假如对这种新技术感兴趣,也欢迎大家能加入到极海的大家庭,无论你是来这里工作,还是学生到我们极海实习,我们都非常的欢迎。

  这样咱们可以一起实实在在的用一些新技术,去踏踏实实的做一些项目,公司有进步,个人有进步。

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

更多精选文章推荐

泰伯APP
感受不一样的阅读体验
立即打开