分享
Scan me 分享到微信

石清华:开放核心算法平台,我们只用了三步

Minedata发布2.0版本,从“定制”转型“开放”,开放数据图谱、可视化能力及核心算法平台。

     2018年6月14日,由泰伯网主办,主题为“空间智能驱动万物互联”的WGDC2018,北京国家会议中心开幕。大会由空间信息产业创新创业服务平台泰伯主办,秉承不断引领和促进空间信息技术创新与变革的宗旨,WGDC已走过七个年头,如今成为全球最具前瞻性的跨界创新风向标。

     14日,由北京四维图新科技股份有限公司合作主办的融界—四维图新位置大数据平台MineData2.0发布会开幕。发布会上,四维图新副总裁、世纪高通常务副总经理石清华带来主题为《MineData一年变迁 聚焦·开放》的演讲。

泰伯网

     以下为演讲实录(未经本人核实):

     位领导、各位嘉宾,我现还是比较高兴、比较兴奋,每次到产品发布和产品沟通的时候,我浑身的荷尔蒙就起来了。

     我今天只是快速地介绍一下,这一次为什么要把位置大数据平台开放出来?包括数据图谱、基础能力全部都开放出来呈现给大家,让大家自己也能够有机会上面去探索、去挖掘、去创造数据的价值和业务痛点的一些方向。

     在座的各位绝大部分都是我们的合作伙伴和我们的客户。之前的接触过程当中,我相信大家或多或少对我们的产品有一定的了解。我们的产品平台大概有四板斧,首先是DataHIVE,一座能够装四维图新的数据仓库;一个是MineLab,比较专业地进行位置大数据算法供应和算法演练的实验室。还有MineSolution,这基础之上开始各个行业里面进行投射。去年一年做了很多的事情,各种业务场景里面解决各种实战的问题。

     去年年初接触了大量的行业,获取到了大量的经验,也给大家定制了各种行业的解决方案。毫不谦虚的说,我们是这个领域的专家。我们很清楚位置数据的价值,也很清楚业务场景里面怎么让我们的平台去做更好的支撑。但是一年过去之后我们发现有一些问题:我们选定的行业里面去深耕细作,但是有更多的客户和合作伙伴来跟我们聊,也希望有机会来去挖掘我们数据的财富和价值。

     所以如果说去年我们的主旋律是定制的话,那么今年我们主要的产品思路就是开放。看得见的是,这些行业里面信息化的进程、数字化的进程是越来越快,使得我们对于大数据的武装要求也越来越高。所以说,我们希望是把这些数据图谱、基础能力全部开放出来,让大家也可以上面去碰一碰、去用一用、去看一看,是不是有一些机会对我们自己的业务有一些下沉。

     下面,我简单地花几分钟的时间来介绍一下主要思路,我们是怎么来去做到开放的。

     第一,数据。

  去年花了很长的时间把整个集团生态,包括合作伙伴,包括行业里面碰撞的数据拟成了数据图谱。为了让大家更全面、更细致地去了解我们的数据,我们希望把这个数据图谱做到通俗易懂的程度,让大家一眼就能够看得见数据是什么样的形态,哪些数据对我们自己的业务能够很快地去下沉。

      为了做到这一点,我们区别于其他的一些行业图谱,把我们的数据整理成了基于位置大数据的图谱。这个从宏观上来说,理解起来不是那么的难,很简单的,大家只要Get到一点就可以理解。这要从四维图新的起源开始说,四维图新是从一个图商开始起家的,所以说我们本质的任务就是用数字化的手段把真实的世界给描绘出来,把真实的世界用数字化的结果给呈现出来,所以我们最本质的任务就是建模。建模的思路也比较简单,首先用测绘的手段把一个城市真实的世界给测绘出来,包括道路、包括建筑物,包括江河湖海;然后把城市的主体给收纳进来,包括路上跑的车、街上走的人;然后再把影响的环境因素考虑起来,这样构成比较完备的、去描述整个城市交通出行活动状况的所有数据集

     这些数据花了十多年的沉淀,又经过一年的梳理。今天想把这些数据开放出来,把数据图谱开放出来带给大家,并且这些数据还是每年以爆发式的增长积累着。

     其次是我们数据的平台。刚才说的这些数据从一个比较简单地数据图谱去理解它,去获取到这里面哪些数据对我们是有用。然后我们又搭建了一座对于数据生命周期全流程管理和对于数据提取高度自动化的平台。这个平台的目的也很简单,就是为了让大家很方便地去获得这些数据、使用这些数据。我们理解这些数据的基础之上,再很方便地去使用这些数据。

     第二,数据可视化。

     关于数据的可视化,去年已经把数据可视化做到相当的极致,对于任何的数据包括自己的数据、客户的数据、行业的数据,任意的图层都能够很简单地去定制。这是MineData1.0,但是经过实践检验发现还不够,比如给大家举个去理发的例子,一个比较简单地例子就是一个男孩说我要理发给我留这么长,这么长是多少长?很难去说。一个女孩说给我理一个梨花头,很难简单地表现出来。怎么能够呈现的有艺术性,又能够精准的诠释业务问题?如果是一个比较好的造型师,理发时会拿出一个画册说,这里有比较好的造型,看你要哪一个?我再给你修修剪剪就好了,这个过程比较顺畅。

     我们位置可视化重扮演的不是工具的角色,而是扮演造型师的角色。去年数十个行业里面上百个项目里面积累了可视化的集锦,收录了上百种可视化方案,经过众多项目锤炼之后,自己的业务上面有两三款属于自己的“造型”。我们有数据可视化集锦之后还不够,又推出了一个工具叫MinePlay,希望大家能够用玩一样的心态,很简单地把可视化方案确定下来。它的操作方式很简单,通过拖拽就可以把可视化方案快速地确定下来,这样工程投产的时候确定“发型”,修修剪剪,按照自己的业务来表达就可以了。我们希望把可视化的能力、可视化的方案、包括可视化的配套快速原形搭建的工具都开放出来。

     第三,算法。

     解决行业问题过程当中最关键的灵魂是算法,去解决任何复杂的问题、简单地问题都离不开算法的支撑。之前跟我们的合作伙伴和客户去沟通的时候,过程是这样的。我要解决业务问题,可能有这样的数据,希望得到这样的结果,中间的过程用算法模拟演练出来。

     之前交付了这么多算法,这个算法过程当中是这样的,我推演了一个算法结果是这样的,觉得这个结果好像还有一些偏离,然后我们再去调参数,调完再去交付。这个就缺失了一个过程,缺失了我们跟客户一起来进行算法推演的过程。

     如果说,把我们的算法推演过程也开放出来,让大家一块儿体会到数据和算法推演的过程性,是不是能够把我们的工作效率提升?基于这个想法,我们把算法平台也开放出来。就是说算法平台开放出来,包括之前做了大量的适配工作,做了大量的算法的分装工作,大量的产品化、平台化工作。直到今天可以自豪地说把算法平台给推出来了。从本质上来说,它实际上是一个线的集成的仿真环境,后台连接了数据仓库和算法仓库,线的算法环境里面可以随意的按照业务需求去抽取应该要去使用的数据,去推演应该要使用的算法推理过程,去观测算法的结果,速度很快,不再像之前一个来回、一个来回地交付,是把它变成连续的故事。

     我们突然意识到它其实是什么?其实是一个算法云。我们是云上面去定义算法、写我们的算法、去调配数据、去模拟算法结果。做这个决定还是下了很大的决心,是因为业界、位置大数据行业里面,把自己的核心算法云平台给开放出来,我们是第一个吃螃蟹的人。我们认为这里边有很多的故事可以讲,有很多的业务可以里面进行承载,我们实验了一下。包括我们现大部分去做的90%以上的算法都可以上面得到验证、实验、模拟,最终工程投产。

     这些就是我们今天要开放出来给大家带来的一些平台和产品,包括我们数据的图谱,包括我们可视化的能力,包括我们的算法平台。这些开放的能力都是经过了去年这么多行业里面上百个项目中的锤炼锤出来的。本质上来说,我们是比较注重实战和工程化的产品团队,所以我们要推出一个开放性的东西给大家使用之前必须要经过实际的演练。现推出来的东西包括开放出来的东西都是能够经得住实际的落地,能够快速的去适配和适装的。

     今天这里简单地快速的过一些这些产品升级的心路历程和发展的过程。我们这个团队已经比较适应了跟我们合作伙伴和我们的客户行业一块聊的时候,我们直接上平台。我们的习惯作风就是直接看真实的平台,让我对一PPT讲半天觉得体验感也不是很强,所以待会儿有我们的专门产品团队来给大家实际的用真实的平台来演练和模拟业务的走向,包括一些真实的案例分享。

     最后,我想强调的是说,我们是从去年的定制到跨行业到今年想去做开放、想去做“融·界”。这么几年一直不断前进的道理上去打磨产品,我们也随时的去欢迎合作伙伴和客户来对我们产品进行检验。我们希望用一个开放的心态去连接大家,我们希望用一个“融·界”的态度去给大家创造更多地价值,做好我们助推器的角色。

     谢谢大家!

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

更多精选文章推荐

泰伯APP
感受不一样的阅读体验
立即打开