锐码试验机
免费服务热线

Free service

hotline

锐码试验机
热门搜索:

数据智能时代帷幕拉开大数据知识图谱人工智能粉墨登台

发布时间:2021-09-01 17:42:17阅读:来源:锐码试验机

未来企业会形成基于数据中台、技术中台和业务中台为核心的业务流程,数据智能是整体业务智能化的开启。

图片来自“123rf.com.cn”

大数据从概念到落地,再到行业发展日趋成熟,有十年左右的光景,这十年称之为大数据的上半场。随着企业数字化转型需求逐渐深化,产业基础设施建设稳步推进,各项技术算法渐次成熟,以“数据智能”为代名词的下半场已经拉开序幕——

“大数据的上半场大家都在争夺用户,也就是数据,下半场争夺的是什么?我们认为是一个个用户场景,而不是用户本身。”数据智能的发展脉络在爱分析分析师李喆的介绍下逐渐清晰:“2013年大数据概念兴起,企业开始进行大数据平台的建设,但这一阶段,企业只知道大量收集数据,对数据价值尚不明确。经过第一个阶段的数据收集之后,开始让数据可视化,产生一定的价值,这是第二个阶段。第三个阶段从2017年起,利用ai建模算法的方式,在各个行业落地的应用越来越多,数据真正进入到洞察阶段。下一个阶段就是现在,技术逐步成熟,使得数据具备了推理能力,可以指导决策,我们认为就是进入了数据智能阶段。数据智能阶段的焦点在于中台,未来企业会形成基于数据中台、技术中台和业务中台为核心的业务流程。前三个阶段是业务数据化的过程,通过数据的方式去描述整个业务运转,下一步是业务智能化的过程,我们认为数据智能是整体业务智能化的开启。”

海致星图总裁杨娟、百分点董事长兼ceo苏萌、数梦工厂cto崔晓峰、个推董事长兼ceo方毅等数据智能行业的代表,就“数据智能行业的过去、现在与未来,以及数据智能企业在其中扮演的角色”发表了自己的看法。

海致星图总裁杨娟:数据是一个宝藏,同时又是一个荆棘丛生的地方

ai核心是让机器取代人,让机器去帮助人。所谓人机同行,如果机器不具备像人去理解和思考世界的能力,双方智能不在同一个水平上,就没有办法同行。人类理解世界的方式不是线性的,世界是复杂关系的组合,而知识图谱就是把万世万物的各种概念实体串联成网络,供机器模拟人的理解方式来理解世界的媒介。

为什么说知识图谱是ai的核心?主要在认知智能这块。从计算智能到感知智能再到认知智能,怎么让机器通过数据解读、计算,产出业务价值,这是知识图谱在真正行业化的过程中所遇到的挑战。

数据是一个宝藏,同时又是一个荆棘丛生的地方。

动态知识图谱中,静态知识比较容易梳理,即根据经验,加上一定的文本识别,生成图谱。图谱一旦输出,以周进行分析。但真正能对业务起到价值的数据往往是动态的,和业务的变化实时动态关联。比如在金融场景中,交易单每时每刻都在发生变化,信用卡申购、资金流入流出、人员后台的操作,对这些产生的信息加以捕捉和识别,然后进行决策,这才是真正对业务产生核心价值的数据。

金融行业里的实体关系包括了个人客户、账户、产品、商品、资产、合约、手机号、设备等等,这张图谱量非常之大,同样,这张知识图谱构建起来之后,可对应的应用场景非常之多,包括潜在关系、群体的识别、个体的分析、知识的推理等等。其中一个典型的场景是事件传导,当一家企业发生了一件事,无论好坏,怎样以量化的方式去计算这个事件在这张网络上的传播,关联的企业和个人会受到什么样的影响?举个具体例子,在金融公共领域,一个客户发生了违约,如何寻找他的关联关系进行追踪?这些都是我们的知识图谱所适用的典型应用场景。

百分点董事长兼ceo苏萌:用数据指导决策,真的能帮助很多国家提高人民福祉

数据智能中台的底层是大数据平台,包括数据的采集、分析、存储、加工等,中间层是数据资产管理平台,包括同一标准的数据治理体系、源数据的管理、数据生命周期管理和新型数仓。再往上一层是ai中台,包括知识图谱、用户画像等等。最上面一层是统一的数据服务接口,智能中台沉淀的数据、技术、模块和对企业管理的认知,通过接口对外输出。

目前在各个领域,包括政府、金融、零售等,都在扩大中台的应用,且效果显著。以百分点为海外国家搭建政府智慧决策体系的实践为例,由于这个国家基础人口数据是缺失的,百分点邀请了国内北大社科学院、中科院的人口所等众多机构专家学者,使用中国的人口预测模型,并结合海外国家的实际情况,帮助其做基础的数据融合和人口预测,有了这个数据,政府应该在一个城市建多少中学、多少小学、多少医院以及多少粮食,才有据可循。如果没有人口预测数据,国家决策失误的概率机会就会很大。我们真切地感受到用数据指导决策,真的能帮助很多国家提高人民福祉。

数梦工厂cto崔晓峰:摆在我们面前最大的挑战,是如何能提供一个全域、标准、鲜活的体系

服务于客户的过程中最明显的变化,就是我们的系统从交互开始就变得落后,建设的过程永远赶不上业务的需求快。因此,摆在我们面前最大的挑战是如何能提供一个全域、标准、鲜活的体系,让我们提供统一的数据标准、提供统一的数据实体、提供统一的数据服务,来支撑业务的价值呈现。

首先,需要全站的技术支撑体系。在体系构建过程中,由以前独立的离线分析系统演进到现在的在线生产系统,生产的过程需要业务全流程端到端的技术支持,包括集成、交换、治理、开发、标签以及共享等,来构建数据中台的基础支撑。

其次,需要全域的数据智能体系。数据不联动起来,无法创造更多的可以想象的空间和价值,因此在这里需要构建全域的数据资产管理体系,包括数仓的全域化、模型的行业化、数据的标签化和数据的资产化。只有把数据能全域打通,才能形成数据的资产。但是这个过程中需要构建统一的标准,数据、模型来构建对服务的支撑。

最后,需要全面的服务运营体系。数据是动态的,随着业务的推进在逐渐丰富,所以我们需要有一个队伍,按照一定的方法形成服务体系和运营体系,构建工具、标签、开放模型。

这三个部分加起来构成了完整的数据中台体系。

个推董事长兼ceo方毅:只要你联网,个推就能够推算出你的资产

数据行业里有一个特别经典的词,叫端详。一个应用场景中最重要的是客户方拥有真正有用的数据源,在去掉一些伪数据之后,将其放进大数据池里。每个用户有几千个特征,用机器语言描述出来,把其中的异常项拿出来,让行业专家坐那儿“端详”,以删除误导数据、发现一些特殊数据,最后把端详过的数据重新丢回大数据的池子里,这是个推采用的方法。

例如在金融场景里,个推通过用户的线上线下行为模式、关系、、身份、资产和属性,就可以测算出他的信用值。其中在测算资产时,只要用户联网,日常使用什么品牌、什么价位、吃饭的客单价多少、住的地方房子均价高低、是否拥有房子产权都可以被推算出来,应用于风控领域。在这个过程中要如何解决大数据充分应用和个人隐私保护之间的平衡呢?我们认为应该是用边缘计算,让很多运算在本地算掉。

一览群智ceo胡健:现阶段的人工智能属于弱人工智能,就是弱智

某种意义上,现阶段的人工智能属于弱人工智能,就是弱智。因为当前的人工智能几乎是完全基于数据、数据推理的方式,既没法理解人类的情感,也无法应对复杂场景中的决策和规划问题。

现阶段人工智能的落地都是快速反馈、单场景感知的智能,各种金融场景就是其中的典型。例如,在银行场景中存在大量可用ai取代人力的作业系统,包括放贷审核、外汇审核等等。在某四大国有银行,每天都有至少2000人在做审核,而且这些人普遍拥有硕士学历。因为大量的信用证和票据都是外文的,审核的逻辑也比较复杂,一个人一天只能审三单。现阶段,用智能决策平台、自然语言、知识图谱等方式,把复杂审核逻辑化,这个需求无论在保险、银行还是证券,都存在大量的需求。在这个场景中,机器并不是完全取代人,而是需要人做最终的校验,但这至少能从2000人降到100人,而且带宽是完全不滞后的。