本篇文章2904字,读完约7分钟
2019年7月11日,极限测试主办的图形学习创新大会和2019图形数据建模平台发布会在北京泰富酒店举行。本次会议邀请了203位行业领先企业的代表、媒体和嘉宾,共同讨论和交流最热门的图形神经网络,见证了中国第一个自主开发的图形数据建模平台的启动时刻。
中国第一个地图数据建模平台——叠加地图
中国需要技术创新
这是一个工业智能已经形成的时代。企业发展与数据之间的联系越来越紧密。标题算法催生了字节跳动的崛起。神智已经用阿尔法去击败李世石引爆了机器智能的无限可能。阿里和华为分别推出了人工智能芯片,潜在的支持也将带来变化。
实现智能有很多方法。过去,企业通过深度学习来训练神经网络,但在关系数据挖掘方面仍然缺乏。图形神经网络在关系数据挖掘中有着巨大的潜力,正成为学术界和工业界的研究和发展热点。
人工智能时代企业成长突破的关键
从2012年到2018年,人工智能技术在短短6年间带来了巨大的变化。例如,美国有线电视新闻网的出现使计算机视觉得以突破,刷脸付款,刷脸入站,自动驾驶发展非常迅速;Rnn在自然语言处理方面取得了很大的进步,机器翻译和智能助手等应用也越来越成熟。
然而,这个世界产生的数据不仅是图像或声音,而且是具有特定关系的关系数据。根据波士顿咨询集团的报告,进入互联网时代后,企业产生的数据急剧增加,但只有40%得到了有效利用。
最重要的原因之一是关系数据没有被有效地使用。数据作为人工智能的燃料,没有得到有效利用,这是企业无法实现增长突破的关键。
图形神经网络的出现将充分发挥关系数据的能量,这是企业在人工智能领域竞争的又一次良机。
图形数据建模平台
如何解决着陆困难
图形神经网络出现较晚,是一种相对较新的技术,它具有很强的能力,包括适应多种类型数据的能力、学习关系的能力和逻辑推理的能力。您如何将这些强大的功能应用到您的业务中?实际上很难真正实现这项技术的落地。
首先是系统的可扩展性。在工业场景中,绘图数据都是数百亿,所以系统应该具有处理大规模数据的能力。其次,gnn模型对分布有很强的适应性。大数据的分布式开发在今天已经非常成熟。然而,在处理图形数据时有两个问题。首先是图形数据不容易切割,其次是图形数据库历史悠久。在设计之初,主要考虑的是添加、删除、检查和修改,但是gnn的分布式建模需要更多地考虑对数据的特定操作的效率和数据提取的吞吐率。
测试和研究需要很多时间。经过在实际业务中的探索和思考,发现要解决这个问题,必须从底层适应数据存储方案和运行模式。
定制的技术架构
可伸缩性和高效率是真正工程化系统的必要条件。在多年的图形数据建模探索中,充分结合图形数据建模的特点和难点,开发了一套满足建模需求的底层数据引擎。技术框架:
整个技术框架的核心是中间三层,即存储层、操作层和建模层,这三层是根据图形数据的特点开发的。
存储层和操作层统称为图形存储引擎,主要完成图形数据的分布式存储和操作的抽象接口。在这一层的设计中,他们围绕图的划分、图数据的结构设计和存储以及整个数据系统的索引设计和优化做了大量的开发工作,以支持上层数据操作的高效性,如随机游走、子图采样等。
在模型层,采用了消息传递机制,由于下层支持高效的数据操作,有更多的空来完成gcn对属性图的适应。
绩效指标显示:
数百万个节点的映射可以在不到20秒的时间内完成。对于1亿个节点和5亿条边的数据,10个人的映射时间只需要150秒。在读取性能方面,测试了子图像采样的性能。在该索引中,极限测试将时间控制在100毫秒以下。如果达到该效率,显卡的计算延迟将不会发生。
产品给企业带来的价值
覆盖图是第一个支持企业级图形数据深度学习的建模平台,为企业提供一站式建模服务。如今,saas服务模式越来越流行。从事金融、零售和医疗的企业不需要花费巨大的精力从底层一步一步地搭建平台。不应低估资源、人力和时间的成本。细化分工,让专业人员做专业的事情,是我们整个社会不断进步,生产力不断提高的重要前提。
降低企业的申请门槛
覆盖集成为大规模图形数据的分布式建模能力,它提供了网络侧的操作,企业无需专家就可以直接使用。其次,整个建模过程固化在平台上,大大降低了后期模型的维护成本。
有许多叠加的场景
如今,几乎所有的企业都有多线业务开发,一个主营业务下可能有多个子业务场景。覆盖图可以完全支持企业的多场景需求。
图形数据建模的业务效果突出
今年,一个非常流行的概念被称为“技术的中间阶段”和“数据的中间阶段”,这意味着来自各种业务和企业场景的数据被收集用于数据生产。这是未来两年的大趋势。图形建模可以集成和建模来自数据关联的各种数据,这将大大提高业务效果。
应用场景
图形数据是最能描述这种关系的数据,可以应用于广泛的业务场景,包括风险控制和营销,这可以增强整个行业的能力。
风险账户识别
gcn模型已被用于识别极限体验产品中的风险账户。使用帐户、设备、ip和它们的关系的数据组成一个图片,然后将图片输入到模型中。gcn将自己学习一些模式,例如高密度二分图(如下图所示)。
Gcn的auc指数提高了1.2倍,其鲁棒性提高了1.5倍,即模型在一个更新周期内的效果。这表明使用gcn进行风险识别是一种健康和可持续的安全手段。
汽车保险反欺诈
图形数据建模也非常适合汽车保险欺诈检测。车辆事故的数据很多,比如车辆损坏的数据,包括皱纹、凹陷、裂纹、划痕等;车辆属性信息,例如,每辆车来自不同的制造商,不同的年份和不同的版本。这些数据之间有着非常复杂的关系。例如,当一辆汽车的发动机损坏时,其他零件经常会损坏。
图表是最能描述这种关系的数据形式。通过构建汽车保险索赔图,利用图神经网络,可以很好地发现一些风险模式,如在线风险、二手车风险、人身伤害和瓷器碰撞、索赔人问题等。
在实践过程中,基本上可以将生产效率提高数百倍,实现大损失。
企业风险识别
在金融业中,实时判断贷款企业的风险,及时调整贷款,降低风险也非常重要。根据企业的舆情信息、相关企业信息、股东信息、产业链信息等。,构建图表数据,使用图表计算来分析公众意见热点,分析企业动态,并及时更改企业贷款政策。
人工智能下半年的门票
目前和未来,随着数据的不断扩展,借助图形数据提高企业的技术实力将是一个重要的解决方案,可以实现行业整体效率的飞跃。
图形计算发展迅速。世界上所有的数据都可以用图形结构来表示。图形卷积神经网络、图形注意机制、图形自动编码器、时间空图网络和图形嵌入等新技术的研究也在不断深入。将图结构的相关特性与因果网络相结合,有望证明神经网络结构的可解释性。
屠还继续扶持各行业。如金融反欺诈、银行反洗钱、保险反欺诈、企业风险控制等领域,在医疗药物挖掘、图像识别和智慧城市等方向的研究也在不断深入;图形技术可以广泛应用于挖掘行为异常、构建知识地图、推理节点关系等场景。
技术推动发展,需求创造应用,在图形技术领域有许多技术挑战和巨大的行业需求。不幸的是,企业可以实现“地图”的价值,但没有人能够从零开始承担研发的资金、人力和时间成本。覆盖图的发布将为地图生态学的建设提供一个关键环节。
来源:搜狐微门户
标题:极验发布全国首个图数据建模平台,新引擎助力企业告别AI马车时代
地址:http://www.shwmhw.com/shxw/37125.html