本篇文章3235字,读完约8分钟
2018年7月10日至12日,2018中国大数据应用大会在成都召开,主题为“大数据助力数字中国”。由成都市人民政府指导,中国大数据专家委员会、中国电子信息产业集团公司中国电子学会、四川省经济和信息化委员会主办,世界工程组织联合会、成都市经济和信息化委员会、成都世博局协办,中国电子设备股份有限公司、中国电子学会科技交流中心承办,知名媒体支钉协办。
会上,小米大数据产品总监赵发表了题为“十亿级大数据应用”的主题演讲。他重点介绍了小米大数据的典型应用场景及其在搜索推荐、新零售、消费金融和智能家居等领域的许多实践。
小米大数据产品总监赵
以下是赵的发言记录:(内容按现场速记整理,未经发言人确认,仅供参考,谢绝转载)
领导和专家们,你们好!我今天分享的话题是小米的“十亿级大数据应用”。内容包括三个方面:小米的业务和大数据积累,小米大数据的典型应用场景,用户非常关心的隐私保护策略。
我们从一个小团队慢慢成长,从一个小公司逐渐制造大数据。在小米三项全能(硬件、新零售和互联网)中,每一项都有我们大数据的支持。
当小米上市时,资本市场正在争论小米是一家什么样的公司,小米应该以哪家公司为基准进行评估。它拥有一些互联网服务、手机、自己制造的新零售产品和一些硬件产品,这将会给小米的多元化经营和公司定位造成一些混乱。我们如何看待自己?作为公司的技术部门和技术中心,我们的定位是这样的。我们认为小米不仅仅是一家手机公司。雷将小米描述为一家移动互联网公司,我们也是一家智能设备公司,我们仍然是一家新的零售公司。归根结底,它是一家数据公司。
就小米而言,我们的3亿小米用户不能在没有小米用户的情况下谈论我们所有的后续业务,所以对于手机的硬件平台来说,有一个有流量的入口。在3亿用户中,我们每天有超过2100万个小米应用,所有这些都存储在我们的云服务中。就数据量而言,例如,像小米生态链,我们也有77家公司合并生态链。当然,这个数字现在更大了。具体数字是多少?我来这里之前和我们公司的公关部门谈过,他们的意见是暂时不应该透露最新的数字。
就生态链而言,有丰富的产品线,主要集中在家用产品。我们知道有成千上万的mi乐队。为了支持这些小米业务和硬件业务,我们的云服务需要大量成本和人力来构建云服务。这里给出的数字有点旧了。目前,我们的总存储容量超过200页,远远超过200页。
用户生成的文件太多了。对于小米的生态数据来说,有这么多的生态链数据,而我们多样化的数据是一个特色。我们可以看到手机用户使用的数据,以及围绕智能家居场景和日常生活收集的数据。我们认为,用户通过小米平台生成的这些行为数据是我们在后续大数据建设中的核心竞争力。这对我们的大数据也是一个挑战。如何集成这些异构数据和半结构化数据来支持核心业务也是我们的技术面临的挑战。
为了支持公司的发展,我们有这样一个大数据计划。今天的高级功能通常成为人工智能。我们有一个高级的人工智能层,B指的是大数据层,下面的基本能力和基础设施是c。在云计算层面,我们技术团队的大部分人力和资源都放在基本能力层面。在大数据业务方面,我们的工作主要是支持公司现有的业务,现有的核心业务,比如我们的销售,我们的手机,我们的手机生产,还有李杰老师刚才提到的一点。如果雷先生听到了,他会非常支持的,那就是质量革命。在过去的2017年,如果说小米只有一个关键词的话,那就是质量,而雷对我们的要求也意味着大数据可以为公司、手机生产和手机使用做出贡献,这也是我们团队的一项主要任务。
我想介绍一下小米大数据的典型应用场景。首先,让我们谈谈大数据的全球搜索。现在我们已经访问了16种垂直内容,平均每日用户量为1600万,平均每日请求量超过4000万。这也是去年前两年信息流发展非常快的事实,小米的信息流业务也增长非常快。
在新的零售和产品渠道领域,我相信每个人都会遇到一个共同的痛点,即销售渠道中的交叉销售商品,这是价格攻防中最头疼的问题。小米刚刚进入线下市场,我们面临的挑战也是这个方面。因此,我们将在渠道管理方面支持该公司,并对交叉销售商品、价格混乱和大数据中的机器刷作出一些回应。除此之外,我们还对用户群体进行深度运营,支持我们品牌和售后服务体系的建立。
在小米的大数据中,一个业务块是现金贷款,许多家庭都有这样的系统,用户可以查看它。小米手头有大量数据,所以我们会提前知道每个用户的风险。小米采用邀请制度,我们会向信用状况良好的人发出邀请,所以小米在现金贷款和防欺诈方面的逾期率非常非常低。在金融风险控制系统方面,即在邀请方面,我们将对还款阶段和收款的每个环节进行预控,并积累用户行为数据进行判断。
对于金融业务来说,信用数据是最重要的。对于小米来说,我们缺乏来自银行的数据,也缺乏来自淘宝的数据。我们的数据来自较低的层次,而且数量非常大。它没有如此密集的基层行为数据,因此我们的大数据任务是为金融业务挖掘出这些低价值数据。我们用大量的行为数据进行分析。对于一个用户来说,他的行为模式中有各种各样的行为模式可以记录在手机平台上。我们通过机器学习寻找与个人逾期风险和还款风险相关的特征。
例如,我们挖掘的数据不是基于专家或销售人员发现的数据。一个人手机中的财务数据在30天内不会被激活。同时,他将在三小时内有几个账户。上面有活跃账户,前十名中有三个金融应用。我们将会看到,这三个特征的相关性似乎是一个毫无意义的场景,但是当我们的数据发现这三个数据是相关的,这就代表了这个人的逾期和欺诈。
接下来,我们将与财务团队合作,将我们的财务、个人应用和财务服务整合到小米系统中,包括销售,包括像它这样的智能设备的使用,包括与我们的联系,特别是与健康相关的智能设备、数据收集和后续的健康服务,从而创造一个生态财务服务。
接下来是大数据和人工智能。6000万是一个保守的数字,我预计它将达到8000万或更高。如此多的网络设备已经收集了用户的各种健康状况以及与他的各方面行为相关的数据,其中将建立数千万个场景。我们如何整合这些场景来建立用户的行为模式,而语音控制、交互等等都是具体的技术手段。例如,我们智能助手的引擎是基于语音控制的,您可以通过语音控制小米电视与各种智能家居设备和手机进行交互。这种互动是由人主动控制的。在我们对智能助手生态的理解中,我们强调的是无声的交互,也就是说,对于用户的下一个动作,他接下来会做什么?然后你可以通过我们的智能助手提前预测,预测后你会提前为他准备好这项服务,这样人们的体验会大大提高。雷刚刚发布的小米8就是一个最典型的例子。在这种情况下,根据用户的使用习惯,我们将预测他在接下来的半小时内可能会打开哪个手机应用程序,以便我们现在可以启动这个应用程序。同样的逻辑也用于智能设备的使用。
根据我刚才所说,每个人都会感受到新功能的诞生,当然,有些人会担心隐私泄露。小米是一个系统,不像业内一些互联网公司,他们的知识产权和一些互联网正在收集用户的轨迹。对于小米公司来说,如果用户察觉到我们的隐私有任何漏洞,那么每个人都可以理解这对于小米来说是一场灾难,所以小米的隐私控制是公司级别中最高的级别。就个人隐私而言,用户不想被人知道,就公司而言,他们自己的风险也很大。在大数据的使用和隐私之间的平衡中,我们的观点是,我们需要找到一个平衡点,这样用户就可以获得数据分析和人工智能对数据的好处,同时不损害对个人数据的保护。大数据的创新不能停止对隐私的担忧。如何实现这一点是今年5月刚刚发布的,这是欧盟的全球公共关系政策。这和小米公司做的隐私保护工作是一样的,所以我们投入了大量的人力来做。gdpr是为欧洲设计的,但我们已经逐渐将它引入中国。
去年,小米的隐私保护得到了业界的认可,在手机制造商中排名第一。小米在所有大数据领域的应用探索只有一个目的,那就是让每个人都享受科技带来的乐趣。谢谢大家!
工业控制系统正在开放。你想出如何采取安全预防措施了吗?
来源:搜狐微门户
标题:赵辉华:小米的亿级大数据应用
地址:http://www.shwmhw.com/shxw/49593.html