快速一键发布
手机号码*
验证码*
联系方式只用于平台与您联系,牛选时刻保障您的隐私安全
需求描述*
确认发布
取消

淘宝核心是个巨大的搜索 推荐引擎

湖畔大学三板斧   湖畔大学三板斧-曾鸣阅读:265赞:02017-09-05

表面上看到的淘宝是一个网站,但是它最最核心的其实是一个巨大的搜索和推荐引擎,让每一个人上来都能得到个性化的服务。

先给大家透露一个阿里的小秘密,大家可能经历过每年双十一的狂欢,过去的七年双十一的成交额都在创纪录,去年超过了1200亿人民币。但是大家可能不知道的是过去的七年,每年的双十一阿里巴巴的大部分人要做的事情却越来越少,甚至有越来越多的阿里同学会发现那天根本无事可做。

我们客服曾经是压力最大的部门,去年破天荒第一次不用加班。原因是什么呢?

因为在这一整天里客户该看到什么产品,他们挑选了什么产品,他们的收藏夹里选了什么产品,下次他们再登录淘宝该给他们推荐什么商品,这些过程完全都是由机器自动完成的。包括客服,去年80%的客户服务是通过机器人完成的,不再是人工服务。

其实不光是双十一,每一天大家表面上看到的淘宝是一个网站,但是它最最核心的其实是一个巨大的搜索和推荐引擎,让每一个人上来都能得到个性化的服务。

每天上亿人在淘宝挑商品、做买卖,这些个人化的服务如果都由人来完成,淘宝雇再多的人无济于事,这就是我们这个时代第二个最重要的特征,由机器取代人进行决策,提供服务。

越来越多的场景只有靠机器、靠人工智能才能完成以前靠人没有办法完成的海量服务和个性化的服务。

淘宝的核心推荐引擎就是人工智能的运用,它有很多种的复杂算法糅合在一起,每天进行海量数据的自动处理,它是一个庞大的机器集群,不仅仅是一批人,更重要的是有巨大的一个人工智能的支持才能完成大家今天体验到的这些服务。

这两年大家才开始听到大数据、人工智能这些热门的不能再热门的词,但实际上认真想一下,互联网最成功的这几家企业本质上都是基于人工智能和大数据。大家想想看谷歌在不到一秒的时间内你输入任何一个关键字,它就能把全网相关的信息推送给你,这完全是超出人的想象的一种服务,只有靠机器才能做到。

今天需要跟大家强调的最重要的一个概念就是未来商业会全面的智能化。

什么叫智能化呢?

未来商业的决策会越来越多的依赖于机器学习、依赖于人工智能,机器将取代人,在越来越多的商业决策上扮演非常重要的角色,它能取得的效果远远超过今天人工运作带来的效果。当然大家可能对于人工智能的发展未来有很多种不同的理解,因为这是一个相对来说比较创新的领域。

随着阿尔法狗在最古老的围棋上面打败了人类,人工智能的概念今天已经非常普及了,人工智能毫无疑问是未来最重要的一个趋势。当然对于人工智能未来的技术变化有很多种不同的观点和争论…

比如:人工智能到底能不能够在根本上取代人?挑战人的存在,甚至比那弱一点,人工智能多大程度上可以像人一样思考。因为在今天人工智能的技术核心其实是机器用笨办法去算,它的所谓学习是通过概率论的方法不断地去通过正反馈来优化它的结果,而不是像人一样去思考和学习。

这种机器学习的方法必须基于海量数据的校验,必须基于算法的一个不断反馈过程。所以,我把这个阶段人工智能带来的商业价值,它所实现的路径叫做数据智能。

因为到今天为止小孩是怎么学语文的,小孩是怎么学会算法的,这些东西我们都没有任何理解,更谈不到把这种理解变成机器可以去实现的智能。所以我们今天在看得见的未来,这也许是5年、也许是10年,甚至更长一点的时间内,我们讲到的人工智能都是机器智能,是机器基于海量数据能够快速迭代优化,做到比人更好的效果。

最近最典型的案例――谷歌翻译

传统上我们想用人的学习方法去做翻译,机器怎么都做不过人,但是过去十几年用所谓的深度学习方法,其实就是机器智能的方法。通过所有的人提供海量的数据,机器现在能够快速提高它的准确率,从几年前百分之四五十不到的准确率快速地提升到今天百分之九十几以上翻译的准确度,完全能够达到商用的水平。

所以谷歌翻译成了今年非常热门的一项服务,越来越多的基于这样机器智能的服务会成为我们生活中离不开的服务,它本质是用机器做到了人做不到的事情。

接下来你大概就想知道,这个看起来很高大上的叫做数据智能的东西,要怎样才能融入到具体的商业里面去呢?

简单来说要做三件事情:数据化、算法化和产品化。

第一个数据化――由于互联网的存在,由于广泛的连接,淘宝其实是能够准确地记录下来所有用户任何的在线行为。而这些数据本身可以用于优化你下一次来淘宝的体验,所以没有这个数据化的积累就没有后面的一切。

第二个算法化――算法这个词可能一般的人听了会懵了,其实讲算法之前先要讲一个概念叫建模型。

模型就是说你对一个人在这个场景下他会怎么决策,先要把他抽象成一个模型,然后这个模型怎么去优化他的决策,我们可能要找到一套数学的方法,让它能够收敛,让这个决策可以优化。

然后第三步才是把这个算法用计算机能够理解的程序写下来,所以大家一般讲的算法是指第三步,用代码写下来的一套回归的程序。

它前面有两个关键的概念:第一个是建立模型,第二个是这个模型要用某种数学方法解决,能够得到一个可以收敛的结果,然后第三步才是计算机的程序。

算法可能是这个时代创造巨大价值的一个新的概念,所以值得再跟大家展开讲一讲。

我们还是回到历史上最出名的一个算法叫做PageRank,这个算法支撑了谷歌这个5000亿美金公司的几步。

大家想想看我们一开始讲到的那个案例,你上网在一个搜索框输入一个关键字,全网的信息就能按照关联度推荐给你。

――你怎么组织全网的这个信息?怎么去理解相关性?把最相关的信息给你推送出来?

谷歌最早的创始人他在斯坦福读博士的时候就想到了一种模型,这个模型是根据网站跟网站之间的链接和指向来代表这个网站的相对重要性。然后他把所有网站的链接都记录下来,这就完成了数据化。

但更大的挑战是你怎么来算它的相关性?他就设计了一套算法,一套数学的公式,说这么算、那么算,这个相关性就是根据这个公式来推导的。

然后,第三步才是由于计算能力的大发展,我能够把全网的数据都通过这个数学公式来马上计算出一个结果。所以,你实际上输入的关键字通过了这个巨大的搜索引擎,它的核心就是这个算法,就能给你一个特定的结果,这个就是算法起的作用。

第三个产品化――算法要发生作用离不开这第三个关键的词,就是产品化,你一定要产品建立跟客户的直接连接。这个产品在我们刚才讲到的搜索案例,就是所谓的搜索结果页,一个搜索框加上你看到的那个搜索结果页。

搜索结果页这个产品建立了智能引擎和用户之间互动的桥梁,你的每一次点击,你看了这个搜索结果之后你是点了第一条还是第三条,还是甚至翻到了第五页。这个行为通过数据化的方式就告诉了这个机器智能的引擎说,你给我的结果相关性够不够高,智能化程度够不够高,机器再根据这个结果去优化它的算法,给你一个更好的结果。

机器比人不一样,它可以永远不知疲倦的24小时以秒级的速度在更新它的结果,所以它的进化速度非常非常快,可能从一个开始并不很精确的结果很快就能达到一个非常精确的结果。所以产品化是非常重要的一个环节,因为它提供了一个反馈闭环,而反馈闭环是任何学习的一个前提条件。

反馈闭环这个词用的稍微有点专业,但实际上大家都有非常深刻的切身体会,你无论学什么,比如:学打羽毛球,你动作对不对,一定要教练给你一个反馈,你改了以后是往正确的方向更对了,还是又纠偏偏得更错了,教练要再给你一次反馈。

实际上就是学习、修正、调整、反馈,不断的过程中你就能够学习、进步、提升,人是这么学习的,机器也是这么学习的。机器能够有智能的唯一原因,就是笨机器用笨方法写,但是因为它计算能力够,它的数据量足够大,它最后可以比人更快速地达到一个效果的优化。

所以,通过数据算法和反馈闭环,机器就能学习,机器就能进步,机器就能拥有智能,而一个商业就能够实现智能化的升维。

听到这里你可能会有点担心,说我是一个很传统的企业,你讲的那些算法我也不懂,海量的数据计算我也不懂,那么多数学的天才我到哪儿去找?

实际上对于大部分的传统企业来说你不用担心这些,就像云计算,现在亚马逊、微软、阿里巴巴都提供这样的服务,当作一个公共事业服务在提供。实际上算法谷歌也好、阿里巴巴也好都在把它变成一个公共服务在提供,所以将来你不用去担心算法、计算这些,这些都会成为智能时代的基础设施。

你要做的是什么呢?你怎么赶上这个智能化的浪潮?其实核心在于你能不能够创新的实现产品化。

这一讲的核心是――机器智能将推动绝大部分的商业快速智能化,这将决定大部分企业的未来生死。而实现机器智能的核心是创造性的把你的核心业务在线化,从而实现数据化、算法化和产品化的三位一体,让你的商业拥有数据智能这一核心引擎。

标签:

作者: 湖畔大学三板斧-曾鸣

来源: 湖畔大学三板斧

免责声明:本文仅代表作者本人之观点,电商头条网发表或转载此文只是出于传递更多信息之目的,其原创性以及文中陈述文字和内容未经电商头条网证实;电商头条网对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。如其他媒体、网站或个人从电商头条网下载使用,必须保留电商头条网注明的“稿件来源”,并自负版权等法律责任。电商头条网倡导尊重与保护知识产权。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至电商头条网客服邮箱;service#hotniu.cn(请将#改成@),我们将及时沟通与处理。
侵权投诉反馈邮箱:service#hotniu.cn(#改成@)

  • 今日头条
  • 本周头条
  • 本月头条