菜鸟网络算法专家朱礼君:物流优化问题在大数据时代被赋予新的意义​|CCF-GAIR2017【尊龙凯时·[中国]官方网站公司】

本文摘要:2017年7月7日至9日,全球人工智能与机器人峰会CCF-GAIR大会在深圳顺利举行。

2017年7月7日至9日,全球人工智能与机器人峰会CCF-GAIR大会在深圳顺利举行。本次由CCF中国计算机学会主办、与香港中文大学(深圳)主办。来自全球30多位顶级院士、近300家AI明星AI企业,齐聚智能科技产业盛会。

菜鸟网络高级算法专家朱礼君在CCF-GAIR 2017大会上公开发表了演说,主题是“大数据时代的物流优化问题”,主要介绍菜鸟网络当中的物流发展情况。朱礼君毕业于美国马里兰大学,取得物理学博士学位,先后就任于Goldman Sachs、亚马逊、Facebook等公司,于2014年回国重新加入阿里巴巴,领导菜鸟网络仓配上供应链的算法团队。以下是朱礼君演说速记全文整理,(公众号:)在不转变本意的基础上做到了精编:我来自菜鸟网络,我将共享大数据时代的物流优化问题,我们在做到物流优化的时候遇到了很多问题。

物流只不过是一个十分古老的行业,可以说道有上千年的历史,但是在这个大数据时代,我们找到很多传统的运筹学优化问题,在大数据时代被彰显了很多新的意义,我们在这方面做到了很多研究,遇到了很多有意思的问题,在运营的过程中也教给了很多的经验与大家展开共享。菜鸟网络是传统行业和物流行业的融合首先讲解一下菜鸟网络,菜鸟网络是一个物流平台,协同物流合作伙伴为消费者和商家获取物流服务,还包括租车、仓配上网络、跨境、末端网络,还有农村物流网络。值得一提的是这里面很多节点,像仓库以及仓储,最后一公里等,我们用的还是社会上的物流资源,是我们合作伙伴的资源,但是菜鸟网络在这里面不会起着全局优化的起到。

刚才说道到我们的一个特点就是传统行业和物流行业的融合,因为物流行业是一个十分传统的行业,但是我们是一家互联网公司,是一家数据公司,所以数据是核心,技术是核心,很多的传统物流优化的问题在互联网时代的确是被赋于了很多新的意义,而且在大数据和算法是这里面的核心。物流优化问题在大数据时代被彰显的新意义在大数据时代,我们的物流优化问题被赋于了哪些新的意义呢?经过我们的研究找到,首先我们对很多物流优化问题的计算出来性能拒绝相比之下小于以前,之前我们不过于介意优化计算资源的用于的,因为以前的优化是今天忘了明天再行用,现在是动态的,所以对算法有相当大的挑战。

另外,机器学习和人工智能被提及很高的高度,在物流领域以前用的是传统生物科技优化的理论和算法,在大数据时代,这两者必须获得更佳的有机融合。还有一点也是我们最近在研究的方向,就是怎么用机器学习的思想来解法传统物流优化问题,这也是在学术界上十分有挑战的一个新的方向,我们在这个过程中也有一些经验。物流算法应用于案例下面共享一下我们在菜鸟网络做到过的一些物流算法应用于的案例。第一个问题是供应链仓储仓储网络的优化问题,这是十分传统的问题,我们有一些客户在全国或者全世界有一个区域的产于,我们究竟要选哪些仓库布点,把货囤到哪些仓库,从供应商那里运往仓库,最后再行运往用户哪里,这里的核心是我们自由选择哪个仓库,每个仓库负责管理哪个区域的用户,这是传统的问题。

为什么我们指出在现在这个大数据时代有它的新的意义呢?在阿里的电商平台上,商家只不过都是负责管理自己的货,之前他不会用自己的仓储网络,我们不会对每个商家做到优化,比如说优化以后,有些货可以放在菜鸟仓库里,老大它仓储,它不会覆盖面积一些范围。荐个例子,深圳的一个商家以前有可能在深圳有仓库,北京的用户他就必须远程发货,但是菜鸟在北京有仓库,我们就可以引荐这个商家用我们的仓库寨在北京附近货。这里面必须考虑到的一些优化的目标十分多。

除了成本以外,还不会考虑到时效,次日约的体验对用户来说十分最重要,还有铺货成本,就就是指供应商运往仓库大约要多少钱,一般我们不会用混合规划的模型来解决问题这个问题,所以这里面拒绝十分慢,我们专门设计一些算法来解决问题这个问题,我们有成千上万的商家,对每个商家都要分开解法,这样用传统优化的算法不会有一定的局限性。当商家中选了我们的仓库之后,我们要告诉他他们怎么分仓,我在北京的仓库要放多少货,上海的仓库要放多少货,这个问题看起来非常简单,其实不然,就算我根据历史的数据,用机器学习的模型预测出北京的销量是多少,上海的销量是多少,这还是过于,因为机器学习的模型是有十分多的不确定性因素,它预测的未来销量不会有相当大的波动,我们也告诉尤其在中国的电商会有很多的广告宣传,这个波动不会显得更大,我们如何把这些波动考虑到进来,使得我们在一些不确认的环境下,都能确保我补货的量较为适合,会有缺货的情况经常出现,也会有供不应求的情况经常出现。所以要考虑到铺货的成本、仓储的成本,然后要考虑到周期性补货,究竟是一个星期一次,还是两个星期一次,还是一个月一次是线性规划。

最重要的一点是要考虑到销量的波动性,因为销量十分不平稳。然后整个补货量确认之后,我们创建这样一个模型,用鲁棒优化的算法来计算出来每个仓库大约要调补多少量,这个算法也是对每一件商品、每一个商家都是个性化计算出来的,所以这也是一个难题。在仓储领域,我们告诉在仓库里面,用户下了订单以后,仓库里面不会有仓库的工作人员,在仓库的货架回头一圈,把用户下的订单都捡过来,再行包发给用户。这里面十分最重要的问题就是任务怎么重复和路径怎么优化。

任务重复就是哪个订单应当为首给哪个人,路径优化是怎么为首给这个人,这两个问题是互相融合的,它是一个类似于车辆路径规划的问题。这里面的难题就是,尤其是像电商这样的平台,订单是大大印发的,我们必须告诉究竟在什么时候我要做到一个要求,哪些订单把它大爆发给一个工作人员,让他去货架上捡,所以这是一个必须动态做到决策的问题,它对计算出来性能的拒绝也十分低,因为仓库里的工作基本上是连轴转,中间会停车,因此必须很快计算出来出有下一个任务究竟要发给谁,然后订单也是大大印发,这是一个十分动态的问题,所以用一些传统的生物科技优化算法解法这种问题较为无以。箱型引荐问题在仓储领域还有一个较为有意思的问题,有可能大家不会实在这个问题看起来比较简单,其实不然,就是箱型引荐问题。比如说用户在这个网站上买了8件商品,一个用户卖8个东西或者10个东西,这是很长时间的,这些东西有它的长方形低、重量,我告诉我仓库里备的箱子的大小和它能顶盖多少,问题是在订单印发的那一刻,我要告诉这些商品要怎么二垒,然后放在哪个箱子里,或者仅次于的箱子也只想,我要放在哪几个箱子里,这个问题为什么这么最重要呢?如果能一个箱子装有下,它就是一个包覆,而如果我把它分为了两个包覆,它就不会必须两个包覆运输,减少了仓储的费用,而且这个箱子的包材也有浪费,所以这个算法可以充分发挥空间相当大。

这个问题在学术界是一个传统的三维装箱问题,这是一个十分无以的问题。它的约束是物品积累在一起的时候,它的长方形低无法低于那个箱子的长方形低,这是大家都能想起的约束条件。

一般的传统的作法是用构造性的算法解法,就是我去尝试各种有所不同的放置形式,或者有所不同的放置顺序,然后我们在这里面必须做到一些语言灵感算法,就是把一些启发式的算法统合一起,做到一些分层的算法设计。假设你有100个商品,一个简单的算法很有可能是算数不过来,因为我们必须很短的时间内把这个计算出来,在订单印发的过程中就计算出来,如果你没计算出来,后面就不会卡住,所以这个算法的挑战相当大。我们把这个问题解法完了以后,后来自己考虑到了一下,这里有一个很最重要的约束,就是商品积累在一起,它的长方形低无法低于这个箱子的长方形低,然后我们就自己问自己,这个约束是一定要的吗?其实不然。

因为我们可以根据历史的一些数据来新的分析一下每个仓库它究竟要怎么样打算它的箱子,这只不过是一个新问题,我们明确提出了一个新的问题,在历史上,传统的学术界没做到过,因为现在电商累积了这么多的商品数据、订单数据,我告诉每一个仓库发货的时候,用户讨厌把什么东西卖在一起,然后订单里面的那些构成的商品成分是什么,它们的长方形低是什么,有一个产于,那个产于我告诉,我的确可以从数据的角度反发售来拟合的箱子的形状是什么,然后我们就做到了这个事情,这也是一个十分有意思的问题,刚才说道到,假设我等价箱子长方形低以后,我要解法这个问题,只不过是一个十分无以的问题。在这里我们显然不需要用传统优化算法里面的欲梯度,用梯度上升的方法去做到,因为你显然算不出它的梯度是什么,所以我们做到了一些无梯度的算法。因为这个问题较为类似,它对这个箱子的长方形低没过于多约束,所以我们就可以做到一些无梯度的优化算法,把每个箱子的长方形低的参数空间做到一些重复,然后看最后总成本的函数大约是多大,然后不会均衡全局的搜寻和局部的搜寻,寻找一个拟合解法,这样做到对成本也是十分大的节约。

这里给我们一个救赎,在物流行业很多时候你把一个算法作好了十分好,但是你要寻找这里面你可以超越的约束有可能更加最重要。我们更进一步研究这个问题,因为传统的优化问题一般用的方法就是运筹学里的一些方法,比如说整数规划的问题,或者是一些启发式的算法。但是现在人工智能、深度自学、机器学习都是十分火的领域,的确有一些新的思想可以用在传统的问题里面。

像在机器翻译这个领域,以前我们用的都是一些传统的机器学习方法,后来有人明确提出来用深度神经网络的方法,用LSTM的网络结构做到机器翻译,后来也有一些学术上的言怎么把这种LSTM的网络结构用在解法TSP的问题,我们就尝试了把这种网络结构用来解箱型引荐的问题。这里面的目标是说道,我们要预测商品放进去的时候那个顺序究竟怎样,使得它最后的面积大于,这的确是我们要解决问题的问题。传统的优化的方法就是不时地去中举顺序究竟是怎么样的,然后寻找一个顺序。用机器学习或者深度自学的方法,我就必要预测出那个顺序,当然这里面不会牵涉到很多数据,我们不会用历史数据,这里输出的数据是物品的长方形低,输入的数据是它的顺序的数据,中间有一些模型跟机器翻译的模型网络结构十分像,当然我们做到的时候也是用它的历史数据训练,做到下来有5%的提高。

虽然这个生物科技优化还是较为古老的领域,但是在人工智能这个时代,机器学习和深度自学的算法的确可以用。车辆的路径规划问题在物流这个行业有一个十分最重要的问题是车辆的路径规划问题。这个问题的定义只不过非常简单,就是我们在地理上有一些必须去服务的点,要仓储的包覆,或者是必须揽收的货物,它在地理上产于在有所不同地方,我必须从一个总的中心为首几辆车,分别去揽收,或者分别去分送这些货物或者是包覆,这个问题反映在两个层面:第一,怎么派活,哪些点的服务要为首给哪辆车,用什么样的车。

第二,每辆车要怎么走,它的路径要怎么优化,这个跟仓库里面的捡货优化路径类似于,这众多类问题是车辆路径规划问题。它有很多变种,比如说CVRP,就是有的车受限轻。

还有VRPTW,就是它有一个时间窗的约束。还有VRPPD,你去一个地方拿东西,然后再行去另一个地方仓储。还有一些其他人组,所以问题只不过十分多,但是总的框架还是较为类似于,无非是说道我要为首一些车去一些服务点,然后每辆车怎么走,这个问题在数学上抽象化一起还算数较为明晰。传统的方法大约两类:第一,有一些准确的求解,这些算法一般在多达100个服务点的时候很难在优先的时间里面解出来;第二,传统的算法里面还有很多近似算法,像ALNS、VNS,这些都是流域搜寻的算法,还有基因算法。

现在的一些较为前沿的研究是如何把这些优化算法与深度自学的一些技巧牵头一起。我们自己研发了一个车辆路径规划十分强劲的引擎。

因为刚才提及这是物流行业经常出现的问题,我们从算法的层面来说,这里面最重要的一个点是用了机器学习里的一个思想。每一个我要优化的问题它不会有有所不同的约束,比如在农村,约束车的数量恒定,如果店内,可能会有时间窗,所以每一类问题的约束还是多种多样的,我要是分开做到一个算法就让,但是我要算法适应环境各种有所不同的约束,就十分无以。而且我们告诉机器学习、增强自学里面不会有一些自适应的方法,我们不会根据这个问题的类似的结构辨识出来我究竟要怎么解决问题这个问题,这里我们用的是较为传统的Bandit Learning思想,各种问题不会有一些有所不同的求解,有一些算子,我会试一下,想到两两互相交换、三三互相交换,能无法把这个解法做到得更佳,把一些解做一个转换,想到能无法做到得更佳。有所不同的问题,有所不同的策略不会使它更加慢的收揽,所以我们会去中举,比如说这次好,下次不会再试一下其他方式,比如说两两互相交换很差,我可以试一下三三互相交换,这样算下来,每个个体不会寻找特定的算子,究竟什么样的算子、算法拟合。

我们的应用于案例也很多,像一些生鲜仓储的应用于、农村淘宝、城市门店仓储、仓库挑选路径优化。应用于的场景很多,同一个算法引擎可以中用很多场景中,原因就是因为它有自适应的自学过程。大数据智能分单下面共享我们做到的大数据智能分单。

传统物流的情况是说道我们必须把包覆收上来以后,按照全国的流向去分,比如说我会按北京、上海、广州流向去分,以前是人在分的,如下图,有一个人在看租车地址,然后把它放在对应的口,全国有可能有200多个口,人工服务公司一起很难。未来我们认同期望做自动化,自动化较为最重要的一个点就是数据化,首先我们必须把这个地址数据化,然后把它编码。

以前是人工会写出一个码,我会看这个地址。现在菜鸟电子面单,在商家发货的时候,不会写出上对应的码,操作员只必须看这个码就行了,十分便利,因为辨识一个字节比辨识一个手写的地址更加非常简单。一个地址应当去哪个站点仓储呢?快递公司有多规则去分,比如说深圳福田区的一个网点它究竟要服务哪一个区域,它有一些很简单的规则,这些规则你很难把它数字化,我们用了一个什么样的方法呢?我们用的是大规模机器学习方法,我不告诉你的规则什么样,也不必须叙述,我把它挖过来,这是机器学习的非常简单的应用于,原本你是怎么自学的我不告诉,我只要有历史数据,我就可以通过机器学习的挖出把它利用出来。

这里面不会中用一些分词、地理围栏的特征,还有规则的特征,我们用大数据的模型自学,最后把订单都分出它对应的点。据理解,中国有很多物流提供商、很多快递公司,也有很多仓储公司都有各自的好坏,每个公司在各自的区域优势不一样。如上图,左边公司和右边公司,它的仓储的时间有差距,可以看到比如说在北方,右边那个公司就没左边这个公司好。

一个商家要发货的时候,它对每一条线路都要做到一个自由选择,比如说商家如果在杭州,杭州到上海必须谁来放,杭州到广州、北京、武汉分别用谁来放,下面又有很多的仓储公司,这是一个人组优化的问题,我怎么样对每一条线路,用什么样的用料分配我的订单最后线性规划,这个事情用人做到十分无以,而且非常简单蛮横,他会粗到每条线路怎么分,但是转交算法来做到,就不会很细致。我们做到了一个引擎,考虑到时效、服务、成本等等,把所有的因子考核到一起,欲一个拟合的分配方案,然后自动地为这个商家获取一个智能发货的解决方案。我刚才提及很多算法,我们是一家互联网公司,以技术为核心,我们期望通过统合社会化物流,提高整个中国的物流水平。累积下来的技术,期望需要对外开放,给整个社会上的物流公司用于,需要提高整个中国社会的物流水平。

如路径规划的算法的引擎,我们早已在跟多个合作伙伴接入,刚才提及的箱型引荐的算法早已对外开放出来了,还有地址库,地址怎么分类,地址的单体的服务,标准化的服务,还有不能分单的算法,对每个仓储公司怎么去分他的订单,这些算法我们都对外开放,获取给所有物流合作伙伴。以该方式来提高整个中国物流的效率。未来发展方向从技术的方面来讲,我们实在未来的发展方向是这样的:第一点就是指Model-driven的方法到Data-driven的方法。

刚才说道到传统的物流优化一般用的是生物科技优化的模型,生物科技优化一般不会有一个目标函数,比如成本,然后我有约束,比如当日约订单比例是多少,这个仓库订单无法多达多少,这辆车装的东西无法多达多少,这些约束列好以后,必须把它解法,这是一个以模型为中心解决问题的方法。但是在互联网时代累积了十分多的数据问题。一类问题有可能我们解法了很多,它们有一点不一样,但是有很多地方是一样的,比如说农村仓储,我每天要仓储的村点只不过会逆,但是它的量会变,所以我昨天解法的路径规划和今天解法的路径规划应当是有相当大的关联,而传统的模型驱动的方法,我把这个关联性就毁掉了,我昨天的解法没用。我解法了某种程度的一类问题几次以后,我应当是可以总结概括出有一些方法,为明天解法某种程度的问题或者类似于的问题不会有协助,这是使用Data-driven的方法解决问题。

我们也用一些深度自学或者是机器学习的方法做到这方面的研究,这的确是一个十分让人兴奋得方向,它的确是把传统的领域流经了一些新的活力。第二类是算法一定要产品化。算法做到得再行浅,不考虑到各种各样的边角料的情况认同敢,尤其是物流行业,我要应用于到实操有很多环节必须大大地抛光。

就像刚才提及的路径规划的算法,在运营过程中获得十分多的对系统,那些对系统我们又不会加回去。我们把算法平台化,会为分开一个问题解法一个算法,因为问题实在太多,分开为每个问题建模,在可扩展性上不会遇上相当大问题。刚才也提及大部分的算法早已对外开放,所以未来也不会之后在这方面希望把我们的算法能力,把我们人工智能方面的能力对外开放,提高物流行业的智能化。

原创文章,予以许可禁令刊登。下文闻刊登须知。


本文关键词:尊龙凯时·[中国]官方网站公司

本文来源:尊龙凯时·[中国]官方网站公司-www.jjsy8.com