去哪儿网算法技术总监董秋冶在中国饭店数字化运营专题会上的讲话

创建时间:2024-09-18         

字号:【默认超大

编者按:2024年8月28日,“2024年中国饭店数字化运营专题会”在苏州南园宾馆顺利召开。中国饭店数字化运营专题会由中国旅游饭店业协会与携程共同发起、主办,多年来始终保持旺盛的生命力、前沿的行业视角。当前正值全球经济复苏关键之时,也是以AI为代表的数字化技术蓬勃发展之际,更是中国文旅市场迎来新发展机遇的关键时刻。此次专题会聚焦中国饭店线上运营关键词,以“数字化发展如何助力行业降本增效,激发行业新质生产力”为核心议题,探讨、解决饭店行业数字化发展困境,为行业发展注入智力动能。以下是去哪儿网算法技术总监董秋冶在2024年中国饭店数字化运营专题会上的讲话:


董秋治.jpg

董秋冶 去哪儿网算法技术总监


各位领导,大家好!我是来自去哪儿网的董秋冶。坦白说,跟前几位领导一样,这也是我第一次参加饭店协会的这个会议,在两天的时间里,我深深感受到了主办方的用心与热情,会场还特意安排在来这个风景如画的南园,这一切都让人印象深刻。

去哪儿网自十多年前成立以来,一直在算法领域进行着不懈的探索与实践。近年来,随着大模型技术的兴起,我们的算法工作也从传统的模型算法在特定场景的定制化应用有所调整,增加了基于大模型的底层能力构建基础算法能力服务的重点。

在机票、酒店以及火车票等多个业务板块,去哪儿网作为传统的OTA平台都有相对深入的算法应用和智能化场景。此次我带来的分享将聚焦于售后服务提效、投放策略优化以及售前新场景的探索等方面,相信这些内容也会与酒店行业有所关联。希望通过今天的交流,我们能够共同探讨,共同进步。谢谢大家!

刚刚茶歇时,几位行业领导提出了不少痛点与挑战。原本我以为平台与酒店所面临的困境有所不同,但现在看来,许多问题我们同样面临。过去六年多的时间里,我在去哪儿网负责机票、酒店和火车票业务的过程中,确实遇到了一些与当前困境相似的场景,并找到了相应的解决方案,今天我想借此机会简单介绍一二。

在茶歇前的讨论中,提到了人群偏差的问题。我想分享一下我们在智能客服方面的经验,这与您所遇到的情境非常相似。当用户选择反馈时,往往是在遇到问题时才留言,这意味着那些满意度较高的酒店反而收不到反馈。这就导致“差评率”这样的指标无法准确反映一家酒店的实际状况。这种偏差虽然形式不同,但其逻辑是相通的,即反馈行为背后的动机导致了结果的偏差。

在这方面,平台拥有一定的优势。相较于单个酒店仅能获取到用户在其入住期间的数据,平台能够记录用户在多次出行中的行为轨迹。比如,用户不仅在预订酒店时留下足迹,在购买火车票或机票时也同样如此。这使得我们能够在更广泛的背景下评估用户的整体行为模式,从而判断其是否为高价值用户,以及他们是否可能正在流失。

具体来说,当我们掌握了用户的行前和行程规划数据后,就可以从多个角度进行分析。比如,如果一个高价值用户在过去的几次出行中一直选择某酒店集团,但在最近的计划中却转向了其他竞争对手,那么我们可以初步判断这位用户可能正趋于流失。对于这类平时极少反馈的高价值用户,我们会主动发起问卷调查或用户访谈,以期获得有价值的反馈。通常情况下,这类用户的反馈较为客观且具有建设性。

我们还采用了净推荐值NPS等模型来处理用户反馈。但在将数据输入模型之前,我们会根据自身业务的理解先行筛选人群,以区分不同的场景和群体。这样一来,即便是在前期阶段,也能在一定程度上缓解反馈偏差的问题。

实际上,在谈到偏差之前,您还提到了银发一族的差异化情况。这里我想分享一个个人观点,那就是如何在这种差异中找到平衡。我们默认银发一族相比年轻人对智能化工具的接受度较低。然而,撇开技术层面不谈,我们认为其根本原因在于,现有的智能化服务大多要求用户去适应技术模型,而非相反。这意味着无论年龄大小,用户都需要付出一定的学习成本来使用这些智能化工具,而且即便付出了努力,这些工具的效果也未必尽如人意。这是我们认为用户对智能化手段接受度存在差异甚至产生反感的主要原因。

鉴于此,大模型的出现为技术发展带来了新的希望。以ChatGPT为例,在它问世之前,每次算法模型更新后,都是由技术方推动落地,技术人员认为某个创新可靠之后,再设法将其转化为产品。而用户在实际体验后,发现这些产品确实提升了他们的使用体验。现在情况发生了变化,人们在考虑新技术时会问:“这项技术能帮我做什么?” 这是因为ChatGPT这样的大模型改变了用户需要适应技术的局面,转而让技术适应用户。尽管它目前提供的功能有限,但用户已经可以通过自然语言与其交互。

像前面提了一个例子,用户有阴阳怪气的情况,我们客服经常遇到这种情况,现在的大模型对于所谓的阴阳怪气已经能够识别出来了。

在这个前提下,您提到的如何加以平衡的问题,在普遍依赖人工管理加上智能化辅助的情况下,我们认为随着技术的发展,我们将考虑的将不是如何平衡。未来的趋势是不牺牲体验到替代,智能化手段的接受成本将低于人工操作。只有在那些智能化手段难以处理的场景中,才会退回到人工处理的逻辑上来。也就是说,将从目前的人工为主、智能化为辅,转变为智能化占据主导地位,而人工服务成为辅助的局面。

目前这一点可能还不太明显,但从前面经理的分享中,我们可以看出一些端倪。以南园为例,由于较早涉足智能化领域,我们积累了丰富的数据资源。正如您所言,在构建智能化平台时,从立项到功能实现需要经历一个漫长的周期,而随着模型的发展,这一过程也在不断演变。现在,各大厂商都在努力将大模型的基础能力应用于特定领域,关键在于如何高效地将行业数据输入模型,并使模型与行业相关的API实现充分联动。或许在半年或一年后,会出现一个适用于酒店行业的通用模型框架,只需输入过往几年的数据,就能根据需求达到相当高的服务水平。到那时,胜负的关键将不再是谁率先启动功能开发,而是谁能拥有更加丰富和详实的业务数据储备,从而占据先机。现在的问题是怎么做平衡?可能三年或者四年以后再开会的时候就变成了,大家都有这个能力,我怎么在智能化进一步跟其他厂商做差异化?

总体而言,我们对智能化手段及其发展方向持乐观态度。针对您之前提出的问题,现阶段的解决方法是通过一些前置处理手段。平台根据用户的行为,通过这些前置处理来辅助模型识别哪些数据是准确且重要的。随着时间的推移,这些前置处理逻辑将逐步融入到模型本身,使其具备更强的数据处理能力。

针对您提出的两个问题,我分享了我们目前的解决方案。不知道您还有没有其他相关的问题或需要进一步讨论的议题?

对于刚才的问题,我有一些想法想和大家分享。关于秘书长提到的问题,各位领导给出了一个解决方案,即在某些算法逻辑不够完善时,将决策权交给用户,让他们根据自身需求来决定。如果我们抽象来看这个方案,会发现用户实际上并不具备某些能力。首先,在面对好评和差评时,用户能够识别自己关心的信息,但他们无法判断评价者是否为水军或职业差评人;其次,他们也无法判断评价者是否属于同一客群,即评价者的关注点是否与自己一致。因此,将决策权完全交给用户可能并不能很好地解决当前的问题。

之前我们也提到过,酒店目前有一套评分体系。这套体系虽然经过提炼,但仍存在信息损失。我们设立评分的初衷是为了向不同用户提供差异化的、有针对性的评分。然而,一方面,从逻辑上讲,实现完全的个性化评分十分困难;另一方面,差异化评分或榜单也可能涉及合规问题。因此,行业内推出了多种差异化榜单,如评价榜、豪华榜等,以此来划分不同的用户群体。

例如,如果我是一位追求豪华体验的用户,我可能更愿意忽略普通评分,而去查看豪华榜中的评分体系。然而,即使有这样的榜单,仍存在二八定律的现象:豪华榜主要服务于高净值人群,可能只覆盖了这部分人群的70%至80%的需求。而对于您所提到的特殊情况,您恰好属于剩下的20%,那么当前的榜单可能仍然不能完美地满足您的需求。这时,一个直接的解决方案可能是进一步细分市场,比如在豪华之外设立超豪华,甚至超超豪华榜单,力求为不同用户群体提供更加个性化的选择。

从能力上来讲,针对极高净值这类的用户,虽然说数据很少,但是底层上来讲,我们是有能力做这件事的。就像您提过,可能这类的用户留痕的习惯可能很少,但是从平台本身,如果说有一些用户,当前在我们平台入住行为里面,所有均价可能都五六千以上,再少这类的用户也是有的。同时这类用户即使相对于其他用户留痕的习惯很少,但是这类优质的评价只能是少,但也不会是没有。所以说平台是有能力针对这极小一部分用户做一个针对他的不同的诉求,搞一个超豪华榜单,这个能力其实是具备的。

目前为什么没有?客观上来讲,就是平台整体业务诉求和目标跟酒店集团,我理解上来讲是有一些差异的。他可能没有这种动力去做特别分化的市场里面一个精细化的运营。可能后面想考虑的一个问题是,有没有什么办法或者说有没有什么由头能让平台和集团一起牵头,把这个特别小的高净值市场做起来,是后面可以考虑的一个情况。

就像前面说的,识别这个东西的能力是有的,目前为什么我们只是针对于所谓平价和豪华,做这种简单的差异化,有点类似于都是目标驱动现在的角色,反过头来,目前可以考虑一下,有什么新的方式把目前这个目标更倾向于定位在极高端人群上面,可能会更好一点。

这里有一条信息想与大家分享。刚才一直在讨论银发一族的情况,我们在实际工作中也遇到了类似的问题。过去,我们通过一些静态标签来识别特定年龄段的人群,并据此开展营销或搭售活动。然而,随着精细化运营的推进,我们发现需要根据不同场景来动态调整标签,因为即使是同一个人,在每次出行时的需求也可能各不相同。因此,我们开始将动态标签应用于每次出行的过程中。

即便如此,我们依然面临着一个挑战:即便确定了出行目的是旅游,但在具体提供差异化产品或服务时,仍难以真正满足这些人群的需求或给他们留下深刻的印象。

最近,我们在其他项目中的尝试为这一难题提供了新的思路。我们通过用户生成的内容(UGC),如帖子和与第三方合作制作的旅游攻略,利用大模型进行挖掘分析。结果发现,一个城市内可能存在着多种热门的主题旅游线路。以北京为例,大家普遍认同的线路包括研学游,如参观各个博物馆;适合家庭游玩的如鸟巢等地;还有历史文化爱好者钟爱的故宫之旅等。通过这种方法,我们发现了一些意想不到的主题,比如专为亲子设计的研学游,以及针对老年人的夕阳红旅游线路。此外,还发现了之前较少关注的活动,如在北京西山附近的骑行路线。通过实时挖掘分析,我们了解到不同季节和月份里哪些主题最为活跃。

基于这些信息,我们进一步加工处理了帖子中的景点信息,并将其与我们的数据库进行了关联。这样,我们就能够明确哪些酒店位于热门旅游主题的辐射范围内。例如,位于故宫附近的酒店可以知道自己主要服务的是哪些游客群体,但有时他们可能不清楚一些新兴的小众方向或突然流行的活动对自己的客群有何影响。该项目在一定程度上有助于发现新的主题和服务方向。

此前,我们与北京文旅相关的部门有过接触,他们也提到,如果能够通过这种方式实时发现不同客群的需求,不仅酒店集团可以据此作出相应调整,甚至可以在更大范围内组织相关主题活动。目前该项目尚处于启动阶段,但从实践效果来看,这无疑是一个值得深入探索和挖掘的方向。

2024年中国饭店数字化运营专题会0828.jpg