智行算法总监马江山在2023年中国饭店数字化运营专题会上的讲话
创建时间:2023-10-12
字号:【默认大超大】
编者按:2023年9月25日,“2023年中国饭店数字化运营专题会”在渭南建国饭店顺利召开。此次会议嘉宾覆盖了核心线上旅行服务商、互联网数据分析专家、饭店应用服务平台、饭店智能系统及设备服务商、饭店集团等全产业链主体,大家各抒己见,从不同角度深度研讨饭店数字化运营新风口、新思路、新探索,为推动行业的数字化转型提供前瞻洞见。现摘取智行算法总监马江山在本次专题会上的发言内容,具体如下:
智行算法总监马江山
一、关于大数据和AI
我本人从事大数据和机器学习人工智能领域。刚才张总提到了小红书上很多内容不是人写的,而我们实际上做了一些实质性的工作。因为我们谈论的无非是供给和需求,而需求来自于人。传统上,我们可能会通过发送短信或其他营销方式来满足需求。然而,在过去两年中,我们尝试了许多公域和私域运营方法。私域运营是通过微信号、企业微信等方式进行的,而公域运营则是指在小红书、抖音等平台上进行。在拥有了这些公域和私域流量之后,我们需要有效地进行运营并建立联系。过去,我们通常需要大量的客服或运营人员来满足C端客户的需求,但这种方式效率低下,而且服务水平参差不齐。后来,我们通过总结一些优秀的案例并将其沉淀下来,然后交给Chat GPT进行处理。我们会形成一些提示语并将其沉淀到案例库中。例如,我们会告诉Chat GPT,你现在是一个具有丰富酒店运营经验的公域或私域运营人员,你需要做的是什么。这样就形成了许多案例库,并且我们会建立相应的工具,让运营人员可以根据客户的咨询或微信群中的活动来调用相应的AI进行回复。这是私域运营上可以做的事情。至于公域运营,由于是在小红书上发布,而小红书本身带有风控机制,如果发布的内容明显倾向于广告,就会被定义为广告营销号,从而导致封号。为了解决内容同质化的问题,我们的运营人员面临很大的困难,就像写作文一样,给定一个主题,很可能写出来的都差不多。而AI,特别是像Chat GPT这样的大型语言模型,擅长处理语言,它可以在几分钟内写出差异化非常大且符合内容宣传的案例,我们可以将这些案例放到小红书上推广。我们还可以在案例中加入各种表情符号,我们也进行了很多人工测试,你真的看不出是机器写的还是人写的,同时还能保证内容的多样性,对抗公域风控也取得了很好的效果。
另外,传统的推送方式包括短信推送和各种APP推送,我们会对用户进行触达。触达后,数字化非常重要,如果是线下触达,很难进行跟踪。而线上触达,我们可以闭环跟踪,了解用户是谁,是否有点击、曝光或转化等行为。一旦链路数字化,AI就可以在其中发挥作用。传统的推送,因为我们除了酒店还做其他OTA业务,是通用的。除了酒店,还有火车票、机票等,这是用户出行的刚需。然而,有一个悖论,节假日给用户发送代金券是有成本的,他们可能会消费转化,但即使不发送,他们也有这个需求。AI在这方面的工作是找到真正因为触达或发送优惠券而转化的人群,而不关心那些不会购买的人群。通过算法,我们可以找到这部分敏感人群。我们经历了三个阶段,第一阶段是全量发送,不计成本。第二阶段是精准确认,一旦了解用户群体的特点,比如某些人在节假日喜欢出门,我们可以有针对性地投放给这部分人群,在有限的投放情况下实现高效投放。现在进入了第三阶段,原先是用户画像,现在是算法。AI的非线性特点使得我们可以将人群细分得更精。
二、关于AIGC
在AIGC方面,张总提到了如何赋能客服人员和研发人员。因为改进的核心在于衡量,管理学大师曾说过“不可衡量则不可改进”,而衡量的前提是数字化。我们知道,在进行问卷调查时,采样是一种常用的技术,但采样率会受到成本的限制,难以做到全量采样。大数据能够对用户进行全量采样,从而避免采样偏差,但需要通过数字化实现。线上化是数字化的一种途径,可以通过互联网或智慧商业等方式实现。智慧商场结合了AIOT技术和物联网技术,可以通过摄像头和视频技术对用户信息进行采集,将线下场景线上化。此外,数字化还可以通过简单的BI和数据分析得出改进的点。
在解决问题时,我们遵循从现象到假设到分析再到实验论证的过程。辛秘书长提出的问题可能没有确定的答案,因为每个人都有不同的观点。我们做数据算法时非常严谨,对所有现象背后都遵循从现象到假设到分析到验证的环节。对于酒店来说,线上线下的连接还不够,需要建立一个非常好的机制,将线上线下形成闭环,通过数据分析得出结论,给到大家指引。
在AI方面,每个人都具有对话的能力,但差距很大,这主要是由模型和知识两个方面决定的。不同的模型设计和不同的知识喂养会影响AI的智商。因此,我们需要不断地进行模型设计和知识喂养,以提高AI的能力。
三、关于GPT:
GPT全称中的一个词是“生成”,这是众所周知的,另一个词是“预训练模型”,它并不是一种无所不能的东西。在机器学习中,我们有一个概念叫做迁移学习,常说一个人能够举一反三,即使没有从事过某个行业,一个从事房地产行业的人也能够成为酒店行业的总裁,因为许多能力是可以迁移的,GPT具有很好的迁移能力。有了这个技术之后,我们认为GPT更多地应用在大型语言模型的基础上,关键是如何充分利用这个基础。此外,人与人之间的差距和思维方式的差异也是GPT目前发展的一个重点,这也是COT技术的一部分。对于单一的应用,GPT可以用于内容生成,包括生成图片、生成文字,甚至生成视频等等。对于计算机来说,这些都是向量表示的不同形式。第二个应用是知识问答,以前我们已经有了知识图谱的概念,但是由于建设整个知识库的成本较高,所以应用还不够普及。包括AIOT技术中的命名实体识别技术,虽然在很久以前就有,但由于成本高且需要大量标注,很少有机会进行实际应用,可能只有像谷歌和Facebook这样的头部公司才有机会进行相关工作。而GPT的出现大大降低了这个门槛,因为GPT本身已经通过大量的数据进行了训练,所以你可以直接向它提问,比如问它去哪里玩比较好。这时它就是在调用已经训练好的能力,从而降低了门槛。说到门槛降低,这也导致了许多传统的自然语言处理技术公司的消亡。第三个应用是意图识别,在这个领域的下游延展可以做很多事情。例如,之前我们通过人工查询一些数据系统,但当数据异常时仍需要进行人工排查。有了GPT技术之后,我们可以通过内部公众号以文本的方式替代查询,通过多轮对话技术识别查询需求、指标和维度,并建立相关关联,这实际上就是在进行意图识别。刚才也提到了是否会取代搜索引擎,搜索引擎列出了很多内容,无论是搜索引擎还是搜索广告推荐,核心都在于精准触达。现在的精准触达是如何实现的?我们经常听到一个词叫做“猜你喜欢”,谁能猜得准,老板身边往往有个了解他喜好的秘书。对于像GPT这样的工具来说,通过多轮对话可以获取你的精准喜好。以前可能会在屏幕上推荐多个选项,通过你与系统的交互,判断你真正喜欢什么。例如,如果你点击了第五个选项,可能与机票相关,那么系统会在整个出行方式中提高机票的权重,因为你的行为表明你对机票感兴趣。对于GPT这样的工具,通过多轮对话,你推荐一堆东西,我告诉你我更喜欢坐飞机。COT是一种能够拓展单个智能体能力的技术。一个人的思维方式往往会发生改变,但知识并没有变化,智商在短时间内也没有变化,变化的是思维方式。对于AI来说也是一样,对于一个单个的智能体,我们假设它是特定的模型,模型本身并没有变化,但你给它的提示词、行动指令以及整个链路,比如出去玩是一个任务,你可以将其分解。