对话百度肖阳:生成式大模型,搜索最重要的一块拼图

作者:休闲 来源:百科 浏览: 【】 发布时间:2024-03-29 07:12:41 评论数:
对话 | 张鹏

编辑 | 连冉、对话的块郑玄

大模型的百度出现,让「搜索」正在迎来一场从技术底层开启的肖阳超时空同名变革。

国外谷歌、生成式大搜索微软已经有了动作,模型国内百度也早已开始行动。最重今年三月推出文心一言以来,拼图百度已经围绕搜索产品进行了多次升级,对话的块包括推出拥有多轮交互能力的百度 AI 伙伴;推出文心一言插件平台「灵境矩阵」;发布被 AI 重构的新产品「简单搜索」等。

在 2023 百度世界大会上,肖阳百度搜索完成了进一步的生成式大搜索升级。李彦宏现场宣布,模型升级后的最重百度搜索将拥有「极致满足」的生成能力——在搜索框里输入问题,搜索可以不再是拼图给出链接,而是对话的块直接生成一个最好的答案。此外,百度搜索还将增加帮助用户更好表达的「多轮交互」能力,和更能满足用户内容需求的「推荐激发」功能。

互联网世界如何变化,「搜索」都是用户刚需。其本质是,用户永远有主动对世界探索的需求。

而过去影响「搜索」的一个关键问题是「交付」——用户不太会搜,或者搜完了不精准、不全面,需要反复输入或打开链接才能得到答案。

这些问题由很多因素导致,一部分是商业模式,但关键还在于搜索引擎自身的技术原理——过去的「搜索」不是用户问搜索引擎,就给出一个答案,而是用户问完,它给出一串最有可能包含答案的「链接」。这些链接可能是网页、百科、文章或者短视频,需要用户一个个打开,然后判断有没有解答自己的问题。

而大模型和生成式 AI,至少会从三个层面改变「搜索」的逻辑:更精准地理解用户的提问并给到回复,在更懂用户的基础上推荐更多更合适的内容,以及给用户更多机会表达——这三个层面,也分别对应「新搜索」所强调的,极致满足、推荐激发和多轮交互。

这个逻辑本身不难推演,但要落地却面临很多现实问题。大模型的技术能力是否达到要求,新的搜索产品如何定义,是否需要构建一个新的商业模式来支撑,以及如何规划一个清晰的路线图,实现到「新搜索」的过渡。

带着这些问题,百度世界大会期间,极客公园创始人张鹏和百度集团副总裁、搜索平台负责人肖阳进行了近两个小时的交流。他们共同追溯了百度搜索演变的历史,分析了大模型如何改变搜索体系,并探讨了大模型时代搜索的未来。

以下是对话全文。

01 搜索的持续进化

极客公园:百度内部是怎么定义所谓的搜索层面的变革或者说重构?

肖阳:搜索内部这几年都在发生巨大的重构,我们的系统每两三年也要重构一次。技术的浪潮,有些是看得见的,更多是看不见的,ChatGPT 这次是公众能看得见的浪潮,因为它和自然语言的关联很紧密,所以人们能理解这次变革意味着什么。

但是过去也都有这种大的技术变革不断发生,我们的系统也在发生相关变化。回顾起来,百度搜索历史上有好几次都是属于重构性质的,比如框计算,深度语义匹配,深度问答……

随着技术的发展日新月异,我们肯定会很频繁地继续做这种深度重构。最近四、五年,超时空同名每一年我都感觉搜索在做一个彻底的变革,而且速度越来越快,这会是一个永远持续不断的过程。

极客公园:3 月份文心大模型发布之后,搜索经历了什么样的变化过程?大模型对搜索这个体系是怎么产生影响的?

肖阳:实际上我们在 ChatGPT 发布之后,立刻就将生成式技术融合进搜索了。

在这个过程中,百度一直想聚焦的一件事就是让用户更自然地表达需求,一个是更精准,一个是更好消费。历史上几次代际变革也是朝这个方向走。

2009 年 Robin(注:李彦宏,下同)提出的框计算其实就是这个概念。那个时候,阿拉丁是 Robin 在全球最先提出来的概念,现在我们的阿拉丁覆盖面,做得精细程度和投入的资源,都比包括谷歌在内的其他搜索引擎更好。

还有我们做的语义检索、语义匹配。之前的对称匹配技术,需要答案中带有跟问题相同的关键字才能识别。2019 年 Transformer 成熟了以后,它能突破非对称语义匹配的技术瓶颈。很多答案只要是在回答问题,都能很好识别。我们很早就判断出这个技术,能给搜索带来很大提升,在这方面大规模应用是最早、最深、最广的。

极客公园:你们是怎么用大模型来解决「非对称匹配」的问题?

肖阳:我们对搜索的要求是给到用户精准性很高的回答,精准的同时还要丰富。

总之,用户所需要的信息,最好是很精准的回答,同时也不要再说任何用户不关心的问题,这样对用户的效率是最高的,这是我们「极致满足」一直在做的。

另一方面,搜索的阿拉丁有数千张卡片。这里面接的各种数据都非常丰富,非常复杂。然而用户在匹配阿拉丁的时候,需求是非常个性化的,有的人要看未来 15 天的天气预报,有的人要看穿衣指数,有的人要看雾霾。

我们就在想技术上能不能做到个性化的组装,个性化的回答。说实话,我们在技术上一直在努力,但总觉得缺那么一点,也就是需要对知识内容进行理解,甚至有推理的需求。以前,我们在推理能力上是不足的,在数据匹配、产品样式还有传统意义上的语义向量模型,储存学习模型上做了很多事,但总觉得拼图里缺少一块。

看到大模型,我们觉得,这就是搜索整个拼图里最重要的一块。它的记忆、推理、逻辑理解、内容生成能力,能让我们把之前想在技术上做到的东西串起来。

说实话一开始想得很简单,觉得我们的精准问答还有创作类的需求,应该立刻就能产生效果。但实际评估才发现,只用这个模型效果是很差的。它要应用于整个搜索,还要克服很多困难,包括算力,和搜索技术的融合等等。但是我们依旧很兴奋,很快就拿出方案去尝试。

极客公园:你觉得 Robin 在做大模型技术核心方向判断的时候,脑子里是不是也因为过去搜索里的很多场景,很多问题,他在大模型上能看到答案,所以成为了最早对这件事下决心的人。

肖阳:我觉得这两件事本质上是一件事,就是能让用户表达得更多。

搜索框的出现,是一个很深刻的变化,让用户终于可以对机器去提需求。以前用户提需求是通过点击滑动的方式,搜索框让用户第一次用语言去提问。

现在看来,这个交互形态(搜索框)非常简单,但背后的技术有代际提升意义。一是深刻地改变了用户找内容的方式,还改变了内容生产的方式。再加上百度找到了一个很好的商业模式,让网站也能赚到钱,所以整个内容供给生态就发生了深刻变化。

ChatGPT 出来以后,我们一看这个就是搜索要往前走的方向。它确实能够很快速地把搜索原来 20 年的积累串在一起,并且点石成金,取得很好的效果。

02 搜索未来会不会是 Agent

极客公园:今天百度再去干搜索,它的本质还是连接,还是会变成别的东西?

肖阳:搜索的理念早就不是连接了。百度以前强调服务的闭环,强调怎么样能够实现端到端的满足。用户只是给搜索框提了一个需求,我们就在考虑怎么样能使用户满意。这实际是一个用户提出需求,机器如何把它对齐的过程。所有的产品都在往这个方向上走——机器如何 follow 人的需求。

极客公园:有没有可能搜索未来就是一个 Agent?

肖阳:将来的重点一定是 AGI 在场景上的深度应用。光提 AGI 是没有用的,就像我们通过九年义务教育,也还是得接着进行业,得成为一个律师,成为一个科学家,成为一个互联网大佬,在场景里打透才行。所以它一定是一个 AGI 加上后面的一堆 Agent。

搜索被大模型赋能,但我们需要让它更精准,更符合 AGI 带来的机会。AGI 在这个场景里深度应用,就会把我们过去这 20 多年的技术积累全都串起来,而且还会打开新的场景。

极客公园:新的场景是什么?

肖阳:Robin 这次提搜索的代际变革是三部分,极致满足,推荐激发和多轮交互。它不一定和大模型本身直接相关。极致满足的目的是什么,是营造一种信任感。也就是让用户对 APP 信任,对这个场景有认知和定位,愿意在这上面花更多的时间。这里的意思,不光是高效地满足用户的需求,还要能互动,让用户说出需求并得到满足。

同时,百度的 DAU 应该比其他 APP 的 DAU 更有价值。因为其他很多 APP 都是滑动、点击,而用户来百度至少需要输入一个内容,表达一个需求,而且大家是长年累月地表达。所以,我们如果有大模型,就能够更有内容,也更有可能做到推荐系统或激发系统的代际变革。

五六年来,推荐的场景没有什么太大的突破,大家已经习惯了。但百度的用户行为和我们对内容的理解,有可能让我们在满足用户需求的同时,更好地去推荐内容。从这个维度,用户场景的拓展是有可能的。原来我们做 Feed 的时候是拼接逻辑,也就是搜索框底下是 Feed。这种方式我们深耕了几年,把时长提升了好几倍。

再进一步,如果我们在场景上能够更懂用户,更懂内容,做更多的匹配和激发,这个过程中用户对场景就会更信任,时长会再有数倍的提高。

还有,这里的商业价值非常大。比如我们现在看到很多用户的转化,商家的转化,中间都是断层的。比如过去商家和用户聊两句就得要电话,中间还有各种优胜劣汰的机制,我们也没法很好地去 build。但在这个商业模式下,如果你对平台很信任,整个转化就能提高 10 倍。

这样的话,我们到底是一个 Agent,还是一个回答问题的机器,还是一个助手,这些都不重要了。最重要的是,这个场景能不能让用户在我们这里获得很好的消费满足。

极客公园:但这个场景百度、谷歌可以做,ChatGPT 或者其他原生 Agent 也在做。

肖阳:所有的产品都有一个边界,如果太宽泛,没有具体场景,大众接受起来也有难度。但我觉得像搜索这样的场景,用户在解决问题的同时,还会有一些需求在这里获得满足。

对比之下,ChatGPT 发展到一定程度会有一个瓶颈,就是它把自己定义得太广泛了。如果它只是一个对话工具,那么用户对话了之后到底想获得什么?是获得情感的陪伴,获得娱乐,还是解决问题,还是编辑、办公?总该有一个边界。其实这也和人类似,要是一个人说自己什么都会,又是美术家又是科学家,可能别人反而不敢跟你聊了。

03「任何时候都不要抑制用户的表达」

极客公园:在下一个阶段里,搜索和人的关系是不是又会面临改变?

肖阳:对,搜索原来能帮助用户一部分,现在基于信任能够始终努力地帮助用户。一个是能做到更了解,一个是能解决更多问题。同时,基于信任的推荐能让用户的生活更好,所以用户就会在搜索上花更多时间。

其中的一个关键是,一直让用户表达。我有一次和 Robin 开会,他说「任何时候都不要抑制用户的表达」,这是一条金律,是他的最高信条。我们做了很多动作,绝大部分都是想方设法降低用户的表达门槛。

用户怎么能够表达?一个是信任,一个是表达了真的有用。另外他表达后你要有反馈,要能更懂他才行,信任就是这么建立起来的。你表达得更多,我们解决得更多,信任就越来越多。

而且,信任是真正的门槛。以前的搜索是没有门槛的,用户的迁移成本很低。我们的效果一旦高过别人 10%,就有马太效应了。但只要是犯错误了或者是绕弯子,做的效果不如别人了,甚至跟别人持平,用户时长也会下降。

极客公园:过去可能用户的表达里面,有的一些是不准确的。那么今天去看,搜索没有对用户抓取,反而对接下来赢得用户的信任是非常重要的?

肖阳:搜索是一个老实孩子,可能没有在推荐引擎的层面上赶上那一波最潮的东西,但老实孩子是有意义的,因为它对用户是公平的。

用户会在百度搜索 AI 伙伴里,进行很多轮的交流,询问生活中方方面面的问题,就真的像跟一个伙伴聊天一样。为什么他们能聊起来,就是因为建立了信任和理解。

要重新从 0 到 1 构建这样的信任,不基于搜索也是很难的。从回答来看,因为技术还在发展,有的时候也不尽如人意,有的时候前后逻辑矛盾,但用户对此是有宽容性的。很多用户的反馈都是,支持你们,你们一定得做好。这就是因为信任叠加了交互,用户更加信任搜索。

极客公园:说到要得到用户的信任,生成搜索结果肯定要准确才行,所以大模型的幻觉问题,我们解决得怎么样了?

肖阳:我觉得这个问题确实有技术难度。首先,我们技术上尝试了很多创新,比如在溯源的可信度上、在大模型自己的边界上,和一些数据任务的设计、模型训练上都有努力。

但幻觉是个世界难题,我们不能说 100% 解决。搜索一直都是这个理念,能解决大部分或者更多的问题就可以。我们不追求 100% 地解决问题,因为这是一个伪命题,不可能 100% 解决。

搜索依托自己优势做的事情包括,第一,过往不管是通过框计算还是阿拉丁,我们连接了非常多合作伙伴的权威数据。这些本身足够可信,足够权威的数据,在一定程度上能解决特定领域下的一些幻觉问题。第二,我们的插件生态,也有一部分数据型的插件。这些专业、权威领域的数据型插件,也会帮大模型更好地在金融、法律、医疗、教育等垂直领域获取到足够优质的信息。在这个前提下,幻觉问题一定程度上是可以规避的。

其次,衡量大盘的效果一定要知道什么是主要问题,什么是次要问题。我觉得至少现在生成式技术重构后的搜索,在解决问题的方面比原来的搜索提升了很多效率。

所以,幻觉问题我们可能解决一部分,但是我们更多致力于让幻觉问题不要对自己造成问题。

极客公园:为什么会觉得多轮交互对下一代搜索引擎有更大价值?

肖阳:比如,如果一个养仓鼠的用户一天问了 70 多轮仓鼠相关的问题。他可能是搜索的初学者,所以需要不断换 query。但是换 query 的本质是,用户觉得你不理解他。

以前的搜索是单轮(对话)基础上的多轮(对话),是阶段性的,需要用户自己把回答组合起来,但现在可以用生成式模型直接串起来。

还有跨模态。百度很早就做视觉搜索,但之前没有主动问用户的能力。现在可以跨模态了,图片可以识别成语义或者向量,用户能对图片发问,这么一来用户的表达门槛就降低了。

有些用户拍一张图,我们就能知道他的需求,但拍完以后他的需求更多,认为要对这张图要澄清,做提问,要根据这张图获取更多的信息。从这个角度来说,我们又有新的难题要解决,但这个是很必要的。去年我就说这是双向奔赴,构建飞轮的过程。我们解决了一些问题以后,用户就会有更多更难的问题,然而我们接着又解决了,最后构建了这种飞轮。

比如,在 AI 对话里用户可以发一张电路图,问开关开的时候是什么表现,A 灯泡亮不亮,B 灯泡亮不亮,以前这种问题没法搜索,但现在你可以搜了,还可以多轮交互。

极客公园:你们其实是通过多轮交互能力的加持,在降低对人的自然语言能力要求。一方面AI要提升,但是用户的出发点用户的需求,你是控制不了的,只能去适应,所以多轮交互某种程度感觉是对这个的一种适应?

肖阳:在大语言模型这次突破之前,我们就试图让用户更自然地表达,我们在这方面是有追求的。不过这里面稍微有一些差异,比如我那天听说,现在大家还要挖空心思去看什么样的 prompt,能够挖掘出大模型什么样的能力,这个其实是反人类的。人为什么要去适应大模型的需求?这样的 prompt 其实就不是自然语言,而是伪代码。

我们做了几十年搜索,就是想把自然语言转换成机器知道的东西,让机器输出能够让人自然理解的东西。现在有了大语言模型,我们能把这件事做得更好。

ChatGPT 发布之前,GPT4 已经训练出来了,但用了不少时间做 Alignment(对齐),内部的反馈是说 Alignment 以后大模型的能力其实是降低了,因为跟人要对齐。但是对齐到什么程度?这个其实不是光靠大语言模型自己能解决的,是需要靠周边的各种智能系统一起解决。而这个就是百度擅长的地方,反过来看 OpenAI,它没有搜索基础。

极客公园:这个观点特别新锐。所以,Alignment 是要让大模型自己限制自己的智商、表达能力和创造力去适配人,还是我们保留了它的一些东西但给它加框架,加一些能力,让它再去形成表达?

肖阳:开始的时候我们觉得要有一个很好的生成式技术,但后来发现虽然生成式技术不断在发展,但我们的工作是做更好的搜索。原来搜索是给人看的,现在是给大模型看的,这两个任务是有差异的。给大模型看,我们能做更多的释放。也就是我们能把原来想做的事更高效地完成,然后大模型再给人去做 Alignment。搜索本身拥有连接的能力,解决问题的能力,经过这么多年的演化已经成为一个强壮的身体。这个时候加一个大脑,它可以在很多层面帮用户解决问题。

极客公园:这就变成了两者的一个组合,就是脑和身体的组合,最后完成更好的动作和交付。

肖阳:用多轮交互降低人自然语言表达的难度,然后再加多模态,本质已经超越了自然语言。

搜索其实是最早用自然语言和机器做交互的起点,今天不断地在降低人用自然语言的难度。甚至,它的终点都不是自然语言,而是你只要给它任何东西,搜索就能够通过多轮交流加多模态能力,更好地服务你,建立更强的信任。

如果信任是终极目标,这几个技术栈都非常关键,这个拼图也就越拼越紧。OpenAI 有一个很好的大脑。它的大脑不断地在发展,但这不够,它还要放开手脚。搜索和大脑,现在看起来可能是两个场景,但将来越来越会是一件事,就像是有手有脚加上大脑,才是一个完整的人。整个智能系统完成的动作,会远超出大家的想像。

多模态,目前在工业界实践上,技术往往还是转化成文字去解决的。但现在跨模态大模型也在训练,这个技术突破也就是这几年的事。人的决策信息 80% 的输入来自于非语言的信号,现在抖音视频推荐,也是利用视频中的文本信号,比如 OCR 、ASR,通过字幕、声音识别文字,或者周边的文本信号去推荐的。而对视频本身的理解,图片本身的理解还在完善的过程中。一旦大模型在这点上有突破的话,又是一个代际变革。

04 新搜索的商业价值,会十倍、百倍提升

极客公园:灵境矩阵是咱们现在在主推的一块业务。它的目标是什么?对百度搜索意味着什么?

肖阳:灵境矩阵的定位不是搜索的插件平台,是文心大模型的插件平台。我们一开始讨论它的目标的时候,就定位成要让文心大模型更有价值,能解决更多问题。所以从这个角度来说,我们是在为文心大模型安手和脚,而搜索是一个躯体。

这样,大模型这个大脑才能适应各个行业的发展。大模型像是一个头脑很成熟但还没有入行的一个人,它把九年制义务教育都念完了,后面要考虑的就是怎么拿着各种工具,用各种知识,穿着各种工服,进各种公司去解决产品上的问题。

为什么是搜索来承接这个功能?因为搜索最有场景,搜索也已经有很成熟的商业模式。我们只需要把这些商业模式拓展,它就能回馈文心,基本是这样的过程。

这个过程说白了,就是让这个平台更好用,让文心大模型更符合国内开发者的需求。当然最重要的是把商业模式打通,解决开发者为什么要给文心大模型做插件的问题。

极客公园:所以其实是靠搜索来解决插件的商业模式问题吗?

肖阳:初期是这样的,因为搜索更闭环,这是我们的优势。

搜索相当于是一个 MBT(基于模型的测试),先让它转起来,让各个场景都有一个比较成熟的模式,这样的话我们所要做的就是继续扩展,继续探索怎么样能让大模型更有价值。

极客公园:现在灵境矩阵,本质上是不是可以理解为它成为了百度小程序?未来要拉更多开发者到这个生态里,并且建立一套新的利益分配机制?

肖阳:我觉得它能比小程序做得更多,因为大模型能力更强。而且插件里有一个数据飞轮概念,小程序还是功能和容器,那个时代的数据飞轮不像现在大语言模型时代这么重要。

好的应用场景,都需要一个非常强的数据飞轮。比如 Midjourney 一下子给你四张图,对它来讲,给你一张图,成本最低,给你四张图,就是为了获得更多反馈,让它越来越好。所以我们发现,这些开发者越先接入,在场景里面越先应用好,数据飞轮就可以和文心大模型贯穿,这样大模型也会越来越好,开发者自己的插件也会越来越好,飞轮会越转越健康。

极客公园:公司内部对于这样的一个技术和产品的架构,是有一个明确的规划还是边走边看?

肖阳:有明确的规划。最近也有人在争论需不需要有行业模型,比如金融行业做一个模型,这个模型要做私有化部署,同时规模要被控制。

这里面存在悖论。目前业界普遍认为 600 亿以上的参数才能有智能涌现,才能更好地去接入这个行业,否则你解决的问题也许是以前的模型就能解决掉的。

最近有公司说,我处理一个发票,处理一个合同,也用大模型,但一个发票两毛钱太贵了。我们五年前处理发票就是大模型了,两毛钱足够我们处理一大批发票了。所以我觉得大语言模型去解决问题一定要建立在智能涌现、建立在新的 AGI 的基础上。它一定是一个插件,能让一个人拿着工具去解决问题。

极客公园:如果我们顺着这个角度去谈,能感觉到百度搜索未来的整个商业模式,是不是也会面临变化?

肖阳:这个商业模式肯定会发生很大的变化,但不意味着颠覆。第一个变化是用户付费,这肯定是在大模型把信息变得更透明、把用户理解更透彻了以后的商业模式。这样的话,用户就会为更有价值的服务、更有价值的内容付费,这才是更本质的商业模式。

极客公园:不是为工具付费,是为服务付费。

肖阳:对,为服务付费一方面有利于建立用户的信任感,另一方面它是一个更好的、端到端的、优胜劣汰的方式。服务到底好不好,别老投广告,拉出来是骡子是马溜一溜,看有没有人愿意付费。而且我觉得对于百度这样一个平台,是信息越对称越挣钱,过去广告系统的演进也已经证明了这一点。

信息越来越透明,越来越按效果付费,那么平台的效率一定是高的。信息不对称,对于大平台来说是消耗资源的。让信息彻底对称,对百度这样的平台来说是一个机会,这样一来用户价值也高了,商业价值也高了,没有人再因此受害了,所有人都得益于这个模式。

第二个变化,我觉得原有的广告模式,也会因此有很大的提升空间。以前所谓的广告匹配就像检索一样,现在在生成式技术的加持下,可以实现端到端的改造,整个转换可以有大幅度提升。

还有 B 端也可以付费,比如我们给 B 端做 bot 、做品牌数字人,看到 B 端的付费意愿也很强。B 端过去缺一个跟用户直接沟通的载体,那么大语言模型可以加持这部分。我们的数字人技术也积累了很多年,很成熟,这一块会有 B 端品牌来付费。我觉得对于大语言模型来说,也不失为一个好的模式。

极客公园:所以搜索未来有可能变成 B 端为某个场景的解决方案付费,为搜索能力来付费、为搜索加大模型能力来付费的模式。

肖阳:是,我觉得端到端的转化应该会有数倍甚至 10 倍以上的提升空间。

比如数字人,搜索业务因为数字人而增加收入,这个在 B 端有很多案例。比如以前用户用搜索,我们可能只能给他一个冷冰冰的结果页或是详情页,现在可以用数字人接过来。

原来广告的转化,可能客服聊两句就要电话,效率很低。现在所有人都可以个性化地聊,聊到最后可能转化到其他渠道,或者就地直接转化成线索、直接到线下去了,整个转化漏斗会提升数倍,所以客户会愿意为这个付费。

极客公园:B 端转化率提升实际上是增长的核心点,甚至这个量比 C 端更大?

肖阳:更大,而且更确定。搜索本身也是百度的「1」,而这件事如果完成升级,它向上的释放能力是很强大的。

在这个时代里怎么向上走,长期来看,用户的信任带来更大的时长,加上更好的转化效果,这就是 10 再乘以 10,是存在百倍的空间的,这是我觉得搜索未来值得期待的那个点。

极客公园:大模型时代带来的生产力提升,是不是能够让搜索实现原本的「不可能三角」,让用户、B 端以及平台实现三方平衡?

肖阳:我觉得是。大语言模型让我们能够和用户离得更近,能让用户离 B 端也更近,迭代速度也更快,而且信息更透明。这样的话,大家就能互相理解,这个商业模式实际上是更健康的商业模式。至于能不能带来原来那么多的收入,我觉得也是能的,因为信任已经有了。

首先用户信任本身就是价值,用户信任提高了 10 倍,那么商业价值就应该有 100 倍。长期来看,用户信任提升了以后,更多的需求会被激发,更多的用户也会来,平台的影响力也会更大。

商户的营销费用,总额就这么多,营销费用肯定往效率最高的地方走。

极客公园:再探讨一个更务实的问题,这背后成本上算得过账来吗?今天百度是否已经解决了大模型推理成本高的问题?

肖阳:这并不是很大的问题。首先第一点,像百度搜索这么大的规模,一定会遇到这个问题,我们所要做的就是用现在这样的成本,这样的技术,把效率提高,去解决更多的问题。而且这个问题是所有公司都面临的,没有谁现在就解决这个问题,我不觉得这是百度竞争里面最关键的问题。

接下来,就看我们如何更高效地利用生成式的技术解决更多问题,这是我们擅长的,也是有经验的。所以第二点,我们一定能比所有的竞争对手在这方面做到更好,先比其他人好 10%,再提升 10%。这两样加起来不就是壁垒吗?

经过观察,我们的成本也略有增加,但整体幅度还好。到这个位置一定会面临这个问题,只要我们提前解决了,就比你好,就比你先知,就比你领先。