一文读懂AI搜索
探索AI搜索的奥秘,本文深入解析AI搜索的决策模型、与内容平台的互动以及未来趋势,解决信息准确性问题,推荐给对AI技术及其应用感兴趣的读者。
早上朋友发信息给我:
智远,你可以呀,现在厉害了,不仅写作,还成了当代艺术家,还去悉尼、新加坡办画展,业务够多,忙得过来吗?
我顿时不知道怎么回应,惊讶又好奇的回了句:纳尼?
紧接着,朋友发来一张截图说:你看。
我一看,天呐,AI搜索把我的资料和另一位同名人的资料,混在一起了,太坏了。
认识我的还行,不认识的明显会被误导。这两年,不少大模型公司布局AI搜索,很多人也感受到技术带来的快捷,不过,使用过程中,根本没意识到信息是否准确。所以,怕你被AI误导。我抽出时间,做了一个简单科普,比如:AI搜索的决策模型什么样?为啥机器味严重?AI搜索和内容平台的关系是什么?未来搜索会发生什么革命性变化等等。毕竟了解底层知识,能够帮你,更好的用AI搜索。
01
有个词叫缸中之脑(Brain in a Vat)什么意思呢?
想象一个血腥的画面:
你(或者别人)被一位疯狂的科学家,进行一次可怕的实验。他把大脑从身体上取下来,放进一个装有维持大脑存活的营养液的玻璃钢中。然后,大脑神经末梢,链接到一台超级计算机,计算机按照设定程序,向你的大脑发送各种信息,让你以为以前很正常。
那么,对取出来的大脑来说,世界是不是依然和原来的一样?你看到的人、物体、天空,感受,还有记忆,是不是都还在?这个实验,常用来说明怀疑论、唯我论和主观唯心主义的观点,简单讲:即我所体验的、看到的、到底是真的假的呢?
怕你共情不多,我再举个例子:
好不容易休息半天,躺在沙发上,看着外面阴雨天,突然想到昨天刚上映的恐怖片,还没看。于是,打开影片,刚看一半,心跳加速,你决定不看了。为什么?因为太恐怖了。恐怖画面的信息,一次次传递到“缸中之脑”,让你觉得太真实,似乎恐怖画面马上要出现在自己身上。
但你知道吗?这些都是大脑模仿出来的,看似真实,未必真实,我们的感知,不仅由大脑产生,身体,也会影响它。
比如:521到了,即便没有见面,你总送心爱的人一些温暖的东西,一杯奶茶、一束鲜花,她收到礼物那一刻,在远方也能感受到你对她的好看。这就是具身认知,是思考,感觉、行为三者共振的结果,认识到它,你能感受到,外面我们接收到的任何信息,故事是一个个画面,所描绘的场景只要大脑熟悉,它都会共鸣。
而AI搜索,是什么呢?本质像一个“缸中之脑”。运行在一个强大的模型上,模型像它的基础,帮它站稳脚跟,外面信息是它的食物,通过你的搜索,不断训练自己推理能力。不论什么AI搜索软件,当你问题时,它都会遵循一个六步走的公式:
- 理解问题
- 检索信息
- 整合答案
- 生成回答
- 结果验证
幻想一下,现在来到未来时代,站在图书馆里,面前有一个人工智能,现在要找一本《穷查理宝典》,你会怎么做?
你可以手动输入,或者对着它说:“帮我找一本叫《穷查理宝典》。”此时,AI会利用语言技术,快速分析你的意图,提炼出最重要的部分,比如:书名、作者、人名。然后,它会把你的问题和图书馆里的文档、图片快速匹配,从中找出重要的段落和句子。接着,它会做降噪处理,去掉干扰的内容,比如广告、重复的段落,确保剩下的都是有用的信息。
最后,AI会把所有找到的信息整合起来,生成一个答案,这就是AI搜索的过程。不难理解吧。
我突然想到一个画面:小时候,老师经常说:“哎,你们是我带过最差的一届,要是无法理解,就把这段内容死机硬背下来。”,可你有没有想过,考试对死记硬背来说,意图是什么?从人工智能角度看,答案只有一个词:检索。
也就是说:你背诵的所有资料,最后一刻,学校用一张试卷来检索大脑有没有记住,当成绩达标时,证明你通过了。
02
明白AI搜索的六步公式,能得到什么启发呢?有两点:
- 知道AI的回答为什么很干巴
- 知道它为何缺乏情感和个性
AI搜索生成逻辑有一些限制,为避免产生错误信息和不准确的信息,AI会倾向于保守地给你高频、标准化的表达。这种倾向自然会使回答显得更加刻板。
比如:你问AI如何做好品牌营销?它一定会告诉你,首先要了解目标市场,然后创建一个独特的品牌定位,接着进行市场推广,最后通过反馈不断优化品牌策略。另外,作为“缸中之脑”,AI只有一个搜索框,无法感受你的语气,看不到其他信息,所以也无法理解你的情感。
这样一来,AI生成的答案就缺乏人类的情感色彩和个性,看起来很机械,或者像是官方的回答。值得一提的是:人们常说,一个人学习什么知识,他的见识就有多高。AI也是一样的。你给它喂草料,它自然吐不出钻石来。所以,大公司为了防止AI搜索出来的内容很水,就会限制训练内容,会给AI喂新闻报道、学术论文和正式文本。这些文本风格比较客观,所以,AI学完后,回答也会是类似的风格。
现在AI搜索虽然看似有推理能力,但我测试了很多,发现整体推理还是比较弱。一个主要原因,人类说话时,本身推理性就不强。所以,AI学习的内容也会相对较弱。在文字相关的搜索上,这种情况很常见,理科的内容相对更严谨一些。显然,“缸中之脑”就是“缸中之脑”。
看似聪明,但离不开三点:
- 大模型作为基础,
- 固定的模型
- 知识库
因此,重要的结论是:用AI搜索时,你不给它一个很健全的 prompt,它的解析能力会变得很弱,得到的答案自然很难让人满意。
03
你有没有想过,AI搜索平台和内容生态到底什么关系?
我觉得,从过去的传统搜索,到现在AI搜索,用一句话来形容转变的过程便是:从独立到融合,再到独立。
为什么呢?没有大模型之前,谷歌在1998年开始做大规模搜索,后来进军中国,由于数据方面的问题,谷歌被限制,随后,百度在2000年快速崛起,靠爬虫抓取大量网页,然后分发和售卖广告起家。这两家公司商业模式基本相似。谷歌做了一个叫Knowledge Graph的知识库,还有Google Answers,百度则推出了“百度知道”和“百度百科”。
后来,国内360、搜狗也跟着做类似的产品。网页时代落幕,张一鸣用一个算法推荐,让今日头条拔地而起。头条采用推荐机制的同时,也尝试建立内容生态。
比如:孵化垂类创作者,推出各种与内容相关的产品,但直到现在,我都觉得它还没成功,今日头条增长停滞后,头条搜索也没法跟着增长。后来短视频涌现,抖音起来,它建立一个良好的内容生态和增长模式,所以,抖音搜索成功了。不管怎么样,它们的核心目的只有一个,把内容控制在自己手里,通过掌握内容,建立壁垒,因为内容生态对搜索平台有很大的依赖性。
内容提供者,要依靠搜索引擎,来让内容被更多人看到,而搜索引擎,则要高质量的内容来吸引用户,并提供有用的搜索结果。有了大模型之后呢?微软推出新版必应,紧接着谷歌、百度、360和昆仑万维等企业也开始布局AI搜索。
李彦宏一直强调,把生成式AI技术和搜索深度整合在一起。周鸿祎也说,做搜索引擎的企业,最有机会研究像ChatGPT这样的产品,还有昆仑万维、秘塔AI也在加紧跟上。不管怎么说,它们有相似之处:整合全网信息,让用户用自然语言表达需求,并提供经过组织和提炼的答案,这样可以减少冗余信息的时间消耗,确保答案的可追溯性、可信赖性。
不过,尽管这些搜索引擎,凭借原有的知名度、用户基础在市场上占据主导地位,由于移动互联网时代APP的“信息孤岛”现象,它们并没有完全掌控所有信息,反而,垂直搜索引擎正在逐渐崛起。
比如:小红书推出自己的搜索,今日头条推出豆包,淘宝推出原生AI应用——淘宝问问,它嵌入淘宝搜索框,服务于月活跃用户近9亿、每日产生数百亿次搜索的庞大流量。
现在,抖音搜索量在移动端已经超过百度,小红书通过用户的真实分享和有用的笔记,建立了强大的社区氛围,这都是各自的优势。因此,我看到两种趋势正在出现:一是通用搜索的AI升级,二是垂类搜索的崛起。垂类搜索数据,主要来自自己的平台,类似于站内搜索,信息更服务于细分场景。当信息量足够多时,就会自然涌现。
长远来看,拥有优质内容的社区,做的搜索会更有优势,因为好内容平台能够吸引和留住用户,进而提升搜索功能的价值和使用频率。明白这些也就理解了,我为什么说,搜索会经历从独立到融合,再到独立的过程。
毕竟,独立,是全新的独立,是细分的独立。实在不信的话了,你想想360AI、秘塔AI,天工AI到底有什么区别?把它们和淘宝问问、抖音搜索一比更明确呢?因此,未来优质内容社区的搜索功能将会胜出。
04
到这里,我们可以思考下:AI搜索的本质是什么?
我认为,AI搜索真正的关键在于AI技术本身,而不是传统的搜索方式。这就像“AI+”和“+AI”的区别。AI+,更像把AI技术加到已有的系统或产品上。
比如,在传统搜索引擎上加入AI功能,这种方式主要在现有技术基础上,增强功能。+AI,不一样。要求从一开始就以AI为核心,建立一个系统或产品。比如,设计一个完全依赖AI进行的搜索引擎,它所有功能都围绕AI技术展开,更像是从头开始,完全依赖AI技术运作。
很显然,“AI+”是改进现有系统,而“+AI”是从零开始,完全依靠AI技术。AI搜索真正力量在于后者,也就是“+AI”。对于一般简单问答,AI搜索只弥补传统搜索的不足。但要真正创新和突破,要寻找新的应用场景和特定领域,比如学术、医疗、法律等。这些领域中,AI驱动的搜索才能真正发挥战略意义。
“AI原生”(AI Native)很重要,因为经过多年的发展,传统方法已经挖掘了所有可能性,AI原生的定义是,只有在引入AI能力的情况下,产品才能实现。这种情况下,AI是最大的变量,但AI比例并不重要。关键在于产品需要找到交叉点:哪些场景是只有AI才能实现?同时又满足大规模用户需求。这种探索越多越快,竞争优势就越大。这也是对各家产品经理的巨大考验。
那么,问题来了:有人会觉得,传统搜索市场还有价值吗?肯定的。传统搜索的强项在于寻址和寻找资讯。从商业角度看,PC端搜索市场增量有限,移动端又被抖音、小红书等平台分流,不过,百度财报中,搜索引擎依然是基本盘的重要组成部分。还有人认为,谷歌和百度垄断这么多年,其他玩家还有机会吗?
来看一组美国statcounter机构的数据:截至2024年5月6日,美国搜索市场中,谷歌份额下降到了77.52%,其他市场被Bing和Yahoo蚕食,但谷歌基本盘还算稳。国内截至4月,电脑端必应的份额是37.24%,百度是22.53%,但百度的主导地位已经不在了。虽然数据会存在偏差,但能看出搜索市场的变化和机会,AI搜索更应该理解用户意图,完成复杂的任务。
比如:用户搜索不仅仅是寻找信息,还包括找地址,或查找短内容的源头;再比如,通过AI找到过去5年城市人口的发展趋势,甚至,搜索新能源汽车的渗透率趋势和原因。还有找电影、追溯图片等等……
所以,需求背后,是AI搜索目前还没有攻克的场景。
总结
AI+,还是+AI,要看企业选择。不论哪条路,我都认为,垂直领域的数据,将成为重要开采对象,不然怎么向数据要增量?那么问题来了:什么样的垂直数据还未被开采呢?嗯,值得思考的问题。
作者:王智远; 来源公众号: 王智远(ID:878436)
本文由@ 王智远 原创发布于运营派,未经许可,禁止转载。
题图来自 Unsplash,基于 CC0 协议。
关注作者很久了,看到这篇文章的时候想到了很多点子其实真的是可以运用在日常工作中
刚从产品转运营,我是不是掉坑里了,看了这些文章,感觉做运营比做产品更难。事更多事更杂。
666,学到了,收藏起来。
运营要学会灵活变通很重要