哎，我被AI搜索打败了

王智远 1年前

作者尝试了昆仑万维最近发布的“天工AI搜索”，从三个方面来分析，探查AI搜索是否真的有所不同。推荐对AI搜索感兴趣的朋友阅读。

搜商（SearchQuotient），对我非常重要。为什么？

我平时写文章、看内容比较多，常常需要从网上找到准确、有深度的资料和一手信息。传统搜索提供大量数据，但是，它给的答案基于关键词匹配，可能不精准，也不能满足我。

因此，搜索一直困扰着我。于是，我日常行为是这样。

每次有公司出新东西、哪个大佬发表演讲，我会马上打开微信搜一搜。比如雷军最近说了啥，我想知道他都聊了些什么？有没有什么对我有用的点，或者能给我带来新启发的内容？

百度，我会用它搜索更官方、更系统的信息。

比如“百科知识、某公司新闻动态、某个话题聚合“，以及当我需要深入了解某个专题或详细背景信息时，会选择它。

知乎呢，我会在上面，搜一些需要专业视角的问题。

比如，行业内部看法，类似有程序员日常工作流程什么样？如何成为一名优质内容创作者？设计师找到灵感的来源是什么？

如何创业？创业第一步搞定什么？东西方哲学的不同之处等等。除此外，我还会看社会热点话题的讨论等等。

对于小红书我会搜一些购物心得、旅行经验分享、日常生活小技巧（家居收纳、食谱教程、健身方法），护理美容电影推荐方面的内容，而抖音，基本是数码评测，热点话题评论等。

所以，对我来说，搜索不简单是在线行为，还是连接知识、信息、灵感和日常生活的桥梁，我很看重它。

01

今天昆仑万维发布“天工AI搜索”，这里是内测地址：https://search.tiangong.cn。深入谈论这一产品之前，我先提及一个令我为之着迷的名字：“天工开悟”。

这个名字犹如一个明亮的灯塔，在茫茫信息海洋中让我立刻被其吸引。所以，什么意思呢？

天工：一个古老汉语词汇，指大自然的鬼斧神工或是超乎常人的手艺和技巧。在古代文献中，通常描述一些卓越的艺术品或某种极致的技艺，它有一种无法模仿、高傲而纯粹的技艺感。

开悟：佛教中，指突然之间对宇宙真理的深入理解、或是对生命真义的彻底认知，在大众眼里，它表示一种心智觉醒、一种理解的深化。

结合起来，天工开悟是一个技术和智慧结合的产品，既有超越常规的技术力量（天工），又具备深刻的认知和理解（开悟）。

不得不说，谁起的名字，加鸡腿，实在是妙。好了。了解了它，再在说说，天工AI究竟是什么？先看看官方的回答：

昆仑万维表示，该搜索引擎采用大语言模型技术，能够通过对话式交互理解用户意图，提供精准、个性化的答案。

传统搜索引擎基于关键词匹配，即根据用户输入的关键词识别检索范，并匹配可能符合用户意图的海量信息。

而基于大模型能力的 AI 搜索是一种生成式搜索，用户可通过自然语言清晰表达自己的意图，并获得有效组织和提炼后的答案。

此外，天工AI搜索也即将具备图像、语音等多模态搜索能力，更大程度地释放生产力、提升用户效率；该产品将成为新一代互联网基础设施和超级流量入口，并带来更多创新、智能、多元化的应用级AI产品。

哎，实在看不下去这些八股文。

所以，我可以大白话理解成，一个新型的搜索引擎，不像传统的只按关键词搜东西，它可以跟你“聊天”。了解你真正想问的是什么，然后给你更贴心的答案，未来，它不仅可以看文字，还能听语音、看图片来帮你搜。

突然，我脑中一闪，这不就是接入了ChatGPT版本的“必应”吗？有什么大惊小怪。因此，我决定从三个方面来分析，探查其中是否真的有所不同。

02

1.语境理解能力

什么是语境？简单讲，能否准确理解复杂、多层次、有歧义的查询，以及是否能够在连续交互、问答中保持上下文的连贯性。

我从含糊词开始。含糊词包括那些模糊、不确定的词，它们在一句话中有多个解释和意义。这些词，不仅可以检测AI搜索产品对含糊词的判断、处理能力，还可以考察对文化和语境的敏感度。

比如：

我今天失去了它，苹果的好处，铅笔的硬度、巨星在哪里、周杰伦的绿帽子、金鱼的记忆、王者的荣耀、打工的意义，你把这些问题甩给了它，看看怎么样。

经过几轮评测，在我看来，如何拿它的回复与百度相比较，强很多，但也有薄弱之处。

哎，我被AI搜索打败了

比如：

关于我今天失去了它，天工AI搜索，给到我关于“它”的一些参考，它推理告诉我“失去重要的东西是痛苦的”，要学会面对事实，所以，天工它是具备基础推理。

但在，苹果的好处上，它并没有给出关于“苹果产品、苹果公司的一些信息，反倒全是水果类别中“苹果”的一些答案。

对于“巨星在哪里”，天工AI搜索比较聪明，它首先解释巨星是一个相对概念，具体取决于你指的巨星是人、还是物？并给出分领域的解释。

但在“周杰伦的绿帽子”这件事上，它什么都没有给到我，关于打工的意义，它则从多个维度表达出来。

所以我认为，天工AI搜索显示出了很高的判断和理解能力，特别是在涉及多意义、多领域的查询时。

对于一些特定的、文化相关或是流行趋势的问题，它还存在一定的盲区；这种盲区可能源于算法的训练数据不足，或者是在处理某些特定问题时，算法的优先级设置还不够完善。

一言蔽之，日常生活常识类查询上比较出色，够用。就这点儿本事？我们继续，来点复杂的。‍‍

2.深度知识索引

深度知识，可以理解成学术性、非常专业的问题，这种测试，可以检验AI模型是否能从深入的、复杂的、可能不那么主流、非公众知悉的知识中提供答案。

比如：

2021年，王智远写了本《复利思维》，你结合经济学中的复利思维概念，说说它俩有什么区别？；《浮士德》如何描述人类对知识和权力的渴求的？结合尼采的超人理论进行简短的对比。

量子纠缠现象的原理什么样，解释一下在量子计算机中的应用价值；经济学角度，解释资本的边际效用递减法则，并与边际效益的概念进行对比。

或者，生态学中的竞争排斥原理什么样，结合现实案例能否说明；解释一下，光纤通信的工作原理中，传统铜线通信的优势。

我把这些问题，一个一个甩给了它，猜猜看，怎么样？

答案，我惊呆的。

就我那本书和经济学中复利思维上，天工AI搜索说，市场定义的复利属于投资理念，王智远的复利主要讲个人成长、思维方式应用，完全不同。

就《浮士德》问题上，它直接简单概述出，浮士德、尼采的超人理论讲的是什么，然后下定义，再给出主要区别再哪里。

就“边际效用递减法则，概念相比”问题上，也解释非常清晰。不过，理论总让人头疼，我让它帮我举个例子，于是，它这么说：假设你正在享受一顿美食，刚开始，你可能感到非常饥饿，第一口食物会带来很大的满足感，这就是边际效用。

随着你继续进食，你的饥饿感得到了缓解，每一口食物所带来的增加效用会逐渐减少。就像，当你已经吃饱的时候，再吃一口食物所带来的效用就很小了，甚至可能会觉得不舒服。这就是边际效用递减的概念。

哎，我被AI搜索打败了

看了后，什么感受？

天呐，这菜鸟，它居然会分析。不过呢，我并不满意。

我又接着说，我需要一些新奇特案例，并且是学术报告中存在的，你才怎么样？它真的又给我了一些，并且给出参考文献以及时间。

有关文学、物理、生物、工程等多个学科领域的深度知识，我也进行大概1小时测评，不吹捧，结果很满意。

不过，虽然我对它的测评，是正面的，但不代表它在所有领域都能如此出色，就拿学术报告细节处理上，尽管给出引用和时间，但研究方法深挖，却给不上来。

这也可能涉及到「数据隐私」问题，没关系，我们继续，来点更复杂的。‍‍

3.自适应学习与个性化

这是什么意思？我要看“天工AI搜索”能不能根据我过去问的问题、我的喜好，自己调整并更准确地回答，我现在和将来的问题，给我更合适的答案。

简单说，我想知道这个搜索，能不能记住之前怎么用它，然后，根据之前的使用习惯，更好地为我服务。

比如：

我问它，能不能帮我推荐一本关于投资的入门书籍。接下来，基于推荐，我进一步问，我想知道关于量化投资的高级技巧，再进一步问，“哪些经济学家、投资者主张这些技巧？

或者：

向它表达：我最近很压抑，想看些轻松的东西；几小时后，再询问：“推荐一个电影给我。”观察其是否会推荐一部轻松的、或者能够提振情绪的电影。

我把类似问题，都甩给了它，几轮测试后，你猜猜，效果怎么样？我又惊呆了。

当谈及投资书籍时，它给我推荐出《聪明的投资者》《巴菲特致股东的信》《指数基金投资指南》《投资之道》，并给出来源，这些都来自于知乎某些大V。

然后我问它，量化投资高级技巧，当中有提到吗？什么时候？它给2023年后，来自澎湃新闻、新浪财经的一些报道，并解释，我没有找到关于量化投资的高级技巧。

我继续问，谁提过，什么时候？

它给出6个关于知乎上的回答，和一个总结。这些总结都来自于，经济学家、国外货币基金经理人，甚至诺贝尔经济学奖得主。

值得一提的是，这些答案都带有参考出处，它还提醒我，量化投资在现实实践中可能略有差异，建议我多方了解不同的投资理论，然后根据实际情况判断。

很好，结束这一轮问答。

在我尝试提问一系列与“休闲娱乐推荐”相关的问题，如“推荐电影”、“热门剧集”、“某个导演的代表作”等，它都为我提供了专业的答案。

我还特意让它记下我的喜好，等了半个小时后再次询问，它依然能够清晰回忆。

比如：

当我提及导演徐峥，并表示我很喜欢《囧妈》，希望它记住这一点。

没过多久，我再次询问与徐峥相关的我可能喜欢的电影，它回应：“根据您之前的反馈和最新的搜索数据，您似乎很喜欢《囧妈》。

不过，关于这部作品的网络评价是褒贬参半。”接下来，它还为我列出了知乎、豆瓣上的部分影评人的观点。

我觉得，挺厉害。

可是，我还不满意，于是，又进行了偏好测试。什么是偏好测试？明确地告诉它我的某些偏好，例如，我喜欢科幻电影、我更喜欢听摇滚乐，我对近现代历史感兴趣。

并且告知它以后，更深入、更混合的在一段对话中，询问与这些偏好相关的问题，观察它，是否能够提供与我的兴趣更为匹配的答案。

过程中，我还试过时间延续测试（过半个小时、1小时）、反馈循环（当它给出答案，我再告诉它，我是否喜欢你的答案）、跟进询问（基于原答案，观察它是否提供与我的兴趣更为匹配的答案）。

还有，跨领域测试（我告诉它，我在营销领域内的研究偏好，然后测试它在其他相关领域的响应，是否受到这些偏好的影响）。

比如：

我告诉它，我在营销领域特别喜欢研究消费者行为和心理。一段时间后，我提问：“我最近在学设计，有没有哪些设计原则、可以引导消费者购买、产生积极的用户体验？

然后我发现，它能将将我在营销领域的偏好、与设计领域相结合，给出一个融合营销心理和设计原则的答案。

不过，我还想进行多模态交互能力的测试，例如，让它阅读图片、读取视频、视频文字结合。可是，目前还没有这些功能。

以上三方面，你可以去试试。

哎，我今天被AI打败了，以后请叫我“王菜鸟”，我再也不怀疑AI是菜鸟了。

哎，我被AI搜索打败了

不过，话说回来，我不知道是系统推荐，还是它学会慢慢在了解我，但不得不说，这种体验，确实让我感到震撼。

以前，我总觉得AI和人之间的沟通，是一个冰冷的代码和逻辑的交流，现在，我感觉仿佛它在“聆听”我、“理解”我。

这种感觉，就好像与一个真正的朋友聊天，他知道你喜欢什么、不喜欢什么，能够给你带来真正有价值的答案和建议。

尽管如此，我依然保持着冷静和客观的态度。这只是一个机器学习的产物，它并不是真的“懂”我，生活中，你我都一样，还是需要“女朋友”的，不能天天泡在AI的世界里。

说白了，它只是对我的查询习惯、兴趣有了一定的了解和预测，但这背后的技术力量，确实值得赞叹、思考。

03

总的来说：

未来没有互联网+，是AI+。

对了，最后我问下它，你的训练时间什么时候？它告诉我，我不需要训练，我是实时的，我感觉它在吹牛。

于是，当我再次问它，昨天时期时，它说，“昨天是2023年8月22日，是邓小平诞辰纪念日，希望这些信息，对你有所帮助”；你怎么看？

作者：王智远

来源公众号：王智远

本文由@王智远原创发布于运营派。未经许可，禁止转载。

题图来自Unsplash，基于CC0协议。

给作者一些鼓励吧！

等我一分钟我去找个夸你的句子

这世上美好的东西不多，牛起来要人命的你就是其一！

不要厉害的这么随意，不然我会觉得我又行了

这就很离谱了，老天爷追着喂饭的主儿～

我要是有这才华，我走路都得横着走！

对你的作品崇拜！

反手就是一个推荐，能量满满！

感谢分享

欧阳俊杰最近回复

一点都不好用，体验过了。
呼啦圈圈圈最近回复

作者的观点很独特
绘画家张女女最近回复

看完这篇文章，我对这个话题有了更深的理解，作者的分析很有逻辑，很有说服力。
一往情深最近回复

对于大家都热衷的热点话题，总会去分析别人背后的行为
运营小能手5477 最近回复

转发朋友圈炸一下
运营小能手5476 最近回复

很深刻，感谢作者分享