哎,我被AI搜索打败了
作者尝试了昆仑万维最近发布的“天工AI搜索”,从三个方面来分析,探查AI搜索是否真的有所不同。推荐对AI搜索感兴趣的朋友阅读。
搜商(SearchQuotient),对我非常重要。为什么?
我平时写文章、看内容比较多,常常需要从网上找到准确、有深度的资料和一手信息。传统搜索提供大量数据,但是,它给的答案基于关键词匹配,可能不精准,也不能满足我。
因此,搜索一直困扰着我。于是,我日常行为是这样。
每次有公司出新东西、哪个大佬发表演讲,我会马上打开微信搜一搜。比如雷军最近说了啥,我想知道他都聊了些什么?有没有什么对我有用的点,或者能给我带来新启发的内容?
百度,我会用它搜索更官方、更系统的信息。
比如“百科知识、某公司新闻动态、某个话题聚合“,以及当我需要深入了解某个专题或详细背景信息时,会选择它。
知乎呢,我会在上面,搜一些需要专业视角的问题。
比如,行业内部看法,类似有程序员日常工作流程什么样?如何成为一名优质内容创作者?设计师找到灵感的来源是什么?
如何创业?创业第一步搞定什么?东西方哲学的不同之处等等。除此外,我还会看社会热点话题的讨论等等。
对于小红书我会搜一些购物心得、旅行经验分享、日常生活小技巧(家居收纳、食谱教程、健身方法),护理美容电影推荐方面的内容,而抖音,基本是数码评测,热点话题评论等。
所以,对我来说,搜索不简单是在线行为,还是连接知识、信息、灵感和日常生活的桥梁,我很看重它。
01
今天昆仑万维发布“天工AI搜索”,这里是内测地址:https://search.tiangong.cn。深入谈论这一产品之前,我先提及一个令我为之着迷的名字:“天工开悟”。
这个名字犹如一个明亮的灯塔,在茫茫信息海洋中让我立刻被其吸引。所以,什么意思呢?
天工:一个古老汉语词汇,指大自然的鬼斧神工或是超乎常人的手艺和技巧。在古代文献中,通常描述一些卓越的艺术品或某种极致的技艺,它有一种无法模仿、高傲而纯粹的技艺感。
开悟:佛教中,指突然之间对宇宙真理的深入理解、或是对生命真义的彻底认知,在大众眼里,它表示一种心智觉醒、一种理解的深化。
结合起来,天工开悟是一个技术和智慧结合的产品,既有超越常规的技术力量(天工),又具备深刻的认知和理解(开悟)。
不得不说,谁起的名字,加鸡腿,实在是妙。好了。了解了它,再在说说,天工AI究竟是什么?先看看官方的回答:
昆仑万维表示,该搜索引擎采用大语言模型技术,能够通过对话式交互理解用户意图,提供精准、个性化的答案。
传统搜索引擎基于关键词匹配,即根据用户输入的关键词识别检索范,并匹配可能符合用户意图的海量信息。
而基于大模型能力的 AI 搜索是一种生成式搜索,用户可通过自然语言清晰表达自己的意图,并获得有效组织和提炼后的答案。
此外,天工AI搜索也即将具备图像、语音等多模态搜索能力,更大程度地释放生产力、提升用户效率;该产品将成为新一代互联网基础设施和超级流量入口,并带来更多创新、智能、多元化的应用级AI产品。
哎,实在看不下去这些八股文。
所以,我可以大白话理解成,一个新型的搜索引擎,不像传统的只按关键词搜东西,它可以跟你“聊天”。了解你真正想问的是什么,然后给你更贴心的答案,未来,它不仅可以看文字,还能听语音、看图片来帮你搜。
突然,我脑中一闪,这不就是接入了ChatGPT版本的“必应”吗?有什么大惊小怪。因此,我决定从三个方面来分析,探查其中是否真的有所不同。
02
1.语境理解能力
什么是语境?简单讲,能否准确理解复杂、多层次、有歧义的查询,以及是否能够在连续交互、问答中保持上下文的连贯性。
我从含糊词开始。含糊词包括那些模糊、不确定的词,它们在一句话中有多个解释和意义。这些词,不仅可以检测AI搜索产品对含糊词的判断、处理能力,还可以考察对文化和语境的敏感度。
比如:
我今天失去了它,苹果的好处,铅笔的硬度、巨星在哪里、周杰伦的绿帽子、金鱼的记忆、王者的荣耀、打工的意义,你把这些问题甩给了它,看看怎么样。
经过几轮评测,在我看来,如何拿它的回复与百度相比较,强很多,但也有薄弱之处。
比如:
关于我今天失去了它,天工AI搜索,给到我关于“它”的一些参考,它推理告诉我“失去重要的东西是痛苦的”,要学会面对事实,所以,天工它是具备基础推理。
但在,苹果的好处上,它并没有给出关于“苹果产品、苹果公司的一些信息,反倒全是水果类别中“苹果”的一些答案。
对于“巨星在哪里”,天工AI搜索比较聪明,它首先解释巨星是一个相对概念,具体取决于你指的巨星是人、还是物?并给出分领域的解释。
但在“周杰伦的绿帽子”这件事上,它什么都没有给到我,关于打工的意义,它则从多个维度表达出来。
所以我认为,天工AI搜索显示出了很高的判断和理解能力,特别是在涉及多意义、多领域的查询时。
对于一些特定的、文化相关或是流行趋势的问题,它还存在一定的盲区;这种盲区可能源于算法的训练数据不足,或者是在处理某些特定问题时,算法的优先级设置还不够完善。
一言蔽之,日常生活常识类查询上比较出色,够用。就这点儿本事?我们继续,来点复杂的。
2.深度知识索引
深度知识,可以理解成学术性、非常专业的问题,这种测试,可以检验AI模型是否能从深入的、复杂的、可能不那么主流、非公众知悉的知识中提供答案。
比如:
2021年,王智远写了本《复利思维》,你结合经济学中的复利思维概念,说说它俩有什么区别?;《浮士德》如何描述人类对知识和权力的渴求的?结合尼采的超人理论进行简短的对比。
量子纠缠现象的原理什么样,解释一下在量子计算机中的应用价值;经济学角度,解释资本的边际效用递减法则,并与边际效益的概念进行对比。
或者,生态学中的竞争排斥原理什么样,结合现实案例能否说明;解释一下,光纤通信的工作原理中,传统铜线通信的优势。
我把这些问题,一个一个甩给了它,猜猜看,怎么样?
答案,我惊呆的。
就我那本书和经济学中复利思维上,天工AI搜索说,市场定义的复利属于投资理念,王智远的复利主要讲个人成长、思维方式应用,完全不同。
就《浮士德》问题上,它直接简单概述出,浮士德、尼采的超人理论讲的是什么,然后下定义,再给出主要区别再哪里。
就“边际效用递减法则,概念相比”问题上,也解释非常清晰。不过,理论总让人头疼,我让它帮我举个例子,于是,它这么说:假设你正在享受一顿美食,刚开始,你可能感到非常饥饿,第一口食物会带来很大的满足感,这就是边际效用。
随着你继续进食,你的饥饿感得到了缓解,每一口食物所带来的增加效用会逐渐减少。就像,当你已经吃饱的时候,再吃一口食物所带来的效用就很小了,甚至可能会觉得不舒服。这就是边际效用递减的概念。
看了后,什么感受?
天呐,这菜鸟,它居然会分析。不过呢,我并不满意。
我又接着说,我需要一些新奇特案例,并且是学术报告中存在的,你才怎么样?它真的又给我了一些,并且给出参考文献以及时间。
有关文学、物理、生物、工程等多个学科领域的深度知识,我也进行大概1小时测评,不吹捧,结果很满意。
不过,虽然我对它的测评,是正面的,但不代表它在所有领域都能如此出色,就拿学术报告细节处理上,尽管给出引用和时间,但研究方法深挖,却给不上来。
这也可能涉及到「数据隐私」问题,没关系,我们继续,来点更复杂的。
3.自适应学习与个性化
这是什么意思?我要看“天工AI搜索”能不能根据我过去问的问题、我的喜好,自己调整并更准确地回答,我现在和将来的问题,给我更合适的答案。
简单说,我想知道这个搜索,能不能记住之前怎么用它,然后,根据之前的使用习惯,更好地为我服务。
比如:
我问它,能不能帮我推荐一本关于投资的入门书籍。接下来,基于推荐,我进一步问,我想知道关于量化投资的高级技巧,再进一步问,“哪些经济学家、投资者主张这些技巧?
或者:
向它表达:我最近很压抑,想看些轻松的东西;几小时后,再询问:“推荐一个电影给我。”观察其是否会推荐一部轻松的、或者能够提振情绪的电影。
我把类似问题,都甩给了它,几轮测试后,你猜猜,效果怎么样?我又惊呆了。
当谈及投资书籍时,它给我推荐出《聪明的投资者》《巴菲特致股东的信》《指数基金投资指南》《投资之道》,并给出来源,这些都来自于知乎某些大V。
然后我问它,量化投资高级技巧,当中有提到吗?什么时候?它给2023年后,来自澎湃新闻、新浪财经的一些报道,并解释,我没有找到关于量化投资的高级技巧。
我继续问,谁提过,什么时候?
它给出6个关于知乎上的回答,和一个总结。这些总结都来自于,经济学家、国外货币基金经理人,甚至诺贝尔经济学奖得主。
值得一提的是,这些答案都带有参考出处,它还提醒我,量化投资在现实实践中可能略有差异,建议我多方了解不同的投资理论,然后根据实际情况判断。
很好,结束这一轮问答。
在我尝试提问一系列与“休闲娱乐推荐”相关的问题,如“推荐电影”、“热门剧集”、“某个导演的代表作”等,它都为我提供了专业的答案。
我还特意让它记下我的喜好,等了半个小时后再次询问,它依然能够清晰回忆。
比如:
当我提及导演徐峥,并表示我很喜欢《囧妈》,希望它记住这一点。
没过多久,我再次询问与徐峥相关的我可能喜欢的电影,它回应:“根据您之前的反馈和最新的搜索数据,您似乎很喜欢《囧妈》。
不过,关于这部作品的网络评价是褒贬参半。”接下来,它还为我列出了知乎、豆瓣上的部分影评人的观点。
我觉得,挺厉害。
可是,我还不满意,于是,又进行了偏好测试。什么是偏好测试?明确地告诉它我的某些偏好,例如,我喜欢科幻电影、我更喜欢听摇滚乐,我对近现代历史感兴趣。
并且告知它以后,更深入、更混合的在一段对话中,询问与这些偏好相关的问题,观察它,是否能够提供与我的兴趣更为匹配的答案。
过程中,我还试过时间延续测试(过半个小时、1小时)、反馈循环(当它给出答案,我再告诉它,我是否喜欢你的答案)、跟进询问(基于原答案,观察它是否提供与我的兴趣更为匹配的答案)。
还有,跨领域测试(我告诉它,我在营销领域内的研究偏好,然后测试它在其他相关领域的响应,是否受到这些偏好的影响)。
比如:
我告诉它,我在营销领域特别喜欢研究消费者行为和心理。一段时间后,我提问:“我最近在学设计,有没有哪些设计原则、可以引导消费者购买、产生积极的用户体验?
然后我发现,它能将将我在营销领域的偏好、与设计领域相结合,给出一个融合营销心理和设计原则的答案。
不过,我还想进行多模态交互能力的测试,例如,让它阅读图片、读取视频、视频文字结合。可是,目前还没有这些功能。
以上三方面,你可以去试试。
哎,我今天被AI打败了,以后请叫我“王菜鸟”,我再也不怀疑AI是菜鸟了。
不过,话说回来,我不知道是系统推荐,还是它学会慢慢在了解我,但不得不说,这种体验,确实让我感到震撼。
以前,我总觉得AI和人之间的沟通,是一个冰冷的代码和逻辑的交流,现在,我感觉仿佛它在“聆听”我、“理解”我。
这种感觉,就好像与一个真正的朋友聊天,他知道你喜欢什么、不喜欢什么,能够给你带来真正有价值的答案和建议。
尽管如此,我依然保持着冷静和客观的态度。这只是一个机器学习的产物,它并不是真的“懂”我,生活中,你我都一样,还是需要“女朋友”的,不能天天泡在AI的世界里。
说白了,它只是对我的查询习惯、兴趣有了一定的了解和预测,但这背后的技术力量,确实值得赞叹、思考。
03
总的来说:
未来没有互联网+,是AI+。
对了,最后我问下它,你的训练时间什么时候?它告诉我,我不需要训练,我是实时的,我感觉它在吹牛。
于是,当我再次问它,昨天时期时,它说,“昨天是2023年8月22日,是邓小平诞辰纪念日,希望这些信息,对你有所帮助”;你怎么看?
作者:王智远
来源公众号:王智远
本文由@王智远 原创发布于运营派。未经许可,禁止转载。
题图来自Unsplash,基于CC0协议。
一点都不好用,体验过了。
作者的观点很独特
看完这篇文章,我对这个话题有了更深的理解,作者的分析很有逻辑,很有说服力。
对于大家都热衷的热点话题,总会去分析别人背后的行为
转发朋友圈炸一下
很深刻,感谢作者分享