100%用AI写的短篇小说什么样? | Kimi、天工AI、万知
本文主要描述了使用人工智能(AI)编写短篇小说的过程及结果,通过三个不同的AI产品——Kimi、天工AI和万知分别创作短篇悬疑小说,并对其产生的作品进行了评估和比较。
从年初到现在,我已经测了许多款AI产品在辅助网文创作上的表现。但是吧,为了统一测试标准方便评判比较,测试内容的设计我认为还是比较浅的。
最近我一直在想,到底怎么样才能更深入一些,真正挖掘出各种AI产品在辅助网文创作上的水平,帮大家摸个底。于是,这几天我设计了一个全新的测试方案,让AI生成一篇完整的短篇小说看效果。
一、测试方案
先说说测试方案的思路吧。
说白了AI辅助网文创作,就是让AI帮助我们把脑子里的想法转换成文章。所以这次测试咱们就来小小地打个样,看看用最小代价,从没有灵感到生成的一篇完整的小短篇,会是什么样、代价如何。
注意啊,我这里说的是最小代价。正式的作品肯定需要经过细致打磨,才能达到投稿的水平。咱们这是测试产品,所以会糙一点,生成的文章质量不会有多高,过程简单,主要是从创意到成文,保证结构完整即可,把这个过程走完看看效果。
具体规则如下:
- 我会提供统一的结构化提示词模板给到AI,其中包含对Role、Profile、Goals、Skills、Constraints、Workflow、Initialization的规范。
- 小说生成的步骤按照故事创意 > 故事大纲 > 正文的顺序执行,前序工作合格后才进入下一步。
- 故事题材统一定为“短篇悬疑小说,但不是侦探破案”。
- 故事创意阶段需要提供故事主线、开局,开局以一句话制造悬念。
- 故事大纲阶段将小说分为5个章节,每个章节中都需要包含情节反转,章节前面还会有一小段导语,类似知乎文的结构。
- 生成的正文需求确保行文流畅,稍微去AI味儿(不会细抠),但不对故事质量提太高要求。
至于不同AI产品间的对比,则主要依据以下指标:
- 会话轮次,一问一答算一轮。
- 提示词字数统计(初始提示词不计入)。
- 生成文稿质量。
这一次咱们先来测3款产品:Kimi、天工AI、万知。
以下是三款产品创作的情况,以及最终生成的小说成品。
二、Kimi
- 地址:https://kimi.moonshot.cn/
- 会话轮次:60
- 提示词统计:3538
- 说明:综合来看,Kimi在三款产品中综合表现最好,所有修改基本能完成得比较好。但是Kimi有个很不好的毛病,就是喜欢概括。我拼命往大纲里加细节,这货给我不断归纳总结归纳总结,气得我想把它拖出来打一顿。好在它记性还可以,骂一骂又能把那些细节找回来。
《影子的交易》
二、天工AI
- 地址:https://www.tiangong.cn/chat/universal/016
- 会话轮次:45
- 提示词统计:6627
- 说明:测试下来,天工3.0对话助手记性特别差,绝大部分时候无法回溯之前确认过的内容,必须手动粘贴上去。并且在构思故事时会出现逻辑错误,需要干预纠正。不过,这款产品在生成大纲的时候,给的情节比Kimi丰富,所以它的对话轮次没有Kimi那么多,因为改得少了,这算是一个亮点吧。
《午夜快递》
三、万知
- 地址:https://www.wanzhi.com/
- 会话轮次:20
- 提示词统计:1298
- 说明:这款产品简直太犟了!在生成正文时,我尝试多次让AI修改初稿,AI都无动于衷,生成多个版本都和第一版一样,导致无法再进行下去。因此,测试算是失败的。这里我就把生成的故事大纲贴出来吧,实在是进行不下去。
《镜中世界》
四、小结
以上是用最简化流程生成的三部短篇作品,正文100%由AI生成,无任何人工修改。生成这三篇内容,一共花了4个多小时的时间。只是出于测试AI写文效果的考虑,并没有特别深入地打磨作品,小说的内容质量肯定是不够的。
当然啦,AI生成内容有一定随机性,这一点不可避免。
三款AI产品对话与生成情况汇总如下:
至于内容质量,你更喜欢哪一个故事呢?
本文由运营派作者【不知】,微信公众号:【不知】,原创/授权 发布于运营派,未经许可,禁止转载。
题图来自 Unsplash,基于 CC0 协议。
知易行难
昨天晚上睡前还思考了这个问题,好巧
写得很有价值,作者的经验和智慧都很丰富
文章写得很精彩,作者的文笔很好