如何区分文章是否为 Ai 创作

最近老T发布的几篇文章下方，都有读者在质疑文章内容是否为 Ai 创作。这里可以肯定的给大家答复，没有。

但，坦白说， Ai 确实在创作过程中发挥了一定的作用。

刚好，今天早上老T在 HN 头条上看到一篇题为 “零Ai写作” 的文章，受其启发，来探讨一下 Ai 写作的缺陷，以及如何区分 Ai 写作。

Zero-Ai Writing

如果把 Ai 比作工业流水线，那“零 Ai 写作”毫无疑问就是手工业

多年来，受马前卒、科技袁人等节目影响，老T对“工业化思维”确实非常推崇，生活中习惯性拿“工业思维”来鄙夷“手工业”，认为“手工业”是技术落后的代表，更多是在宣扬“玄学”和贩卖“智商税”。

比如那些打着纯手工旗号，动则数万元的“手袋”“包包”，比如在科技数码时代仍然标榜着纯手工制造的“机械手表”“超级跑车”。

当然，这种想法多少有些偏颇，甚至容易在家庭内部引发冲突。

可一旦把这个问题扯到写作上来，仿佛一切都变了。

越是用 Ai 流水线生产的文字，越是被大众所不耻，越是手工写作的内容，越能赢得信赖。

换言之，我原来使用的这套“工业——手工业”逻辑，在 Ai 文字生成这个领域，面临着严重的价值观挑战，粗看一下，甚至完全反了过来。

深入剖析这个问题，我想，核心争议在于：Ai 写作到底是不是生产力进步？

Ai 写作到底是不是生产力进步？

人类从手工业进入工业，毫无疑问是生产力的巨大进步，促进了物质财富的极大丰富，让全世界每个角落的人群，都能便捷享受到工业品带来的便利和好处。

Ai 创作，也给了普通人制作更多数字产品的可能性。

它让普通人能够大幅降低学习成本，以最简单的方式迅速创造出原本不可能创造的内容。例如，让完全不懂数据库结构的我，立马创作出一个转换脚本，将 Mysql 数据库转为 markdown 文件。

从这方面看，Ai 创作显然是生产力进步。

写作层面同样如此。比如，之前我有数百篇文章需要转换为英语，并撰写文章“摘要”信息，同时规范文章的标签设置，如果仅靠自己去操作，那工作量显然不是十天半个月能完成的任务，但用 Ai 的话，几个小时就全部处理完毕。

另外，最近一年我在写作过程中，也确实也很依赖 Ai 提供帮助，特别是 Ai 信息检索，文字核对、内容核查以及格式调整方面。

但毫无疑问，写作流程中包括主要观点、文章结构、引用事例、事实经过以及特定的句式、词汇运用等，都源于自己真实的思考。

这也引发另一个问题：Ai 辅助创作到底算不算 Ai 写作？

Ai 辅助创作到底算不算 Ai 写作？

我想，还是借助工业和手工业的例子来思考吧。

现实中，工业品和手工业品通常都比较容易区分，普通人仅凭价格和常识，都能对大部分实物进行判断。

但也有很多不好区分的，比如批量制造的农副产品以及部分打着“手工制作旗号”实际也是按工业流水线模式生产的产品，就连个鸡蛋也得区分人造蛋、饲料蛋、土鸡蛋。

Ai 辅助创作也同样如此，对于那些直接按简单提示词生成的文字，大部分读者都能一眼看出来内容为 Ai 生成，但对于拿 Ai 生成的范本进行认真打磨，二次创作的内容，或者基于对一个人既有文字进行深度学习，模仿出来的内容，识别起来就很困难了。

哪怕是在图象生成领域，最新的 Gemini Banana 生成的一些图像，就连 Ai 自己都无法识别出来是否为 Ai 创作，一般人看到后更加难以判断。

某论坛上 Banana 模型生成照片

不过，也正如“工业品”和“手工业品”，实际上其界限也很难区分。毕竟，纯正原始的“手工业品”，在现实中极为罕见。

比如，名人字画，大多数人会坚定认为这是“手工产品”，但对于一些在网上贩卖的大量产出的“字画”，却很难说是“手工产品”，因为那些几乎都是一个模子印出来的东西，哪怕真是手写的，

又比如，手机这种东西，说是“工业品”几乎没有争议，但细想一下，手机外形和电气设计、手机 UI 设计，手机功能设计，包括生产线上组装，又有哪些缺得了“手工”环节。

当然，这里我也有“偷换概念”的嫌疑，我们讨论一个问题的前提，首先是基于一致的概念，否则就是“鸡同鸭讲”。

但很遗憾，实际上我们对于“工业”和“手工业”的区分，远远没那么清晰。

有的按工农业名录来区分，有的按生产规模区分，有的按是否有机器参与进行区分，有的则直接按照自己个人想法判断。

比如我前一阵子写了篇文章《为什么还有人在用20年前的电脑》，里边提到的 ThinkPad X210Ai 实际就是个人作坊式的小公司，通过定制电脑主板采购最新零配件，将20年前的老电脑进行翻新出售。这种产品，一般我们可以认为是“手工业产品”，但它每个零部件都的的确确是工业生产出来的，说是“工业品”好像也没什么问题。

这种纠结的情况，或许也只有人类的意识中会产生，Ai 显然不会。

Ai 写作无法创造知识增量

现实中，当提到“Ai 是否会取代人类创作？”这种问题时，很多人第一时间就会指出，Ai 只是对现有知识的整合，它无法提供“信息增量”。

从某种程度来看，这个命题确实正确。

Ai 的核心机制是基于海量数据训练的模型，通过统计概率来预测和生成文本，本质上是在“重组”已有的信息，是一个对语言文字规则进行计算的工具，而不是从零创造新知识。

但也有人质疑。比如，按照维特根斯坦所说，语言的边界即世界的边界。理论上，Ai 语言与人类语言没区别，它本身就是基于人类语言的组合，按道理，Ai 也可以摸到人类世界的边界才对。即便现在的 Ai 算力不够，只要持续加大算力，总有能穷尽的那一天。

我之前在《Ai投资或将把美国拖入另一场反恐战争的泥潭》文中曾提到，目前 Ai 主要就是解决一个问题：把人类自然语言翻译成“机器能懂的语言”（如代码、API调用、数据表、向量等），再把程序和机器语言翻译回人类能懂的语言（包括文字语音图像等）。

也就是说，人类创作出来的 Ai，实际上只能提供有限的创作能力，它严重依赖人类本身的信息输入，也就是“规则设定”，依照这种“规则”做若干方向的语言预测，并选取一条按照既有规则看上去最优的方案。

Ai 实际上根本做不到“穷举例”，实现刘慈欣《诗云》一样的效果。毕竟一篇《滕王阁序》这样只有 773 个字的文章，如果真要在 Ai 知识库中没有这篇文章的前提下，靠穷举文字写出，那恐怕消耗完整个宇宙的能量都无法做到。

不过，如果只是让 Ai 写一篇类似文章，似乎并不是什么难事。即便达不到《滕王阁序》的高度，达到七八成总是可以的，甚至在一些常见题材中，做到 9 成以上也不是不可能。

毕竟，即便是《滕王阁序》，其中也有不少对历史典故的整合和前人词句的仿写，比如最著名的那一句“落霞与孤鹜齐飞，秋水共长天一色”，有人就怀疑是仿写自庾信《马射赋》里的“落花与芝盖齐飞，杨柳共春旗一色”。事实上，《滕王阁序》中确实有不少句子风格与庾信的《哀江南赋序》类似。

重要问题在于，人类在使用 Ai 时的“输入的规则”是否为增量信息，而不在于 Ai 自身是否能创造增量信息。

比如，我在之前在研究 “全球清廉指数”这个榜单是如何造假的过程中，在没有 Ai 工具的参与时，我只能凭经验判断这个榜单存在严重问题，虽然也有一定的说服力，但总觉得欠缺些什么。

后来，我将那些数据输入给 Ai 进行校验，它帮我用了包括质数陷阱检测、数值指纹分析、响应量词分布检验、回答组合频率分析、极值检验、动态波动分析、Benford定律验证和分维度离散度检验等 10 来种方法，确定了这些数源高度疑似造假，给出了“非自然一致性已达到统计学上不可能自发形成的程度”“数据真实性概率低于百万分之一”等结论。这些方法都毫无疑问超出了我的知识储备，是更科学的方法。

也就是说，以往被西方奉为圭臬这个榜单，实际上已经被 Ai 打假。但从网络搜索结果来看，除了我那篇文章在质疑“全球清廉指数”造假，再也没有第二篇这样的文章。

这毫无疑问就是 Ai 在间接帮助我们创造知识增量。

但是，这种创造具有很大的不可预知性！

以上边提到这篇关于“清廉指数”的文章举例，我在文章最后一部分的“数据分析”时明确提到，这些分析内容是借助 Ai 分析的，因为我不懂那些数学分析工具，无法判断结果对不对，只能依据常识推断，这种分析“可能有道理”。毕竟，我就是看到那些异常数字才让 Ai 去分析，在这种刻意引导下，Ai 出错的可能性也不小。

Ai 无法真正“理解”内容，一切都归结为数学计算，

它的局限性在于严格依照逻辑和推理输出内容，哪怕是一个荒诞的命题，他也能拉回到比普通人稍高一点的逻辑水平。

不过，这不意味着 Ai 的逻辑就“正确”，我在研究各种问题的过程中，经常跟 Ai 反复“拉扯”，有时候一个问题要拉扯几十次才能掰回来，好在国产 API 价格便宜，要像 claude Opus 那种价格，真是撑不住（但也挡不住确实好用，很多复杂代码一两次就能搞好）。

情绪价值是人类文字的灵魂

如果说知识增量是写作的“骨架”，那么情绪价值就是作品的“灵魂”。

大部分人认为人类写作之所以难以被 Ai 取代，正是因为它承载了情感、共鸣和个人温度，这些是 Ai 模拟不来的。

Ai 生成的文字往往显得中规中矩、缺乏个性。它可以模仿某种风格，但难以捕捉到人类情感的细微波动。

比如，一篇人类作者的散文，可能因为作者的亲身经历而充满独特的感悟和情绪张力，让读者产生强烈的共鸣。但 Ai 的输出永远都是预设的模板拼凑，虽然逻辑严谨，但缺少那种触动人心、引发读者共鸣的温度。

此外，情绪价值还体现在作者的立场和态度上。人类写作往往带有主观色彩，能激发争议或辩论，这正是阅读的乐趣所在。

但 Ai 为了“中立”，通常避免极端观点，导致内容平淡无奇。读者在人类文字中感受到的不仅仅是信息，更是作者的个性、感官或情绪，这些元素构成了连接人与人之间的情感桥梁。

总之，情绪价值让人类文字不只是“信息”，这也是为什么“零 Ai 写作”在读者眼中更有信赖感。

它提醒我们，写作的核心在于传递人性，而非单纯的效率。

Ai 文字的边界在于“认识世界”，人类语言的意义在于“改造世界”

不难看出，当下的 Ai 作为一种先进工具，其实更多的作用是帮助人类“认识世界”。

Ai 通过数据模式描述事实、总结知识，帮助使用者更好理解这个世界。

它擅长处理海量信息，提取关键内容，提供较为正确的观点，但这些都基于现有数据，无法跳出框架去挑战或重塑现实。

但人类语言的真谛在于“改造世界”，它不只是工具，更是人类社会生活实践的载体。

人类通过语言表达诉求、提出理念、推动变革，这些往往涉及矛盾转化，涉及因果关系，涉及普遍联系等领域。

比如，矛盾。众所周知，矛盾是普遍的，是无处不在的。但在 Ai 世界里，矛盾被显著弱化，甚至被刻意消除。Ai 的设计原则是追求一致性和逻辑性，如果输出存在内部冲突，它可能会被视为错误而优化掉。毕竟，如果 Ai 都能输出一个本身存在“矛盾”或“争议”的观点，显然与其“工具”定位不符。

例如，我之前写过一篇关于“某个行为需要入刑”的文章，核心观点是需要依照形势发展需要，对现有法律规则进行修正，但在将文章提交某平台的 Ai 审核后，该平台 Ai 直接指出，这篇文章观点“因与现行法律相冲突”属于“严重违规”，最终那篇文章我没有在某平台发布。

这也进一步验证了我之前在《如果法律不阻止，Ai 奴役人类的局面可能会加速到来》一文中的判断。

当 Ai 进一步渗透到社会方方面面时，人类的其他行为也很可能不得不随时面临 Ai 的分析。此时，人类将不得不刻意调整自己言行表达，以“迎合” Ai 对自己的评价。

就连人类发言都可能需要面临 Ai 审查，更何况 Ai 自己产生的内容。Ai 在设计上避免输出可能引发社会动荡或伦理争议的内容，这让其停留在“安全区”内，无法像人类语言那样推动革命或改革。

另外，人类语言能表达抽象的、直觉的东西，类似维特根斯坦笔下“不可说”（what must be shown）的语言，这些往往超出数据模式。比如，最近某个数千万次观看量的视频中，很多人都在刷“人民万岁”，如果不理解那种情境，根本不知道这句话是什么意思。哪怕用 Ai 分析，也很难得出正确的结论。

归根到底，Ai 写作的边界在于此：它停留在“可说的”（what can be said），而人类语言可以自然触及“不可说的”，如情感、伦理、创新、矛盾和争议。

这些元素让人类语言成为社会发展的引擎，认识到这一点，我们就能更好地区分 Ai 内容，并珍惜人类创作的独特价值。

如何识别文章是否为 Ai 生成

最后，回到本文主题，如何区分文章是否为 Ai 创作？

坦白说，这个问题确实很难。随着 Ai 技术的进步，尤其是那些经过精细调优和人类编辑的 Ai 生成内容，越来越难以一眼辨别。

比如，我前一篇关于《治安记录封存为何必要》的文章，虽然格式上看起来像 Ai 写的，短句子、列表格式、结构清晰以及 emoji运用，但那篇文章之所以搞成那样，完全是因为当天我被系统“首次”删除了一篇文章所导致。

因为都是同一类主题，我不得不考虑在发布这篇文章之前，先找平台 Ai 帮我判断一下到底能不能发，不然发出去就被删掉，实在有点难崩。

在我重新写了这篇文章后，在平台 Ai 的提示下，我按它提示尽可能使用短句子和列表格式来优化手机阅读体验，然后让 Ai 帮忙排版，最终它将我原来 3000 字的原稿压缩为 1200 字，成了现在那个模样：“非常 Ai”。

但毫无疑问，那篇文章确实是我写的。Ai 只扮演了编辑和优化的角色，而不是内容创造。相信但凡看过评论区的读者也能意识到这一点，在那篇文章背后，我光是回复评论、私信，都已经七八千字（很多评论在我回复后，原评论就被系统删除了，还有好多次是在我好不容易编辑完回复发出时瞬间消失Orz…）。

这种情况说明，单纯靠表面特征如句子长度、结构标准化或词汇重复率来判断，往往会出错。

Ai 可以模仿人类风格，人类也可以借用 Ai 工具来“Ai 化”自己的作品。甚至，有些 Ai 检测工具本身就不可靠，它们可能会将人类写作误判为 Ai 生成，反之亦然。

那么，是否就意味真的无法判断呢？

我想，还是回到我前边分析内容。

一看个人直觉与整体感觉。Ai 内容往往给人一种“完美却空洞”的印象。逻辑流畅，但缺少个人印记。读完后，你可能觉得“信息齐全”，却没有被触动或启发。这是一种主观直觉，需要积累阅读经验。

二看是否提供信息增量。是否有真正的理解或独特视角，如果内容只是现有信息的重组，没有原创分析或跨领域连接，很可能是 Ai 生成。反之，如果有基于个人经验的增量知识，就更倾向于人类创作。

三看是否能够提供情绪价值。人类文章往往有温度、幽默、愤怒或矛盾，这些能引发读者共鸣。

四看是否出现矛盾和提出问题。Ai 倾向于避免冲突，输出中立、客观的内容。如果文章大胆挑战现状、包含内部张力或伦理讨论，更可能是人类手笔。但在某些平台，这种判断也可能“失效”，因为有争议的内容，特别是可能产生对立的内容，都被系统自动阻断了，判断起来也就比较麻烦。