人工智能的星星之火必将燎原
人工智能的星星之火必将燎原
再者,还需要识别对应群组的属性,然后将其与文章内容进行匹配,然后以一定的频率不定期发送。
这样一个应用程序有三个核心部分:一个部分负责调度大型模型,负责扫描和生产内容; 一部分是日常工作,比如发布文档的原则,另一部分是结合实际。
感知现实,基于大模型生产内容,然后将内容反馈到现实世界,并在浏览过程中嵌入盈利链接。
典型的新型智能本机应用。 只是很难想象它会以这样的形式出现。
上面提到的结构很可能和之前提到的Agent结构有80%的相同:
与过去的申请相比,有所不同
从技术角度来说,基于过去的技术,不使用大模型也不是不可能做到,特别是对于做爬虫的人来说。 但以前这样赚钱是很难的。 (到现在我也不知道这个东西能不能赚钱,我很想找到这些家伙问问他们的情况,但这只是骚扰我几天的代价)
原因很简单:当AI还不够成熟的时候,你实际上不可能产生那么多订阅号的文章,而且都是匹配实时热点的。
所以这种应用确实是一个新的应用类别(当然也可以称为Agent)。 它从感知到生产再到盈利的整个场景是一个闭环。
从我们常说的图灵测试2.0来看:它可以在一个完整的业务场景上闭环,不需要人工干预,几乎完全自动化。 行动的结果可以产生收入。
一旦这个场景建立起来,这个应用就可以拿走这个场景对应的智能边界内的价值。
做上述应用的同学可能不会像我一样战略出身,每天都在思考套路。 如果他们认为自己能做到,他们更有可能只是去做。 现在还很少,但是当广大产品和程序员同学意识到建造这样一个东西的成本可能和一次旅行差不多时,估计会有越来越多的人去做。
但这种敏锐的感知并不是无限的,通常它最终会遵循套路(通常指从特殊到一般、从一般到特殊的过程)。
上面的例子符合前面提到的例程的要点:
纯数字空间,幻觉影响不大,通过图灵测试2.0等。
智能本机应用程序不是 AIGC 工具
仍然有必要区分此类应用程序和纯粹的内容生成工具。
虽然都叫AI,但本质上是不同的。
AIGC 工具本质上是由算法驱动的,并且只有少数人在合适的时间和地点才能使用。 商业模式的运作极其困难。
智能原生应用的关键在于应用,是融合技术后的产品力。 这个产品的力量必须能够突破最后1毫米的屏障。 事实上,大多数人都可以做到并赚到现金流。 这件事我们并不陌生,当年的APP不也是这样吗?
过去,英国人在一战期间发明了坦克,但坦克的真正发展却要等德国人拿出闪电战来。
AIGC 工具和智能原生应用程序之间的区别是相似的。
AIGC 工具是坦克,每个智能原生应用程序都是一场独特的战斗。
对于 AIGC 工具来说,模型的独特性是关键。 对于智能原生应用来说,深入研究模型本身可能是有害的。 更需要向外看,准确定位技术与场景的结合。
顺便说一句,智能本机应用程序也不是 GPT。
加上GPT,它实际上是一个超级智能的原生应用,涵盖了最常见的场景。
这就是智能原生应用所隐喻的广阔空间
这种更智能、更自动化的智能原生应用几乎会出现在各个领域。
所以现在刚刚兴起的各种尝试还只是火花。
而且随着大型机型的能力不断提升,火苗只会越来越大,范围也会越来越广。
将从上面极其无聊的场景扩展到方方面面。 现在的时代对于应用来说差不多是1995年,对于移动互联网来说是2007年。
做起来还是很费力,但是是可以做到的。
智能原生应用第一个关键的就是图灵测试2.0。
虽然之前已经提过好几次了,但这里还是要说一下,因为它就像风筝的线,决定了不允许它飘的尺度,但又不允许它飘得太远。
什么是智能本机应用程序和图灵测试
如果没有它们,就不可能开发智能本机应用程序,因为过去没有这样的东西。 如果没有它们,您将无法想象需要如何定义产品。
太票也不行。 太票有点像想开一家餐馆,但后来发现路不通,决定先修路,然后再开餐馆。 (大多数制作智能原生应用程序的人会像那些开餐馆的人,这些人是修路的)。
这需要中等规模。
这个尺度决定生死成败,重要性居第一。
第一个决定某件事在特定时间内是否可行,第二个决定矿井有多大。
回到前面的例子,那个场景其实是可以通过图灵测试2.0的,矿场的大小取决于你的内容生成的质量。
让我们从应用的角度重新描述一下图灵测试2.0。
图灵测试2.0
最初的图灵测试是这样的:
这是一个纯粹的智能测试,其本质是在一个封闭的系统中追求逻辑的自洽。
现在我们将类似代理的概念添加到此测试中:
这就是图灵测试2.0。 与1.0相比,核心区别是什么?
去妄想,有界限。
1.0是一个崇高的制度,理性的幻觉实际上有助于通过考验,但2.0则不然。 测试人员同时接收来自真实场景和被测试者的反馈; 其次,测试边界的界定需要更高的智力深度,这很像赵括,学了兵法,能说会道,但不一定能打; 如果你会打仗,不一定会兵法,但一定会水站、陆战、马站。
还是上面的例子,这个例子中1.0和2.0的共同点是生成的内容必须是可读的,但是2.0的独特之处在于你生成的内容必须符合基本事实,而且还必须具有一些特点和风格,因为你的读者不仅会读你的文章,还会读其他的文章。 纯废话的广告估计点击率会很低。
如果纯粹的废话被认为是个人的,从技术角度来看可以通过1.0测试,但从商业角度来看没有那么有价值,转化率会很差。
自己的领悟
能否通过图灵测试2.0的判断和AIGC能力其实是完美匹配的。
前者定义了技术在业务场景中的价值,而AIGC能力实际上降低了实现成本。
从这个角度来看,技术预先决定了其自身的实现。 这种必然性无论是从因果角度还是偶然角度来解读,都是非常有趣的。
概括
即使你的方向是对的,有能力,但实际去做起来也会极其痛苦,就像在无人区奔跑一样。 但这正是价值所在。 当所有隐性知识都变成显性知识时,大部分商业价值就会消失,就会变成一场摔跤游戏,会很无聊。
最后,如果觉得上面的文章还不够,可以看下面的组合,其实是讲同一件事的不同方面。 我相对确定它们是正确的并且在这个早期阶段具有价值。
本文来自微信公众号,作者:老李花一三,36氪经授权发布。