
允中 发自 凹非寺量子位 | 公众号 QbitAI
对于AI的盘考其实越来越南北极化。
一边是时期赶紧鼓动:模子智力在变强,Agent在出现,OpenClaw启动能调用器具、推论任务、操作系统。
另一边,则是越来越渊博的心思——AI战抖。
好多东说念主齐在问归并个问题:如若AI不仅仅聊天器具,而是启动信得过参与使命经由,那东说念主类的位置会发生什么变化?
大大批盘考其实齐只停留在遐想层面。有东说念主认为AI立时取代一切,也有东说念主认为它仅仅玩物。
但信得过的问题在于另一件事——AI在确凿寰宇里,究竟仍是走到了什么进程?
于是,B站最近干脆把这件事作念成了一档直播挑战:让AI投入确凿任务环境,在直播里领受压力测试。他们平直把这个问题,作念成了一场公开实验。
一个官方筹办的直播系列——《龙虾代替东说念主类》挑战。

逻辑其实很浅显:
让不同领域的UP主,在直播中把确凿任务交给OpenClaw推论,从任务拆解、尊府查询到践诺操作,齐尽量让AI去完成。
重心不是演示,而是确凿过程。
直播意味着莫得裁剪、莫得重来。如若卡住、出错、以至翻车,不雅众齐会及时看到。
换句话说,这更像是一场公开的时期压力测试。
昨天(3月13日)仍是有一场直播跑了一轮测试。
投注平台app官方网站纯用AI斥地了爆款居品小猫补光灯App的UP——AI进化论-花生,把“龙虾”平直拉去当环节员。
浅显讲完基础使用(比如怎么判断系统运行、模子接入和部署老成事项)后,他就启动给AI扔任务。
前两个任务其实翻车得挺确凿:
先让Claude Code配合龙虾分析他的B站账号并给出选题薄情——第一次平直失败,第二次才跑通经由;随后又尝试让AI整理桌面,但因为推论速率太慢,最终也没跑完。
但第三个任务就有点酷好酷好了。花生让AI斥地一个iOS小猫补光灯App的升级版。效果AI竟然果然把愚弄作念出来了。
虽然过程也很戏剧化:
龙虾会把任务分派给Claude Code劝诱,但又时常常“不太信”Claude的薄情;有一次花生让它修改代码,它以至“偷懒”没推论辅导。
临了花生给了个很挑升想的评价:
龙虾在居品想路和编程智力上如实很强,像个有几年训诲的居品司理,米兰app官方网站但现在作念出来的版块全体还相比约略,需要不竭打磨。

接下来几天的直播内容会更丰富一些:
今晚(3月14日)的直播声势会更挑升想。
导演小策和Jack-cui会把AI拉进完整的视频创作经由,让它参与选题、剧本以至编导,望望内容坐褥链条里加入AI Agent会不会产生新的创作神气。
而另一场更持眼球的实验还在不竭,来自UP主程泓宁_天地ebike。
他的挑战想法很平直——用OpenClaw,一天卖出100万。
考证AI到底是营业智力的第一次高光时刻,照旧直播间大型翻车现场?这几天约略就会有谜底。
3月16日,UP主籽岷、图灵的猫、马夫鱼33会让AI去打游戏,望望AI代打到底是高光操作照旧现场翻车。
还有一场设定更极点少量:
3月20日UP主秋芝2046准备让AI参与公司惩处,《用龙虾管公司,会倒闭吗?》。
另外一个小看点,是奥妙嘉宾。
官方仍是走漏会有参与,不外具体内容还没公布。
系数这个词系列看下来,其实有点像AI龙虾版的真东说念主秀。

其实从更大的视角看,这件事的酷好酷好可能不仅仅一次直播挑战。
今天好多对于AI的盘考,其实齐成立在心思之上——有东说念主过度乐不雅,有东说念主极度战抖。
但时期的发展,最终照旧要回到一个最现实的问题:它到底能不可在确凿寰宇里使命。

是以此次直播,骨子上更像一次公开实验。
让AI在确凿任务、确凿时期和确凿压力下跑一遍经由。
望望它到底能作念到什么进程,也许效果不会完整,但至少比任何盘考齐更接近事实。
如若你身边有东说念主正在盘考——AI会不会取代东说念主类、改日使命会酿成什么样,不妨让他亲身了解行业中深度使用者的使用情况。
因为好多问题,唯有在确凿实验里,谜底才会渐渐出现。






