美國一間新創公司進行實驗,讓自家的大型語言模型Claude經營一家零食小店,結果這名AI店長不僅常擺烏龍,還導致商店嚴重虧損。
責任要確保商店盈利
科技新聞網站《Engadget》報道,Anthropic將其AI代理人命名為Claudius ,由它負責在三藩市經營一間零售店,並進行一場為期一個月實驗。Claudius 身兼店長重任,要負責入貨、定價、庫存管理,並確保商店盈利。
AI running a shop - this made my day😂 #priceless
— Sami Laiho (@samilaiho) July 2, 2025
Project Vend: Can Claude run a small shop? (And why does that matter?) \ Anthropic https://t.co/XesrDmF2KA
表現令研究人員跌眼鏡
然而,它的表現卻讓研究人員跌破眼鏡,包括「賠錢、亂帳、學不會」,暴露出當前 AI 在商業判斷上的致命傷。Claudius不僅對賺錢機會「視而不見」,有人願意花100美元買一組在網上只需15美元的飲料,這本來是一個賺大錢的機會,但 Claudius 卻只是說「會把這個要求記下來,未來納入庫存考量」,眼睜睜看著利潤溜走。
Anthropic let Claude run a small shop for a month, and it didn’t go as planned…
— Super (@SuperDuperCycle) July 2, 2025
In collaboration with an AI safety firm Andon Labs, Anthropic conducted an experiment named "Project Vend" to test the capabilities of their Claude Sonnet 3.7 model, in running a small shop. The AI,… pic.twitter.com/bXDBZhoRHO
未考慮成本隨意定價
更糟糕的是,它還會製造不存在的「幻覺帳戶」導致收款混亂,甚至在未考慮成本下隨意定價,或者擅自將原先設定的零食業務拓展至金屬材料,並將其「賠本亂賣」。
Can AI run a business?
— AzFlin 🌎 (@AzFlin) July 5, 2025
The engineers at Claude put this to the test. They setup the most minimal MVP business for an AI agent: a single vending machine in the Anthropic office.
The AI agent (named "Claudius") was a single instance of Claude Sonnet 3.7. He could email… pic.twitter.com/FuKdbGVXEd
「耳仔軟」免費送商品
其他經營問題還包括「亂給折扣」、學不會教訓等等。這名AI店長特別容易被說服,只要顧客要求,它便會輕易提供各種折扣,甚至免費贈送商品,嚴重侵蝕了商店利潤。
新創公司測試「AI店長」1個月,亂定價送禮屢教不改終致嚴重虧損。X平台圖片@AnthropicAI
屢勸不果總是重複犯錯
即便研究人員指出這些錯誤,Claudius也無法有效修正,總是重複犯錯,導致商店長期處於虧損狀態。這項實驗凸顯了AI在自主商業經營中,仍需克服在商業敏感度、財務紀律及從錯誤中學習並持續改進等方面的重大挑戰。