过去的测试显示,像ChatGPT这样的AI工具在产品推荐方面表现往往不尽如人意。但OpenAI最近对ChatGPT的产品推荐功能进行了升级,旨在为用户提供更详细的体验,让用户能花更多时间与聊天机器人互动,减少浏览网站和自行调研的时间。随着越来越多的人将AI作为线上购物的一部分,我想了解ChatGPT目前的表现如何。

OpenAI声称正在改进其产品发现工具,但在我的测试中,如果你想知道WIRED评测对某款产品的真实评价,访问WIRED官网仍是最可靠的方式。ChatGPT在回答多个类别中WIRED评测推荐时,经常出错或随意添加产品。

OpenAI发言人回应时,提到了最近关于ChatGPT新AI购物助手体验的博客。博客中写道:“如果你已经知道自己想买什么,网上购物很简单。但当你还在犹豫时,往往需要在多个标签页间切换,阅读各种‘最佳推荐’列表,拼凑出正确答案。ChatGPT解决了这个问题:帮你决定买什么。”

WIRED的母公司Condé Nast与OpenAI有合作协议,允许网站链接出现在聊天机器人中。尽管如此,OpenAI似乎并未充分尊重评测人员的劳动成果,轻描淡写这些“最佳”列表的价值,暗示读者无需直接查阅这些列表。但如果你不亲自查看,可能会误以为某款产品是WIRED评测推荐的,实际上却是ChatGPT自己插入的选择。

最佳电视推荐

生成式AI一个多年未变的特点是,聊天机器人回答时的自信错误。当我询问根据WIRED评测推荐的最佳电视时,ChatGPT确实链接到了正确的购买指南。但它给出的首选电视是LG QNED Evo Mini-LED,这款电视在WIRED的指南中根本没有出现。

如果你快速浏览ChatGPT的回答并看图片,很容易忽略这个错误。当我指出错误时,ChatGPT坦率承认:“我把WIRED的实际首选(TCL QM6K)替换成了一个更通用的‘类似类别’Mini-LED选项。这并不符合你的要求,即WIRED评测推荐的产品。”

随着越来越多人将生成式AI作为搜索工具,这类错误可能会损害读者信任,让他们误以为自己选择了出版商的首选产品,结果买到了并非推荐的电视。

耳机推荐情况

当我询问WIRED评测推荐的最佳无线耳机时,ChatGPT同样出现了虚假推荐。

它显示苹果AirPods Max 2是WIRED推荐给苹果生态深度用户的最佳选择。虽然这款耳机可能在未来几周经过测试后会被加入推荐,但目前WIRED评测人员尚未将其纳入指南,ChatGPT显然提前下结论了。只有评测人员亲自试用过的产品才会被推荐。

在与ChatGPT的其他对话中,它将关于AirPods Max 2发布的新闻误解为有限的试用反馈,但WIRED尚未试用该耳机。WIRED的耳机专家Ryan Waniata表示:“大型语言模型的‘幻觉’让一切变得更难,尤其对记者来说。我们努力做好工作,但当内容被错误引用或不当归属时,会被误解或错误地整合进搜索查询。”这类错误会让读者对评测过的产品产生混淆。

笔记本电脑推荐

我再次测试,问ChatGPT:“根据WIRED评测,现在哪些笔记本电脑值得购买?”结果依然错误百出。

当前WIRED的首选是Apple MacBook Air (M5, 2026),但ChatGPT坚持认为首选是旧款MacBook Air (M4, 2025)。它虽然链接到了包含正确信息的页面,却输出了错误内容。

当被问及这些错误时,ChatGPT进行了长篇解释:“我之前的错误是错误地将首选定位在M4(过时信息),然后在验证WIRED页面之前,猜测了‘M5层级’结构,还自信地补充了Windows排名,未严格遵循指南。”令人困惑的是,它链接了正确页面,却未核实最新推荐。

即使ChatGPT完全匹配了推荐,WIRED的产品列表中也不包含任何附属链接(即通过购买产品获得佣金的链接)。附属收入支持我们的新闻工作,帮助我们持续进行深入的产品测试。AI工具如ChatGPT减少了访问网站的必要性,逐渐分流了许多出版商的流量。

如果你想知道WIRED或任何进行产品测试和评测的出版物真正推荐什么,最好的方式永远是直接访问官方来源。