全部语种
分享
据报道,苹果无视工程师对其有缺陷的苹果 Intelligence的警告,继续发布该技术,获得了令人失望的市场评价。
这家iPhone制造商的Apple Intelligence因错误的原因成为头条新闻,并受到了广泛的批评,特别是编造虚假信息和搞砸新闻头条。
虽然大型语言模型产生幻觉是很常见的,但人工智能行业尚未解决这一挑战,苹果的情况有点不同。工程师们在模型发布之前发现了一些深层次的缺陷。然而,该公司无视这些警告。
据分析人士称,在对其人工智能的巨大缺陷发出警告后,这家科技巨头继续发布该模型是鲁莽的。这些警告是通过学习去年10月发布。
尽管尚未经过同行评审,但在测试了人工智能行业一些顶级LLM的数学“推理”后,该研究还得出结论,这些模型不会推理。
为了测试这些模型,工程师们让它们解决了广泛使用的数千个数学问题GSM8K数据集,这是行业的基准。
根据Futurism的说法,数据集中的一个典型问题是:“詹姆斯买了5包牛肉,每包4磅。牛肉的价格是每磅5.50美元。他花了多少钱?”
工程师们通过简单地改变问题中的一些数字来暴露人工智能模型中的差距,以避免数据污染。这导致所检查的20个LLM中出现了一些小但明显的不准确之处。
然而,当研究人员通过更改名称和添加一些“无关的细节”更进一步时,结果是“灾难性的”,高达65%。
研究人员写道:“这揭示了模型在识别相关信息以解决问题方面的一个关键缺陷,可能是因为它们的推理在常识术语中不是正式的,主要基于模式匹配。”
据研究人员称,每种模型的结果都不同。OpenAI的01预览版下降了17.5%,其前身GPT-4o下降了32%。研究人员指出,即使是“最聪明”的模型也面临着问题,并表现出一些严重的缺陷。
测试还证明,人工智能模型在解决问题方面可能看起来很聪明,但一旦它们没有逐字复制某人的家庭作业,它们就会陷入困境。至于Apple据报道,这家科技巨头知道测试结果,但将其模型推向市场。
经过市场的强烈反对,包括英国广播公司对该车型发布误导性信息的担忧,苹果最终暂停程序直到它能够修复它。
苹果的人工智能功能原本预计会总结新闻通知,但它有时会自己编造新闻,这让读者和新闻出版商非常不满。
其中一条不准确的新闻提醒称,拉斐尔·纳达尔是同性恋,一名被指控杀害美国保险公司老板的男子开枪自杀。苹果的人工智能也不准确地总结了BBC的应用程序通知,声称卢克·利特勒在PDC世界飞镖锦标赛开始前几个小时就赢得了比赛。
1月6日,《纽约时报》发表了另一篇关于国会山骚乱四周年的错误报道。
苹果在给英国广播公司的一份声明中表示:“苹果智能功能处于测试阶段,我们正在用户反馈的帮助下不断改进。”。声明称:“未来几周的软件更新将进一步澄清显示的文本何时是Apple Intelligence提供的摘要。我们鼓励用户在查看意外通知摘要时报告问题。”补充.
苹果的错误功能是12月向一些新iPhone用户发布的人工智能工具之一,包括iPhone 16、15 Pro和15 Pro Max手机,以及一些iPad和Mac。
在90天内找到一份高薪的Web3工作:终极路线图