人工智能面临测评挑战

  • 打印
  • 收藏
收藏成功

ChatGPT、Gemini和Claude等先进的人工智能工具存在一个通病,即我们并不能准确判断其智能程度。

这是因为,与汽车、药品或婴儿配方奶粉等产品不同,人工智能模型在上市前不需要送检。AI聊天机器人没有经过任何标准的认证,也很少有第三方独立机构对它们做严格测试。

相反,我们只能听信人工智能公司的说法,而后者经常用诸如“改进了哪些功能”等含糊不清的说法来描述不同版本AI模型之间的差异。(剩余1769字)

monitor