栏目分类
你的位置:开云(中国)Kaiyun·官方网站 登录入口 > 新闻 >

剪辑丨%
东说念主类专注于物体的含义,而东说念主工智能则专注于视觉特征。
在昔时的很多磋商中,比较东说念主类和 AI 中的表征的使命都依赖于全局标衡量量来量化它们的一致性。但若无明确的假定,这些揣度尺度也仅仅讲解对都的进度,而非决定要素。
这就带来了一个很值得念念考的问题:「AI 眼中的『同样图像』和东说念主类大脑的判断逻辑到底有多像?」
来自德国普朗克磋商所(Max Planck Institute)与荷兰奈梅亨达彭丁磋商所(Nijmegen)的几位磋商者建议了一种通用框架,用以比较东说念主类与 AI 的表征。
该磋商以「Dimensions underlying the representational alignment of deep neural networks with humans」为题,于 2025 年 6 月 23 日刊登于《Nature Machine Intelligence》。
张开剩余75%论文连续:https://www.nature.com/articles/s42256-025-01041-7
让 AI 和东说念主类「玩找不同」
此前的很多种对比本质中,多数聚焦于两种系统的举止政策(举例,分类),揭示了 DNN 在泛化性能上的局限性。
当今常遴选的干系总共或讲解注解方差等回归统计量天然在比较表征对都方面有所诱导力,但在未明确假定潜在的对其偏差原因下,这些目标对主要决定属性的讲解注解智商有限。
团队这次确立的框架受到近期深切科学磋商的启发,揭示了多个可讲解注解的 DNN 维度,这些维度似乎反馈了视觉和语义图像属性,况兼与东说念主类发扬得特地一致。
四肢任务,东说念主类参与者和 DNN(VGG-16)需要从展示的 3 张图像(如猫、狗、笼子)中选出「最不同样」的一张,该任务近似东说念主类对苟且视觉和语义类别的分类举止,适应比较东说念主类和 DNN 的对象暗示。
图 1:通过模拟奇偶项任务中的举止方案来捕捉类东说念主 DNN 对象暗示的筹办框架。
接下来,该框架会分析 470 万次东说念主类判断和 2.4 万张图像的 AI 响应,用变分镶嵌本事(VICE)索取「念念维维度」:东说念主类取得 68 维「语义脑回路」,AI 生成 70 维「视觉编码」。
在这些维度中,DNN 镶嵌拿获了图像间同样性总变异的 84.03%,而东说念主类镶嵌拿获了总变异的 82.85%,以及给定数据集训诫噪声天花板的 91.20%可讲解注解变异。
维度相反
接下来团队请参与者为每个维度提供标签用以考据不雅察后果。与其肖似的是 DNN 进行描绘时镶嵌的可讲解注解维度,似乎反馈了对象的语义和视觉属性(语义分类、学问干系、视觉感知等)。
图 2:从东说念主类和 DNN 举止推断出的表征镶嵌。
从后果上看,DNN 的维度不如东说念主类的维度可讲解注解,因其在归类图像上与东说念主类存在全局性相反。东说念主类主如果由语义维度主导,唯有极少混杂维度。比较之下 DNN 主要由视觉信息占据。
为了更进一步探索 DNN 中包含的可讲解注解且可与东说念主类发现的维度比较较的维度,团队使用了 Grad-CAM 生成热图,揭示哪些图像区域启动了 DNN 镶嵌中的维度。
天然 Grad-CAM 能定位 AI 关怀的图像区域,但骨子上已经「视觉特征拼集」,与东说念主类基于概括宗旨的「语义编码」十足不同。举例,东说念主类的「动物」维度对通盘动物图像响应一致,而 AI 的「动物」维度会因布景出现响应波动。
小结
与东说念主类的径直比较裸露, DNN 达到这些暗示的容貌存在很大相反:东说念主类的暗示主要由语义维度主导,但 DNN 则发扬出对视觉或混杂视觉-语义维度的彰着偏好。
DNN 仅近似了东说念主类的语义暗示,同样的举止后果亦然基于不同的镶嵌维度推导出来的。
那么这项磋商的用处究竟在哪?
团队强调开云(中国)Kaiyun·官方网站 - 登录入口,他们的使命有助于集结东说念主类和 DNN 在暗示和举止上的相反,还有助于开辟畴昔的使命,细则东说念主类与 AI 对都的差距,给以更准确的开辟(比如智能识别磨真金不怕火)。
发布于:天津市
下一篇:体育游戏app平台研发与出产数字电视相干家具及通讯家具-开云(中国)Kaiyun·官方网站 登录入口
