最新计算机神经网络识别图像达灵长类动物水平
移动用户编辑短信CD到106580009009,即可免费订阅30天中国日报双语手机报。
几十年来,神经科学家致力于设计计算机网络来模拟人类的视觉能力,如认知目标,大脑在这方面精确而迅速,一瞥之间就能认出所见之物。还没有一个计算机模型在识别视觉目标上与灵长类动物的大脑相比。
据物理学家组织网近日报道,美国麻省理工大学神经科学家的一项最新研究发现,最新一代的所谓“深度神经网络”能比得上灵长类动物的大脑。这提高了人们对灵长类大脑工作原理的理解,有望开发更好的人工智能,带来修复视觉机能障碍的新方法,相关论文发表在最近的《公共科学图书馆·计算生物学》上。
新研究指出,目前最好的网络是纽约大学开发的一种模型,在对目标分类识别上能达到猕猴大脑的水平。论文高级作者、MIT脑与认知科学系神经科学教授詹姆斯·狄卡罗说,最新网络的成功表明,神经科学家已相当准确地掌握了目标认知原理。“模型能预测神经反应和物体在神经丛空间的距离,概括了我们迄今最好的理解,让我们知道那些以往神秘的脑区发生了什么。”
早在上世纪70年代,科学家就开始构建神经网络。受大脑分级处理视觉信息的启发,构建了视觉神经网络模型。他们在模型中构造出多个计算层,每层执行一步数学运算。在每一层,图像目标的表达越来越复杂,无关的信息被放到一边。“每个元素都是非常简单的数学式,”论文第一作者、MIT麦戈文研究所博士后查尔斯·卡迪欧说,“但千百万这些元素结合在一起,从原始信号到用于目标识别的表达式之间就形成了极复杂的转换。”
研究人员首先检测了大脑的目标识别能力。他们颞下(IT)皮层和V4脑区植入了电极阵列。再把这些和深度神经网络生成的表达进行对比,深度神经网络由系统中每个计算元素生成的数字矩阵构成。每幅图像会产生一个不同的数组。模型的精确性取决于能否把相似的对象归类到相似的表达集群。
卡迪欧说,这种神经网络最近取得的成功,取决于两个主要因素:一是计算处理能力,尤其是图形处理单元(GPUs)方面的巨大进步;第二是研究人员能访问大型分类数据库,用数据来“训练”算法。
最初,神经网络并不能很好地识别这些图像,但随着它们看的图像越来越多,不断发现错误,精简算法,最终它们对目标物体的识别会变得越来越精确。
目前,狄卡罗实验室打算开发其它模型,模拟图像处理的更多方面,包括跟踪运动、识别三维形状,人类视觉系统中的“反馈”预测等。现有网络只能模拟从视网膜到IT皮层的“前馈”预测,而从IT皮层返回到其余系统的连接是前馈连接的10倍。
热门推荐
更多>图片故事:重庆61岁老人的黑天鹅情缘
青岛胶州湾部分海滩遭泄漏原油污染
国家地理读者最佳摄影作品公布
深圳地铁乘客闯入服务亭抡椅子砸票务员
郑州义工组织冬至请700环卫工人吃饺子
苏格兰湖面出现“飞盘”冰
重庆“光猪跑”迎冬至
南宁惊现梅花桩迷魂阵 100米盲道12个桩等你撞
成都86岁婆婆寒风中卖鸡毛毽为儿子赚医疗费
北京:自由式滑雪空中技巧世界杯
安徽一家六口铊中毒浑身疼痛 疑遭投毒
中国日报一周图片精选:12月13日—19日
各国美女长啥样?好奇女子请全球编辑P照片效果迥异
拍《绝地逃亡》翻艇 成家班摄影师葬身怒海
家人为16岁少年买16块广告牌庆生
北京:中国车模国际交流赛
哈尔滨:世界最高、最长、占地最大的大型雪塑完工
盘点2014年度全球13种最糟糕快餐