欢迎访问
第五产业 >> 知识技术支持 >> 计算机:会听会看能思考

计算机:会听会看能思考

作者:记者 詹媛

20121120  来源:光明日报  

 

  走在大街上,你能从车流声、叫卖声、音乐声中分辨出同伴的絮语;随意扫一眼,各家店铺的商品就一目了然……对于人类来说,识别图像、语音和文本信息,再据此决定自己的行为,并不是难事。可如果将这一任务交给计算机来完成呢?尽管现代计算机的运算速度早已令人类无法企及,但在处理这些可被人类直接感知和理解的信息方面,计算机的能力却远逊于人类,也许连幼儿园的孩子都不如,中国工程院院士郑南宁说。正因为如此,国家自然科学基金委员会设立了重大研究计划——“视听觉信息的认知计算,希望借鉴认知机理和数学等相关最新研究成果,建立新的模型和方法,提高计算机对这类信息的理解能力和处理效率。

  无人车考验计算机理解能力

  在看到图像,听到语言时,人类的大脑如何从庞杂的信息中择取对自己有用的信息,理解这些信息的含义,并以此来主导自己的行为?这是一个至今仍让科学家不断追索的问题。然而,在大量不可预测的人类行为中,总有一些人类行为是符合逻辑的,这意味着,我们可以根据一些预先设定好的,大家共同遵守的规则,对这类行为进行事先的推理。比如,当你开车在路上遇到了红灯,或者看到了写着字的交通标志牌,这个时候,对你接下来行为的推理,就是你会停车

  在视听觉信息的认知计算重大研究计划项目组的科研人员看来,按照交通规则驾驶车辆行驶,是适合计算机模拟的人类行为,因为这个过程符合逻辑推理,也比较容易验证模拟的结果——如果在红灯时停车,绿灯时前行,遇到行人时会避让,这就说明,对于视觉图像的获取是准确的,对这个图像所传达信息的理解是正确的。

  正是基于这样的理解,在视听觉信息的认知计算这个重大研究计划中出现了无人驾驶汽车,随之诞生了中国智能车未来挑战赛。尽管人们极为关注每一辆无人驾驶汽车在比赛中的表现,但在重大研究计划中,无人驾驶汽车所扮演的角色并不仅仅是中国智能车未来挑战赛中的选手,它们有更重要的任务——验证图像与视觉信息的计算、语音与听觉信息的计算、脑机接口这些方面的研究成果。

  大脑控制无人车

  在近日举办的第四届中国智能车未来挑战赛中,有14辆汽车前来参加比赛,每一辆无人驾驶汽车都装有摄像机,顶部有激光雷达,有些雷达还会不停的旋转,这是三维激光雷达,能够探测到360°范围内的物体。这些汽车的后备箱里装着一个大箱子,这是智能驾驶装置,由计算机系统组成。

  无人驾驶汽车就是一个四轮机器人,摄像头和激光雷达是眼睛,智能驾驶装置相当于大脑郑南宁说,在比赛中,如果遇到突发情况,无人驾驶汽车需要完全依靠自己的大脑来判断处理——摄像机和激光雷达会将拍摄到的环境数据信息传输到智能驾驶装置,对这些信息整合处理后,智能驾驶装置会对汽车目前所处的环境作出判断,并发出让汽车前进、加速、转弯、停止、绕行等指令。

  让无人驾驶汽车能听、能看,能思考、能判断、能有所行动,这是一个信息科学、生命科学和数理科学相互交叉的领域。这需要研究人类的大脑如何在运动的状态中抓取图像信息,并进行分析,还需要研究构建新的计算机模型与计算方法,然后将这些模型转化为计算机语言。这些研究最终将提高计算机对非结构化视听觉感知信息的理解能力和海量异构信息的处理效率。

  除了应用在无人驾驶汽车上,视听觉信息的认知计算重大研究计划的成果还有其他的用途,例如,基于有关视听觉信息融合的模式识别技术,出现了一种新的视频信息检索和网络敏感信息检索技术,它可以识别视频信息中的图像和语言,对视频信息搜索的查准率比同期国外最好水平高5%—10%

  计算机的视听觉本领不断提高

  第四届中国智能车未来挑战赛在设置比赛起点时,就与上一届有所区别,悄无声息的红绿灯取代了发令枪。这实际上是对无人驾驶汽车图像识别能力的考验——当红灯变为绿灯时,每一辆无人驾驶汽车需要自动识别出交通灯的状态,并在绿灯亮起后8秒钟的时间内,向前行驶。

  在第四届中国智能车未来挑战赛的赛场,还有模拟行人过马路、模拟施工道路,模拟雾天天气等障碍,在到达终点时,无人驾驶汽车要能识别路旁写着字的交通标志,并在这里停止行驶。与上一届比赛相比,第四届中国智能车未来挑战赛还新增加了乡村公路赛区,同时增加了考核的难度。

  设置这些障碍是希望研究在各种光照条件下,特别是在雨、雪、雾和黑夜等条件下,无人驾驶车辆的智能驾驶装置对道路交通标志和图文信息的实时检测、识别和理解技术。郑南宁说,这些无人驾驶车辆可能还要面对褪色,变形污损的交通提示信息和目标文字信息,并对这些信息进行实时检测,识别和语义理解,这需要有较高的检测,识别和理解能力。

  尽管增加了难度,但视听觉信息的认知计算重大研究计划专家组的成员对比赛结果却比较满意——来自军事交通学院的参赛车辆在3.38秒的时间内就识别出了绿灯信号,在乡村道路的行驶中,这辆汽车也独立跑完了全程,没有经过任何人工干预,来自西安交通大学的参赛车辆也表现不俗,在遇到模拟的行人时,能够及时识别并避让……“有些无人驾驶汽车表现非常好,这说明重大研究计划资助的相关研究有一定进展。专家组成员之一,清华大学教授孙富春说。

  链接:

  懂你的计算机

  美国纽约宾厄姆顿大学的计算机科学家尹立军致力于让计算机识别人类的表情,并据此调整自己的表现。目前尹立军在这一领域的研究大多以计算机视觉为中心。尹立军最为感兴趣的是让计算机直接看到用户,最好让计算机能懂得:当你看它时,你想让它干什么。

  通过对100个实验对象的脸部3D扫描,尹立军的团队已经建立起了包含2500个面部表情的数字数据库。不过,目前数据库中的表情只有六种类别:愤怒、厌恶、恐惧、喜悦、悲伤和惊讶。尹立军希望自己研究的算法不仅可以在视觉上对这六种表情进行简单区分,还能识别它们之间的微妙变化。目前这个数据库是对非盈利研究组织免费开放的。

  这一研究不仅能用于开发懂你的电脑,还有懂你的医疗设备——万一哪天被病痛折磨的说不出话来,计算机会读懂你的面部表情。另外,它也能用于帮助自闭儿童学会识别他人的表情。

  计算机同声翻译

  近日,微软首席研究官里克·拉希德在天津演示了一项新技术——对着新研发的语音识别、翻译和生成系统说了8句英语,系统随即模仿他的语调翻译成普通话,虽然翻译的普通话听起来有点伦敦音,但每句话的意思基本都得到明确表达。

  微软方面介绍说,这一技术的工作流程大体是:系统通过接收语音,识别说话者的声调和语言,建立模型;将这些语言翻译转换;一次性用另一种语言输出,再由同样的人声表达。

  据拉希德透露,计算机同传实现的关键在于微软研究院和多伦多大学的研究人员取得了一项突破——利用模拟人脑行为的深度神经网络技术,提升了语音识别器的辨识能力。拉希德说,通过这种人脑仿生技术,微软的语音识别错词率较以往降低了30%,以前每45个单词中便有1个错词,如今78个词中才错1个。错词率的降低被视作计算机同传技术中决定性的改变。

  通过计算机实现原声同传,是微软在计算机语音识别技术上的重大进展。拉希德表示,希望再过几年,能够打破人与人之间的语言障碍

 

更新时间:2012-11-22 15:34:10
评论列表
评论/留言区
您好,请在下面输入您想发表的评论内容。
 
知识技术支持 知识产品、技术集成产品、新技术支持方案
首页 < (1/31 共 1374 篇) > 末页
技术转移 一般管理 建筑保温材料 农林 茶叶 太阳能 仪器仪表 农业 育苗 建筑施工机具 家居日用品 安全 标识 安全防盗装置 安全座椅 工业新工艺 节能照明 医药新品种 组方新药 半导体照明 体育器械 高性能分离膜材料 生活旅游用品 安全报警器 动力能源传输开关控制技术 风力海洋生物能源技术 安全保险装置 安全用电保护 工业 净水器 冶炼与铸造技术 医疗器械 材料 亲水性材料 装饰材料 工业安全控制 可控温节能技术 发电装置 生物基材料技术 农业机械 食品安全加工技术 家居洁具 保健 低碳设计新型 建筑材料地板 建筑陶瓷 环境净化 信息安全技术 空气净化 林业器具 传感器及其应用 家居环境水电卫生装置 家居饮水机 清洁能源技术 电池 先进复合材料 服装面料 材料 导电纤维 服装功能性材料 建筑阻燃材料 新医术 银行管理 诊断方法 人身安全技术 材料管材 工业机械锅炉 工业摸具 生活用品 农业 机械 安全防滑带 建筑设计新型 文化艺术工具 工业机械挖掘机 家用电器 商品包装和贮藏技术 工业自动机床 工业配件 供热能源 建筑框架材料 动物养殖技术 新型或微观马达和发动机 公共安全技术 发电技术 食材制作与存储 特殊环境建筑设计新型 低碳排放技术 农牧兽医配方制剂及服务技术 信息技术信号与编码 启动开关控制 环保设备 工业交换器 家居文化艺术 家居新技术 城市服务网络 娱乐及玩具器具 工业汽轮机 工艺设备机具 诊疗改进技术 科技种植 人体健康功能恢复医术 监测传感器 非金属建筑材料 传统革新技艺 安全保护品 糖果及酒类制品加工技术工艺 建筑施工技术 建筑设计新型 文化体裁制作技术 野外勘探技术 新技术车辆及配件 品种产业化技术 为保护财产和人身安全的服务方案 工业库存与调度 医疗技术和硬件新技术 系统装配技术 服装设计 计算机硬件技术 文化艺术传播技术 安全刹车装置 安全公共管理 面包糕点复合食品 纺织用纱线罩布皮革及填充物 农活技艺 传统艺术 安全与抗灾救护 工业磁仪器 离合装置 环境工程技术 个人活动辅助器具 有关人身健康和提高智力效率的技术 水资源利用技术 包装器械工具 再生资源生产技术 工业汽轮机内燃机 清洁能源技术 保健品 工业新型设备技术 医疗鉴定改进技术 电器终端 教育管理设备器具 运输装备 建筑设计新型 原创制作技术 绿色农林规划 观测观察 化工制剂配方 烹饪设备 天然材料节约技术 工业新工艺 纳米材料 环境工程技术 仓储平台器械工具 安全汽车防盗 自行车自动器个人活动辅助器具 工业磁仪器磁选设备 旅行及户外保护 水电网络 节水农业 水土保墒技艺 家具木、竹、环保制品材料 科技管理技术 技术性医疗方案 体育运动用品设计 医药药材加工储存 保健用品 光电信号技术 脱脂净化 运输设备运筹管理 健身用品 安全标志 安全与抗灾救护 防病思想 服装设计 家务燃灶新技术 自动检测技术 环保家电 防疫技术 环保产品 服装工艺 城市服务设施 家用电器新技术 农业 机具 信号控制传送检测控制技术 家居洁净技术机具 食品标准控制技术 养殖技术 环境 净化 家居 生活用品 安全 保险装置 建筑 设计 管理 食材及添加材料 清洁能源技术 安全与抗灾救护 清洁能源技术 电器终端 建筑设计新型 工业新工艺 环境工程技术 运输设备运筹管理 安全与抗灾救护 服装设计 清洁能源技术 安全与抗灾救护 食品安全加工技术 环境工程技术 量子通讯
 
网络链接(KSN) 友好的连接联盟,让更多人知道你合作成功 大专院校 研究院所 产业公司 科技园区 协会事业 期刊网络 服务博览
本网域名: www.知识产品网.com,www.zhishichanpin.com,知识产品.中国,www.diwuchanye.com,第五产业.中国,集创.com,自版.中国,ipr品牌.中国,cnd5.cn,cnd5.net
友 情
链 接
     网站介绍     服务协议     联系我们