来自卡内基梅隆大学的一组研究人员参与Mind's Eye项目, 由DARPA计算机创新办公室赞助, 美国国防部高级项目研究局, 他们创建了智能软件,可以直观地识别视频中的人类活动, 然后预测接下来可能发生的情况.

blank

卡内基梅隆大学的研究人员参加了“心灵之眼”计划, 由美国国防部赞助, 在此框架内,他们开发了能够识别视频中人类活动的视觉智能软件, 并预测接下来可能发生的情况. 这是一个雄心勃勃的项目,有12个研究团队参与其中, 其中包括卡内基梅隆大学, 由DARPA计算机创新办公室赞助, 美国国防部下属的机构,负责开发用于军事用途的新技术.

如 Tendencias21.net 所述, 目标无非是自动化观看和解释视频的工作, 这将节省时间, 改进监测,为研究提供新的工具. 事实上, Mind's Eye技术计划用于民用和军用环境, 应用范围从国防到医疗和消费类机器人. 但是,识别和预测视频中的人类活动并非易事. 据美国国家机器人工程中心报道 (国家注册证书) 卡内基梅隆大学的一份声明, 并非每个人都以相同的方式执行相同的操作; 不同的操作在录音中可能看起来非常相似, 相同动作的视频在外观上可能会有很大差异,具体取决于照明, 观点, 底部, 参与的个人等等.

所以, 需要一个近似于人类视觉智能的系统, “能够过滤和概括观察到的内容,以便根据获得的信息和先前的知识做出决定并采取行动”, 正如研究人员在他们的介绍性文章中所说. 亚历山德罗·奥尔特拉马里和克里斯蒂安·勒比尔, 两人都来自卡内基梅隆大学心理学系, 这项研究上周在乔治梅森大学(George Mason University)举行的安全与防御会议上发表.

模拟人类视觉

喜欢这个, 在分析了人类智能的基本特征之后, 研究人员专注于使用一系列计算机工具模拟和接近这个教师. 首先,他们生成了基本人类活动的3D模型,以匹配视频中人物的运动. 通过这种方式,将视频的运动与识别视频的算法经过训练的动作进行比较 (如何走路, 跳跃或站立) 并识别 (如何取走和带走).

该软件会检查这些模式,以推断出这个人正在做什么. 它还对接下来将要发生的事情进行预测, 主要关注可能隐藏或在镜头外发生的活动.

这是在会议期间开展的工作 18 该计划的头几个月, 还包括描述通过简单文本消息观察到的现象或警告异常或异常行为的能力. 一个明显的例子是机场或汽车站的摄像头标记废弃的袋子.

这项研究很大程度上基于计算机视觉研究人员取得的进展, 近几十年来,在识别固定和移动物体方面取得了显著的成果. 这与谷歌在其自动驾驶汽车上所遵循的工作相同, Facebook 和 Picasa 上使用的面部识别软件, 或 Microsoft Kinect 中使用的消费电子产品, 允许用户仅通过手势和语音命令玩游戏和控制他们的电视.

当它运作良好时, 计算机视觉能够检测物体和人——研究人员称之为名字- 位于相机镜头的另一侧. 但要了解他们在做什么, 或被允许这样做, 需要动词的计算机等价物. 这就是Oltramari和Lebiere借鉴其他卡内基梅隆大学研究人员的工作成果的地方,创造了他们所谓的 “认知运动”, 能够理解名词和动词相互作用的规则.

它的认知引擎融合了由博士后学生Kris Kitani领导的团队进行的研究, 它试图通过计算最有可能的物理轨迹来理解人类将采取的行动. 这两个项目都是Mind's Eye计划的一部分. 研究的下一步是让“认知引擎”更加智能. 根据该研究, 作者 “他们计划扩展系统的功能,以支持更广泛的动作动词,并使用更复杂的视频运行测试”.

应用

传统相机, 他们把自己限制在记录发生的事情上, 他们只能在犯罪发生后提供信息. 调查人员可能会看到汽车或店员是如何被盗的, 但事后. Mind's Eye的方法寻求相反的结果, 因为它旨在通过在危险犯罪或行为发生之前发出警告来预防危险犯罪或行为. 它的自动化系统可能会诱使安全官员有朝一日重新考虑人类对摄像头的控制, 因为操作员不仅维护成本高昂, 但是,如果他们分心或昏昏欲睡,它们就会带来风险.

盈利能力被添加到安全性中, 避免危及在高风险地区执行监视任务的士兵. 这是DARPA为该项目提供资金的主要目标之一. 根据其网站上收集的信息, “真正的智能相机能够用语言描述它所看到的一切,并推断它看不到的东西”.

可以指示这些设备仅报告感兴趣的活动, 这将增加输入数据的相关性. 所以, 智能摄像头可以让一名军人从一个安全位置监视多个观察哨. 同样,它可以应用于警察工作或分析无人机的实时镜头. 您甚至可以拥有家庭安全应用程序, 在窃贼强行开门之前提醒房主.


你喜欢这篇文章?

订阅我们的 RSS 源 你不会错过任何东西.

其他文章
• 2 11 月, 2012
• 部分: 计算机安全