谷歌开源手势跟踪移动设备的AI

导读实时手形和动作跟踪器是手语识别和手势控制系统的宝贵部分，更不用说一些增强现实体验。但是它们经常因遮挡和缺乏对比模式而受阻，导

实时手形和动作跟踪器是手语识别和手势控制系统的宝贵部分，更不用说一些增强现实体验。但是它们经常因遮挡和缺乏对比模式而受阻，导致它们无法可靠或稳健地执行。

这些挑战和其他挑战促使谷歌的科学家们研究一种新的计算机视觉方法来进行手感知-一种是通过机器学习来支持的。他们说，在实验中，它设法从一个帧中推断出手机(或多只手)的21个3D点。

谷歌于6月在2019年计算机视觉和模式识别大会上预览了这项新技术，最近在MediaPipe中实施了这项技术，MediaPipe是一个跨平台框架，用于构建多模式应用机器学习流程，以处理不同模态(如视频和音频)的感知数据。源代码和端到端使用场景都可以在GitHub上获得。

研究工程师ValentinBazarevsky和FanZhang在博客文章中写道：“感知手的形状和运动的能力可以成为改善各种技术领域和平台用户体验的重要组成部分。”“我们希望向更广泛的研究和开发社区提供这种手感知功能将导致创造性用例的出现，刺激新的应用和新的研究途径。”

谷歌的技术包括三个串联工作的AI模型：一个手掌探测器--BlazePalm--分析一个框架并返回一个手动边框;一个手标志模型，它查看由手掌探测器定义的裁剪图像区域并返回3D手点;以及手势识别器，其将先前计算的点配置分类为一组手势。

认识到手并非易事;BlazePalm必须应对缺乏功能，同时发现被遮挡和自我遮挡的手。为了清除这些路障，该团队训练了一个手掌探测器而不是手探测器，因为估计像拳头这样的物体的边界框往往比检测手和手指更容易。作为一个额外的好处，它可以很好地推广到握手等边缘情况，它可以使用忽略其他宽高比的方形边框来模拟手掌，将点数减少3-5倍。

在手掌检测之后，手部界标模型接管，在检测到的手部区域内执行21个3D手肘坐标的定位。训练需要用坐标手动注释30,000个真实世界的图像，以及在各种背景上渲染并映射到相应坐标的高质量合成手模型。

管道中的最后一步是手势识别系统，其从关节角度确定每个手指的状态并将手指状态集合映射到预定义的手势。Bazarevsky和张说，它能够识别来自多种文化(例如，欧洲和)的计数手势和各种手势，包括闭拳，“OK”，“摇滚”和“蜘蛛侠”。

模型可以执行单独的任务，例如裁剪和专门在图形卡上渲染以节省计算，并且手掌探测器仅在必要时运行-大部分时间，后续视频帧中的手位置是从计算出的手中的关键点推断的。当前帧。仅当推断置信度低于某个阈值时，手检测模型才重新应用于整个帧。

在未来，Bazarevsky，Zhang和他的同事计划通过更强大和稳定的跟踪扩展技术，并扩大可以可靠检测的手势量，并支持及时展开动态手势。他们补充说：“我们相信，发布这项技术可以推动研究和开发者社区成员对新的创意和应用的推动。”

免责声明：本文由用户上传，如有侵权请联系删除！

相关热词：

新经网

首页

生活

综合精选

精选问答

综合问答

经验知识

精选经验

动态

车头条

信息互动

前沿科技

天气动态

谷歌开源手势跟踪移动设备的AI

相关推荐

最新文章

头条推荐 | 热门文章 | 精选文章

教堂养老金集团发布 2019年全国卫生计划年度报告

2019年第三季度-131个TNO的收入

希伯来高级生命首席执行官分享2020年老年人护理趋势的观点

Intercell赋予学生和大学助力教育4.0的动力

Visa捍卫赋予妇女权力的新十年

2020-2024年全球汽车高级音响系统市场

网络运营商在超级碗的5G竞争环境中势均力敌

TxDOT敦促足球迷们为清醒的骑行做好计划

Ecolab的水风险货币化工具更新全球水数据以反映当前趋势

松下开发了强大的蓝色WBC技术彻底改变了微制造中的DDL应用

患有ADHD的青少年因危险驾驶而受到交通违规行为具有更高的碰撞风险

令人惊讶的事情可以推高购买丧失抵押品赎回权的成本

您可以在家中杀死细菌的奇怪但完全自然的方式

孟买慧聪公司在印花税上下令推动转售住房市场

最昂贵的上市价值5000万美元的曼哈顿大厦

信号量商店前台为企业主提供了难得的机会

6个细微的细节决定你的浴室看起来有多棒

奥迪RS Q3 Sportback被认为是高性能Swoopy SUV

门庭若市是什么生肖门庭若市是什么生肖具体是什么生肖呢

尊敬的新董事会成员增强了GBS领导力

ABLIC推出带有看门狗定时器和复位IC的S-19514/ 19515系列和S-19518系列汽车LDO稳压器

Tealium将配置文件流传输到Wunderman Thompson的客户云技术堆栈

墨尔本菲茨罗伊的前军营现在是775万澳元的房屋

这是看优秀的Prodrive赛车的借口

绿洲管理公司关于更好的东京巨蛋的声明

Vivint Smart Home and Mosaic Acquisition Corp.宣布修订后的交易条款

SG Blocks宣布公开发售定价

O-RAN联盟发布第一个软件代码规范

2018-2022年全球宠物食品市场