您的位置：首页 >环保 >

?使用Mediapipe对图像进行手部地标检测

时间：2022-03-08 14:16:54 来源：

概述

在本文中，我们将以深度库即 Mediapipe为基础库，以及其他计算机视觉预处理的CV2库来制作手部地标检测模型。市场上有很多关于这种问题的用例，例如商业相关的虚拟现实、游戏部分的实时体验。

行业用例

1．智能家居：这是计算机视觉的现代用例之一，人们使用智能家居来过上更舒适的生活，这就是为什么它不再是一个小众领域，它也正在蔓延到普通家庭。

2．智能电视：我们经常看到这种用例，你可以用手势来改变音量、改变频道等等。

3．游戏：对于真正的体验，这项技术越来越多地融入互动游戏。

让我们建立我们的手部检测模型

导入库

在这里，我们将导入整个管道中需要的所有库。

import cv2

import numpy as np

import mediapipe as mp

import matplotlib．pyplot as plt

使用 Mediapipe 初始化手的地标检测模型

第一步是使用有效参数初始化模型，无论我们采用哪种检测技术，它可以是Mediapipe 或Yolo，初始化模型很重要，遵循相同的原则，我们将遵循所有给定的步骤：

＃ First step is to initialize the Hands class an store it in a variable

mp＿hands ＝ mp．solutions．hands

＃ Now second step is to set the hands function which will hold the landmarks points

hands ＝ mp＿hands．Hands（static＿image＿mode＝True， max＿num＿hands＝2， min＿detection＿confidence＝0．3）

＃ Last step is to set up the drawing function of hands landmarks on the image

mp＿drawing ＝ mp．solutions．drawing＿utils

代码分解：

1．首先，使用mp．solutions．hands初始化变量 mp＿hands。然后使用相同的变量通过mp．solutions．hands．Hands（）为hands设置函数。

2．到目前为止，我们了解了手模型初始化的结构，现在让我们深入研究函数中使用的参数hands。

· static＿image＿mode：该参数将布尔值作为其有效值，即它可以是True或False。当处理视频流时，默认条件是 False ，这意味着它会降低处理延迟，即它会继续专注于特定的手并定位相同的手，直到它追踪的手消失，当我们必须检测实时流或视频中的手时，这可能是有益的，根据我们的要求，我们必须检测图像上的地标，因此我们将值设置为True。

· max＿num＿hands：此参数将指示模型将在一个实例中检测到的最大手数。默认情况下，该值为 2，这也是有意义的，尽管我们可以更改它，但我们希望至少检测到一双手。

· min＿detection＿confidence：它提供了置信水平的阈值。最小检测置信度的理想范围是［0．0，1．0］，默认情况下，它保持为 0．5，这意味着如果置信度低于 50％，则在输出图像中根本不会检测到手。

最后，我们将使用mp．solutions．drawing＿utils，它将负责在输出图像上绘制所有手的地标，这些地标由我们的 Hands 函数检测到。

读取图像

在这里，我们将首先使用cv2．imread（）读取要在其上执行手部检测的图像，并使用matplotlib库来显示该特定输入图像。

＃ Reading the sample image on which we will perform the detection

sample＿img ＝ cv2．imread（＇media／sample．jpg＇）

＃ Here we are specifing the size of the figure i．e． 10 －height； 10－ width．

plt．figure（figsize ＝［10， 10］）

＃ Here we will display the sample image as the output．

plt．title（＂Sample Image＂）；plt．axis（＇off＇）；plt．imshow（sample＿img［：，：，：：－1］）；plt．show（）

输出：

执行手部地标检测

因此，现在我们已经初始化了我们的手部检测模型，下一步将是处理输入图像上的手部地标检测，并使用上述初始化模型在该图像上绘制所有 21 个地标，我们将通过以下步骤。

results ＝ hands．process（cv2．cvtColor（sample＿img， cv2．COLOR＿BGR2RGB））

if results．multi＿hand＿landmarks：

for hand＿no， hand＿landmarks in enumerate（results．multi＿hand＿landmarks）：

print（f＇HAND NUMBER：｛hand＿no＋1｝＇）

print（＇－－－－－－－－－－－－－－－－－－－－－－－＇）

for i in range（2）：

print（f＇｛mp＿hands．HandLandmark（i）．name｝：＇）

print（f＇｛hand＿landmarks．landmark［mp＿hands．HandLandmark（i）．value］｝＇）

输出：

代码分解：

1. 第一步，我们使用Mediapipe 库中的process函数将手部地标检测结果存储在变量results中，同时我们将图像从 BGR 格式转换为 RGB 格式。

2. 在进入下一步时，我们将首先检查一些验证，是否检测到点，即变量results应该存放了一些结果。

3. 如果是，那么我们将遍历在图像中检测到的具有手部地标的所有点。

4. 现在在另一个循环中，我们可以看到只有 2 次迭代，因为我们只想显示手的 2 个地标。

5. 最后，我们将根据要求打印出所有检测到并过滤掉的地标。

从上面的处理中，我们发现所有检测到的地标都被归一化为通用尺度，但是现在对于用户端，这些缩放点是不相关的，因此我们会将这些地标恢复到原始状态。

image＿height， image＿width，＿＝ sample＿img．shape

if results．multi＿hand＿landmarks：

for hand＿no， hand＿landmarks in enumerate（results．multi＿hand＿landmarks）：

print（f＇HAND NUMBER：｛hand＿no＋1｝＇）

print（＇－－－－－－－－－－－－－－－－－－－－－－－＇）

for i in range（2）：

print（f＇｛mp＿hands．HandLandmark（i）．name｝：＇）

print（f＇x：｛hand＿landmarks．landmark［mp＿hands．HandLandmark（i）．value］．x ＊ image＿width｝＇）

print（f＇y：｛hand＿landmarks．landmark［mp＿hands．HandLandmark（i）．value］．y ＊ image＿height｝＇）

print（f＇z：｛hand＿landmarks．landmark［mp＿hands．HandLandmark（i）．value］．z ＊ image＿width｝n＇）

输出：

代码分解：

我们只需要在这里执行一个额外的步骤，即我们将从我们定义的示例图像中获得图像的原始宽度和高度，然后所有步骤将与我们之前所做的相同，唯一不同的将是现在地标点没有专门缩放。

在图像上绘制地标

由于我们已经从上述预处理中获得了手部地标，现在是时候执行我们的最后一步了，即在图像上绘制点，以便我们可以直观地看到我们的手部地标检测模型是如何执行的。

img＿copy ＝ sample＿img．copy（）

if results．multi＿hand＿landmarks：

for hand＿no， hand＿landmarks in enumerate（results．multi＿hand＿landmarks）：

mp＿drawing．draw＿landmarks（image ＝ img＿copy， landmark＿list ＝ hand＿landmarks，

connections ＝ mp＿hands．HAND＿CONNECTIONS）

fig ＝ plt．figure（figsize ＝［10， 10］）

plt．title（＂Resultant Image＂）；plt．axis（＇off＇）；plt．imshow（img＿copy［：，：，：：－1］）；plt．show（）

输出：

代码分解：

1. 首先，我们将创建原始图像的副本，此步骤是出于安全目的，因为我们不想失去图像的原创性。

2. 然后我们将处理之前所做的验证工作。

3. 然后我们将遍历手的每个地标。

4. 最后，借助mp＿drawing．draw＿landmarks函数，我们将在图像上绘制地标。

5. 是时候使用 matplotlib 绘制图像了，所以首先，我们将给出图形大小（此处为 width－10 和 height－10），然后在最后绘制，imshow将 BGR 格式转换为 RGB 格式后的图像使用函数，因为对于 RGB 格式更有意义。

结论

在整个管道中，我们首先初始化模型，然后读取图像，查看输入图像，然后进行预处理。我们缩小了地标点，但这些点与用户无关，因此我们将其恢复到原始状态，最后我们将在图像上绘制地标。

原文标题:?使用Mediapipe对图像进行手部地标检测

郑重声明：文章仅代表原作者观点，不代表本站立场；如有侵权、违规，可直接反馈本站，我们将会作修改或删除处理。

首页

要闻

科技

环保

新能源

太阳能

宏观经济

?使用Mediapipe对图像进行手部地标检测

在OpenCV中使用图像像素

使用OpenCV在Python中进行图像操作

使用迁移学习加强你的图像搜索

地标法院的裁决可能危及这条主要管道

基于域相关的图像增强

探索如何通过向AI提供大量药丸图像来训练AI检测定制药丸

一文教你使用EasyOCR从图像中检测文本：实践指南

1亿像素！三星将推5.76亿像素图像传感器

一文了解如何使用CNN进行图像分类

教你使用OpenCV对图像进行特征检测、描述和匹配

OpenCV 指南2：如何在图像中进行边缘检测？

OpenCV指南1：如何在图像中添加形状和文字？

桥接IC——适用于任何设备的图像和视频传输转换器

一文了解如何使用Python+OpenCV构建手部跟踪系统

一文了解如何使用OpenCV进行图像处理

电动汽车新危机：很多人错怪宁德时代了

续航不重要？马斯克说这话的背后有何算盘？

全国政协委员舒印彪：实现“双碳”离不开煤电长效互保机制

21人！31条建议剑指储能！两会代表委员议案、提案大汇总！

粤水电：拟收购建工集团100%股权 3月8日起停牌