使用OpenCV和Python进行哈尔级联的微笑检测
我们将使用哈尔级联分类器来在图像中进行微笑检测。哈尔级联分类器是一种有效的对象检测方法,它是基于机器学习的方法。为了训练一个用于微笑检测的哈尔级联分类器,算法最初需要大量的正面图像(带有微笑的图像)和负面图像(没有微笑的图像)。然后,分类器从这些正面和负面图像进行训练,并用于检测其他图像中的微笑。
我们可以使用已经训练好的哈尔级联进行微笑检测。对于输入图像中的微笑检测,我们需要两个哈尔级联,一个用于人脸检测,另一个用于微笑检测。我们将使用以下两个哈尔级联:
- haarcascade_frontalface_default.xml
- haarcascade_smile.xml
如何下载哈尔级联文件
您可以在GitHub网址上找到不同的哈尔级联文件:
https://github.com/opencv/opencv/tree/master/data/haarcascades
要下载微笑的哈尔级联文件,点击 haarcascade_smile.xml 文件,以原始格式打开,并右键另存为。
步骤
要在图像中检测微笑,您可以按照以下步骤进行操作:
- 导入所需的库。 在所有以下示例中,所需的Python库是 OpenCV 。 确保您已经安装了它。
-
使用 cv2.imread() 读取输入图像。指定完整的图像路径。将图像转换为灰度图像。
-
初始化Haar级联分类器对象 face_cascade = cv2.CascadeClassifier() 用于脸部检测和 smile_cascade = cv2.CascadeClassifier 用于微笑检测。传递haar级联xml文件的完整路径。您可以使用haar级联文件 haarcascade_frontalface_default.xml 在图像中检测面部,以及 haarcascade_smile.xml 用于检测微笑。
-
使用 face_cascade.detectMultiScale() 在输入图像中检测人脸。它以 (x,y,w,h) 格式返回检测到的脸部的坐标。
-
将检测到的脸部定义为对于检测到的脸部, roi 为 image[y:y + h,x:x + w] 。现在在检测到的面部区域( roi )内检测微笑。使用 smile_cascade.detectMultiScale() 。它还以 (sx,sy,sw,sh) 格式返回眼睛的边界矩形的坐标。
-
使用 cv2.rectangle() 在原始图像中绘制围绕检测到的微笑(嘴巴)的边界矩形。
-
显示带有绘制在嘴巴周围的边界矩形的图像。
让我们看一些示例以更清楚地理解。
示例
在这个Python程序中,我们使用haar级联在输入图像中进行微笑检测。
# import required libraries
import cv2
# read input image
img = cv2.imread('smile1.jpg')
# convert the image to grayscale
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# read haar cascade for face detection
face_cascade = cv2.CascadeClassifier('haarcascades\haarcascade_frontalface_default.xml')
# read haar cascade for smile detection
smile_cascade = cv2.CascadeClassifier('haarcascades\haarcascade_smile.xml')
# Detects faces in the input image
faces = face_cascade.detectMultiScale(gray, 1.3, 5)
print('Number of detected faces:', len(faces))
# loop over all the faces detected
for (x,y,w,h) in faces:
# draw a rectangle in a face
cv2.rectangle(img,(x,y),(x+w,y+h),(0,255,255),2)
cv2.putText(img, "Face", (x, y), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 255), 2)
roi_gray = gray[y:y+h, x:x+w]
roi_color = img[y:y+h, x:x+w]
# detecting smile within the face roi
smiles = smile_cascade.detectMultiScale(roi_gray, 1.8, 20)
if len(smiles) > 0:
print("smile detected")
for (sx, sy, sw, sh) in smiles:
cv2.rectangle(roi_color, (sx, sy), ((sx + sw), (sy + sh)), (0, 0, 255), 2)
cv2.putText(roi_color, "smile", (sx, sy),
cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 2)
else:
print("smile not detected")
# Display an image in a window
cv2.imshow('Smile Image',img)
cv2.waitKey(0)
cv2.destroyAllWindows()
我们将使用这个图像作为程序的 输入文件 -
输出
执行后,它将产生以下输出 –
Number of detected faces: 1
smile detected
我们得到以下 输出 窗口: