Como usar o MediaPipe com Python para detectar mãos, rostos e poses
Como usar o MediaPipe com Python para detectar mãos, rostos e poses
Se você está explorando aplicações de visão computacional em Python, o MediaPipe é uma das ferramentas mais poderosas e fáceis de usar. Desenvolvido pelo Google, ele permite detectar rostos, mãos, poses e até reconhecer gestos em tempo real.
🔧 O que é o MediaPipe?
MediaPipe é um framework de código aberto para criação de pipelines de processamento multimídia. Ele é amplamente usado para tarefas de visão computacional como:
- Detecção de mãos
- Reconhecimento facial
- Rastreamento de pose corporal
- Segmentação de corpo inteiro
📦 Instalando o MediaPipe no Python
pip install mediapipe opencv-python
📷 Exemplo: Detecção de mãos com webcam
Este é um exemplo básico usando OpenCV + MediaPipe para detectar mãos em tempo real:
import cv2
import mediapipe as mp
mp_hands = mp.solutions.hands
hands = mp_hands.Hands()
mp_draw = mp.solutions.drawing_utils
cap = cv2.VideoCapture(0)
while True:
success, img = cap.read()
img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
results = hands.process(img_rgb)
if results.multi_hand_landmarks:
for hand_landmarks in results.multi_hand_landmarks:
mp_draw.draw_landmarks(img, hand_landmarks, mp_hands.HAND_CONNECTIONS)
cv2.imshow("MediaPipe Hands", img)
if cv2.waitKey(1) & 0xFF == ord('q'):
break
🎯 Outras funcionalidades do MediaPipe
- Face Mesh: mais de 468 pontos no rosto
- Pose: detecta estrutura corporal (ombros, joelhos, pés etc.)
- Selfie Segmentation: recorte de fundo em tempo real
💡 Dicas de uso
- Combine com bibliotecas como OpenCV ou PyGame para interações visuais
- Otimize a performance com `static_image_mode=True` para imagens estáticas
- Use com Raspberry Pi ou Jetson Nano para projetos embarcados
🚀 Conclusão
MediaPipe é uma excelente ferramenta para quem quer começar com visão computacional em Python. Ele oferece alto desempenho, precisão e fácil integração com outras bibliotecas.
Se você está pensando em fazer um algoritmo para reconhecer pessoas pelo nome, a partir de uma foto ou em live stream, esse é o primeiro passo. Se usar mediapipe com deepface, teremos esse resultado.
Nos próximos artigos vamos explorar o Face Mesh e como identificar emoções a partir dos pontos do rosto. Fica ligado!