🤖 Computer Vision & HCI Projects [Python]
- Ivan Luna
- Python , Backend-development , OpenCV , MediaPipe , Visão Computacional , Aprendizado de Máquina , Interação Humano-Computador , Detecção em Tempo Real , Reconhecimento de Gestos
- 24 Nov, 2024
Uma coleção de projetos avançados de visão computacional focados em sistemas de monitoramento de segurança e interação humana em tempo real.
Visão Geral do Projeto
Esta página apresenta dois projetos diferentes de visão computacional que demonstram sistemas avançados de interação humana em tempo real usando OpenCV e MediaPipe.
1. Reconhecimento de Gestos Multimodal
Um sistema abrangente de reconhecimento de gestos que processa múltiplas modalidades de entrada simultaneamente.
Principais Recursos:
- Rastreamento e classificação de gestos manuais
- Análise de expressões faciais
- Detecção de postura corporal
- Fusão de gestos multimodais
- Detecção de movimento rítmico
Gestos Suportados:
- Gestos Manuais: Sinal de paz, gesto OK
- Expressões Faciais: Detecção de sorriso, rastreamento de sobrancelhas
- Posturas Corporais: Gesto de dar de ombros
- Gestos Complexos: Pose de pensamento (multimodal)
- Gestos Rítmicos: Detecção de groove
2. Sistema de Detecção de Sonolência
Uma aplicação focada em segurança que monitora o estado de alerta do motorista através do rastreamento ocular em tempo real.
Principais Recursos:
- Rastreamento ocular em tempo real usando MediaPipe Face Mesh
- Cálculo da Razão de Aspecto do Olho (EAR) para detecção de sonolência
- Alertas visuais de sonolência com limites configuráveis
- Painel de monitoramento em tempo real
- Tela espelho para conforto do usuário
Destaques Técnicos:
- Detecção de 6 pontos de referência oculares
- Sistema de alerta baseado em limites dinâmicos
- Configurações de sensibilidade ajustáveis
- Otimização de desempenho em tempo real
Requisitos Técnicos
Requisitos Comuns:
- Python 3.9+
- OpenCV (cv2)
- MediaPipe
- NumPy
- SciPy
- Webcam funcional
Opcional:
- GPU compatível com OpenCV (melhora o desempenho)
Instalação e Configuração
Reconhecimento de Gestos:
git clone https://github.com/imprvhub/multimodal-gesture-recognition.git
cd multimodal-gesture-recognition
pip install -r requirements.txt
python gesture_recognition.py
Detecção de Sonolência:
git clone https://github.com/imprvhub/somnolence-detection.git
cd somnolence-detection
pip install -r requirements.txt
python somnolence_detection.py
Instruções de Uso
Sistema de Reconhecimento de Gestos:
- Inicia em modo tela cheia
- Controles:
- ‘q’ - Sair
- ’r’ - Resetar calibração
- ’esc’ - Sair da tela cheia
- Exibe status do reconhecimento de gestos em tempo real
Sistema de Detecção de Sonolência:
- Aplicação inicia com ativação da webcam
- Pressione ‘q’ para sair
- Indicadores visuais mostram:
- Contornos oculares verdes
- Exibição do valor EAR
- Alertas de sonolência
Desenvolvimento Futuro
Reconhecimento de Gestos:
- Gestos multimodais adicionais
- Interface de treinamento de gestos personalizados
- Detecção de sequência de gestos
- Análise rítmica aprimorada
Detecção de Sonolência:
- Implementação de alertas sonoros
- Capacidades de registro de dados
- Rastreamento de múltiplos rostos
- Otimização para dispositivos móveis
Arquitetura Técnica
Ambos os projetos apresentam:
- Processamento multi-thread
- Otimização em tempo real
- Padrões de design modulares
- Sistemas de limites adaptativos
- Gerenciamento de estado
- Monitoramento de desempenho
Aplicações em Pesquisa
Estes projetos são projetados para:
- Pesquisa acadêmica
- Estudos de interação humano-computador
- Desenvolvimento de visão computacional
- Prototipagem de sistemas de segurança
- Demonstrações técnicas
Licença
Ambos os projetos são lançados sob a Licença MIT. Consulte os respectivos repositórios para termos detalhados.
Desenvolvido com OpenCV e MediaPipe