🎤 FollowVoice – Sistema de Transcrição e Tradução de Áudio em Tempo Real
🌟 Visão Geral
FollowVoice é um sistema de ponta para transcrição e tradução de áudio em tempo real, projetado para macOS (M1/M2). Ele captura o áudio do sistema através do BlackHole, transcreve usando os modelos Whisper mais avançados, e fornece traduções instantâneas para múltiplos idiomas com sugestões contextuais alimentadas por IA.
✨ Recursos Principais
- 🎤 Captura de Áudio do Sistema – Roteamento de áudio perfeito via BlackHole 2ch
- 📝 Transcrição em Tempo Real – Transcrição ultra-rápida com Faster Whisper
- 🌐 Tradução Multi-idiomas – Suporte para 10+ idiomas com troca em tempo real
- 🤖 Sugestões com IA – Respostas contextuais usando LLMs locais (Ollama)
- ⚡ Inicialização Ultra-rápida – Do lançamento à primeira transcrição em ~5 segundos
- 🎨 Interface Moderna – Interface bonita e responsiva construída com CustomTkinter
- 📊 Métricas de Performance – Monitoramento e otimização em tempo real
🎬 Demonstração
🚀 Início Rápido
Pré-requisitos
- macOS (Apple Silicon M1/M2 recomendado)
- Python 3.9 ou superior
- BlackHole 2ch (para roteamento de áudio)
- Poetry (gerenciamento de dependências)
- Ollama (opcional, para sugestões de IA)
Instalação
# 1. Clone o repositório
git clone https://github.com/igorhlr/follow-voice.git
cd follow-voice
# 2. Instale as dependências com Poetry
poetry install
# 3. Baixe o modelo Whisper (modelo base recomendado para equilíbrio)
poetry run python -c "import whisper; whisper.load_model('base')"
# 4. Execute a aplicação
poetry run python run.py
🏗️ Arquitetura
Diagrama de arquitetura será inserido aqui.
📊 Métricas de Performance
| Componente | Latência | Otimização |
| Tempo de Inicialização | ~5-10s | 70% mais rápido com lazy loading |
| Detecção VAD | 3-10ms | Algoritmo baseado em energia |
| Transcrição | 0.3-0.8s | Faster Whisper com int8 |
| Tradução | 0.1-0.2s | Multi-provider com cache |
| Resposta da UI | <16ms | Renderização a 60 FPS |
🌍 Idiomas Suportados
Tradução e Respostas de IA:
- 🇧🇷 Português (pt)
- 🇺🇸 Inglês (en)
- 🇪🇸 Espanhol (es)
- 🇫🇷 Francês (fr)
- 🇩🇪 Alemão (de)
- 🇮🇹 Italiano (it)
- 🇯🇵 Japonês (ja)
- 🇰🇷 Coreano (ko)
- 🇨🇳 Chinês (zh)
- 🇷🇺 Russo (ru)
📄 Licença
Este projeto está licenciado sob a Licença MIT – veja o arquivo LICENSE para detalhes.
🙏 Agradecimentos
Agradecimentos especiais aos projetos que tornaram o FollowVoice possível:
- OpenAI Whisper – Reconhecimento de fala
- Faster Whisper – Inferência otimizada
- BlackHole – Driver de áudio virtual
- Ollama – Inferência LLM local
- CustomTkinter – Framework de UI moderna
Feito com ❤️ por Igor Rozalem