🎤 FollowVoice – Sistema de Transcrição e Tradução de Áudio em Tempo Real

🌟 Visão Geral

FollowVoice é um sistema de ponta para transcrição e tradução de áudio em tempo real, projetado para macOS (M1/M2). Ele captura o áudio do sistema através do BlackHole, transcreve usando os modelos Whisper mais avançados, e fornece traduções instantâneas para múltiplos idiomas com sugestões contextuais alimentadas por IA.

✨ Recursos Principais

🎤 Captura de Áudio do Sistema – Roteamento de áudio perfeito via BlackHole 2ch
📝 Transcrição em Tempo Real – Transcrição ultra-rápida com Faster Whisper
🌐 Tradução Multi-idiomas – Suporte para 10+ idiomas com troca em tempo real
🤖 Sugestões com IA – Respostas contextuais usando LLMs locais (Ollama)
⚡ Inicialização Ultra-rápida – Do lançamento à primeira transcrição em ~5 segundos
🎨 Interface Moderna – Interface bonita e responsiva construída com CustomTkinter
📊 Métricas de Performance – Monitoramento e otimização em tempo real

🎬 Demonstração

🚀 Início Rápido

Pré-requisitos

macOS (Apple Silicon M1/M2 recomendado)
Python 3.9 ou superior
BlackHole 2ch (para roteamento de áudio)
Poetry (gerenciamento de dependências)
Ollama (opcional, para sugestões de IA)

Instalação

# 1. Clone o repositório
git clone https://github.com/igorhlr/follow-voice.git
cd follow-voice

# 2. Instale as dependências com Poetry
poetry install

# 3. Baixe o modelo Whisper (modelo base recomendado para equilíbrio)
poetry run python -c "import whisper; whisper.load_model('base')"

# 4. Execute a aplicação
poetry run python run.py

🏗️ Arquitetura

Diagrama de arquitetura será inserido aqui.

📊 Métricas de Performance

Componente	Latência	Otimização
Tempo de Inicialização	~5-10s	70% mais rápido com lazy loading
Detecção VAD	3-10ms	Algoritmo baseado em energia
Transcrição	0.3-0.8s	Faster Whisper com int8
Tradução	0.1-0.2s	Multi-provider com cache
Resposta da UI	<16ms	Renderização a 60 FPS

🌍 Idiomas Suportados

Tradução e Respostas de IA:

🇧🇷 Português (pt)
🇺🇸 Inglês (en)
🇪🇸 Espanhol (es)
🇫🇷 Francês (fr)
🇩🇪 Alemão (de)
🇮🇹 Italiano (it)
🇯🇵 Japonês (ja)
🇰🇷 Coreano (ko)
🇨🇳 Chinês (zh)
🇷🇺 Russo (ru)

📄 Licença

Este projeto está licenciado sob a Licença MIT – veja o arquivo LICENSE para detalhes.

🙏 Agradecimentos

Agradecimentos especiais aos projetos que tornaram o FollowVoice possível:

OpenAI Whisper – Reconhecimento de fala
Faster Whisper – Inferência otimizada
BlackHole – Driver de áudio virtual
Ollama – Inferência LLM local
CustomTkinter – Framework de UI moderna

Feito com ❤️ por Igor Rozalem