TRANSCREVER ÁUDIO em TEXTO com IA
Transcrição de Áudio para Texto com Whisper no Google Colab Este guia ensina como transcrever áudios (como do WhatsApp) para texto usando o Whisper, uma inteligência artificial. O processo é feito no Google Colab e é muito simples.
Passo a Passo Configuração Inicial:
Faça login na sua conta Google. Acesse o Google Drive . Instalar a Extensão Google Colab:
Clique em "Novo" > "Mais" > "Conectar mais apps" . Execute por Colaboratório e instale. Configurar o Ambiente:
Abra o Colab: "Novo" > "Mais" > "Google Colab" . No menu, vá em "Ambiente de execução" > "Alterar tipo de ambiente de execução" . Escolha: Modelo de linguagem: Python 3. Acelerador de hardware: GPU (ou deixe CPU, se GPU não estiver disponível). Instalar as Dependências:
Copie os códigos de instalação fornecidos (ex.: Whisper e FFmpeg). Cole os comandos na célula de código no Colab e execute. Preparar o Arquivo de Áudio:
Renomeie o arquivo para algo simples, como teste.mp3. Arraste o arquivo para o Colab. Transcrever o Áudio:
Copie o segundo código fornecido. Substitua "nome do arquivo" pelo nome do seu arquivo (ex.: teste.mp3). Execute o código. Resultado:
O texto transcrito será exibido no Colab. Arquivos adicionais (ex.: .txt, .srt, .json)serão gerados. Faça o download para usar como preferir. Observações: Funciona com diferentes formatos de áudio (ex.: .wav, .mp3). Os arquivos .srtsão sincronizados com vídeos para legendas automáticas. Você pode salvar e reabrir o ambiente sem perder a configuração. Recursos: Links e comandos necessários estão na descrição (ou conforme fornecidos por você). Dica: Teste com diferentes áudios, como mensagens do WhatsApp!