Skip to content

VOSKを使ったスピーカーやヘッドフォンから出力される音声のオフライン文字起こし

Notifications You must be signed in to change notification settings

tez3998/audio-output-to-text

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

16 Commits
 
 
 
 
 
 

Repository files navigation

audio-output-to-text

スピーカーやヘッドフォンから出力される話し声のオフライン文字起こしです。 文字起こしされた結果はターミナルに表示されます。 音声認識にはVOSKを用いています。

デモ動画

VOICEVOXから出力された音を文字起こししました。

*480p以上でないと、文字起こしされた結果が見えにくいかもしれません。

動作環境

Windows10とUbuntu18.04上での動作を確認しています。 macOSは手元に環境がないため、動作を確認できていません。

使用しているライブラリ

  • copy
  • json
  • typing
  • multiprocessing
  • numpy
  • soundcard
  • sounddevice
  • vosk

使用方法

python run.py

その他

Qiitaの方で紹介しました。

About

VOSKを使ったスピーカーやヘッドフォンから出力される音声のオフライン文字起こし

Topics

Resources

Stars

Watchers

Forks

Languages