-
Notifications
You must be signed in to change notification settings - Fork 111
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
(080)自选wav2vec2模型 #245
Comments
(和标题无关,但是看了下reasonspeech v2感觉性能好强啊,万一也能和whisperX整合在一个gui里就好了) |
搭了一个原版的whisperX,用NTQAI/wav2vec2-large-japanese确实效果好很多(用高亮词看,断句和gui里的高度不同不理解为啥) 以及有关离线的whisperX https://github.com/nkilm/offline-whisperx 这个用的是pypi的3.1.3版 希望有机会可以支持了 |
一开始确实有制作 自选 whisperX 模型 功能的想法,但是因为比较麻烦,平时时间比较有限就没做,其实 whisperX 算是打开一个思路,完全可以把 对齐功能扩展成更丰富的模型功能, |
那么这是算……not planned吗🥲 |
所以你找到办法使用这个模型了吗? |
rinna的没有,虽然我觉得offline whisper是可以用的,但是机器要重装不想再去和环境战斗了 |
这两天琢磨reazon的各种东西,刚看见基于reazonspeech2的wav2vec2了 |
我看到日语对齐的话,目前用的是jonatasgrosman/wav2vec2-large-xlsr-53-japanese这个模型
但是似乎存在一些数据集更好/更长的模型如
NTQAI/wav2vec2-large-japanese
rinna/japanese-wav2vec2-base 这个直接用的reasonspeech v1有19000小时的数据集
现在用的模型对于广播以外的内容确实效果比较抽风,因为用的模型确实是单人声音的
能不能直接在gui里加入自选wav2vec2的功能
(以及如果我急着用,直接把cache里的模型那些symlink给改了行不行)
The text was updated successfully, but these errors were encountered: