Spaces:

jhj0517
/

Whisper-WebUI

Running

jhj0517 commited on Sep 12, 2023

Commit

58c7e65

•

2 Parent(s): c8ae5e5 ae32f22

Merge pull request #39 from jhj0517/set-default-beam-size

Files changed (2) hide show

modules/faster_whisper_inference.py CHANGED Viewed

@@ -24,7 +24,7 @@ class FasterWhisperInference(BaseInterface):
         self.available_models = whisper.available_models()
         self.available_langs = sorted(list(whisper.tokenizer.LANGUAGES.values()))
         self.translatable_models = ["large", "large-v1", "large-v2"]
-        self.default_beam_size = 5
         self.device = "cuda" if torch.cuda.is_available() else "cpu"
     def transcribe_file(self,

         self.available_models = whisper.available_models()
         self.available_langs = sorted(list(whisper.tokenizer.LANGUAGES.values()))
         self.translatable_models = ["large", "large-v1", "large-v2"]
+        self.default_beam_size = 1
         self.device = "cuda" if torch.cuda.is_available() else "cpu"
     def transcribe_file(self,

modules/whisper_Inference.py CHANGED Viewed

@@ -21,6 +21,7 @@ class WhisperInference(BaseInterface):
         self.model = None
         self.available_models = whisper.available_models()
         self.available_langs = sorted(list(whisper.tokenizer.LANGUAGES.values()))
     def transcribe_file(self,
                         fileobjs: list,
@@ -250,6 +251,7 @@ class WhisperInference(BaseInterface):
         segments_result = self.model.transcribe(audio=audio,
                                                 language=lang,
                                                 verbose=False,
                                                 task="translate" if istranslate and self.current_model_size in translatable_model else "transcribe",
                                                 progress_callback=progress_callback)["segments"]
         elapsed_time = time.time() - start_time

         self.model = None
         self.available_models = whisper.available_models()
         self.available_langs = sorted(list(whisper.tokenizer.LANGUAGES.values()))
+        self.default_beam_size = 1
     def transcribe_file(self,
                         fileobjs: list,
         segments_result = self.model.transcribe(audio=audio,
                                                 language=lang,
                                                 verbose=False,
+                                                beam_size=self.default_beam_size,
                                                 task="translate" if istranslate and self.current_model_size in translatable_model else "transcribe",
                                                 progress_callback=progress_callback)["segments"]
         elapsed_time = time.time() - start_time