Spaces:

jhj0517
/

Whisper-WebUI

Running

jsboige commited on Sep 7, 2023

Commit

3a65e3d

•

1 Parent(s): ed53f6a

Adding txt support

Files changed (3) hide show

app.py CHANGED Viewed

@@ -44,7 +44,7 @@ class App:
                                                label="Model")
                         dd_lang = gr.Dropdown(choices=["Automatic Detection"] + self.whisper_inf.available_langs,
                                               value="Automatic Detection", label="Language")
-                        dd_subformat = gr.Dropdown(["SRT", "WebVTT"], value="SRT", label="Subtitle Format")
                     with gr.Row():
                         cb_translate = gr.Checkbox(value=False, label="Translate to English?", interactive=True)
                     with gr.Row():

                                                label="Model")
                         dd_lang = gr.Dropdown(choices=["Automatic Detection"] + self.whisper_inf.available_langs,
                                               value="Automatic Detection", label="Language")
+                        dd_subformat = gr.Dropdown(["SRT", "WebVTT","txt"], value="txt", label="Subtitle Format")
                     with gr.Row():
                         cb_translate = gr.Checkbox(value=False, label="Translate to English?", interactive=True)
                     with gr.Row():

modules/subtitle_manager.py CHANGED Viewed

@@ -21,6 +21,12 @@ def write_file(subtitle, output_file):
     with open(output_file, 'w', encoding='utf-8') as f:
         f.write(subtitle)
 def get_srt(segments):
     output = ""

     with open(output_file, 'w', encoding='utf-8') as f:
         f.write(subtitle)
+def get_txt(segments):
+        output = "txt\n\n"
+        for i, segment in enumerate(segments):
+           output += f"{segment['text']}\n\n"
+        return output
 def get_srt(segments):
     output = ""

modules/whisper_Inference.py CHANGED Viewed

@@ -4,7 +4,7 @@ import os
 from datetime import datetime
 from .base_interface import BaseInterface
-from modules.subtitle_manager import get_srt, get_vtt, write_file, safe_filename
 from modules.youtube_manager import get_ytdata, get_ytaudio
 DEFAULT_MODEL_SIZE = "large-v2"
@@ -91,6 +91,9 @@ class WhisperInference(BaseInterface):
                 elif subformat == "WebVTT":
                     subtitle = get_vtt(result["segments"])
                     write_file(subtitle, f"{output_path}.vtt")
                 files_info[file_name] = subtitle
@@ -107,6 +110,9 @@ class WhisperInference(BaseInterface):
             self.release_cuda_memory()
             self.remove_input_files([fileobj.name for fileobj in fileobjs])
     def transcribe_youtube(self,
                            youtubelink: str,
                            model_size: str,

 from datetime import datetime
 from .base_interface import BaseInterface
+from modules.subtitle_manager import get_srt, get_vtt, get_txt, write_file, safe_filename
 from modules.youtube_manager import get_ytdata, get_ytaudio
 DEFAULT_MODEL_SIZE = "large-v2"
                 elif subformat == "WebVTT":
                     subtitle = get_vtt(result["segments"])
                     write_file(subtitle, f"{output_path}.vtt")
+                else :
+                    subtitle = get_txt(result["segments"])
+                    write_file(subtitle, f"{output_path}.txt")
                 files_info[file_name] = subtitle
             self.release_cuda_memory()
             self.remove_input_files([fileobj.name for fileobj in fileobjs])
     def transcribe_youtube(self,
                            youtubelink: str,
                            model_size: str,