Spaces:

robinhad
/

ukrainian-tts

Running

Yurii Paniv commited on Dec 10, 2022

Commit

9d153e7

•

1 Parent(s): a2fc107

Black fixes

Files changed (2) hide show

app.py CHANGED Viewed

@@ -84,7 +84,9 @@ def tts(text: str, voice: str, stress: str, speed: float):
     )  # mitigate crashes on hf space
     if getenv("HF_API_TOKEN") is not None:
-        log_queue.put([text, speaker_name, stress_selected, speed, str(datetime.utcnow())])
     with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as fp:
         _, text = ukr_tts.tts(text, speaker_name, stress_selected, fp, speed)
@@ -114,12 +116,8 @@ iface = gr.Interface(
             value=StressOption.AutomaticStress.value,
         ),
         gr.components.Slider(
-            label="Швидкість",
-            minimum=0.5,
-            maximum=2,
-            value=1,
-            step=0.1
-        )
     ],
     outputs=[
         gr.components.Audio(label="Output"),

     )  # mitigate crashes on hf space
     if getenv("HF_API_TOKEN") is not None:
+        log_queue.put(
+            [text, speaker_name, stress_selected, speed, str(datetime.utcnow())]
+        )
     with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as fp:
         _, text = ukr_tts.tts(text, speaker_name, stress_selected, fp, speed)
             value=StressOption.AutomaticStress.value,
         ),
         gr.components.Slider(
+            label="Швидкість", minimum=0.5, maximum=2, value=1, step=0.1
+        ),
     ],
     outputs=[
         gr.components.Audio(label="Output"),

ukrainian_tts/tts.py CHANGED Viewed

@@ -67,11 +67,12 @@ class TTS:
         text = preprocess_text(text, stress)
         text = sentence_to_stress(text, stress_with_model if stress else stress_dict)
         # synthesis
         with no_grad():
             start = time.time()
-            wav = self.synthesizer(text, sids=np.array(voice), decode_conf={"alpha": 1/speed})["wav"]
         rtf = (time.time() - start) / (len(wav) / self.synthesizer.fs)
         print(f"RTF = {rtf:5f}")

         text = preprocess_text(text, stress)
         text = sentence_to_stress(text, stress_with_model if stress else stress_dict)
         # synthesis
         with no_grad():
             start = time.time()
+            wav = self.synthesizer(
+                text, sids=np.array(voice), decode_conf={"alpha": 1 / speed}
+            )["wav"]
         rtf = (time.time() - start) / (len(wav) / self.synthesizer.fs)
         print(f"RTF = {rtf:5f}")