Spaces:

projecte-aina
/

matxa-alvocat-tts-ca

Running

App Files Files Community

Baybars commited on Apr 19

Commit

99aabf2

•

1 Parent(s): 2ae59fb

catalan information added

Browse files

Files changed (3) hide show

about.md +1 -1
infer_onnx.py +7 -3
about_català.md → informacio.md +11 -5

about.md CHANGED Viewed

@@ -1,7 +1,7 @@
 ## 📄 About
 Natural and efficient TTS in Catalan: 🍵+🥑 .
-Here you'll be able to find all the information regarding our models 🍵 Matxa and 🥑 alVoCat, which have been trained with the use of deep learning. If you want specific information on how to train these model you can find it [here](https://huggingface.co/BSC-LT/matcha-tts-cat-multiaccent) and [here](https://huggingface.co/BSC-LT/vocos-mel-22khz-cat) respectively. The code we've used is also on Github [here](https://github.com/langtech-bsc/Matcha-TTS/tree/dev-cat).
 ## Table of Contents
 <details>

 ## 📄 About
 Natural and efficient TTS in Catalan: 🍵+🥑 .
+Here you can find all the information regarding our models 🍵 Matxa and 🥑 alVoCat, which have been trained with the use of deep learning. If you want specific information on how to train these model you can find it [here](https://huggingface.co/BSC-LT/matcha-tts-cat-multiaccent) and [here](https://huggingface.co/BSC-LT/vocos-mel-22khz-cat) respectively. The code we've used is also on Github [here](https://github.com/langtech-bsc/Matcha-TTS/tree/dev-cat).
 ## Table of Contents
 <details>

infer_onnx.py CHANGED Viewed

@@ -213,6 +213,9 @@ You can synthesize test sentences below and check the technical details in the "
 with open("about.md", "r", encoding="utf-8") as f:
     about = f.read()
 article = "Training and demo by The Language Technologies Unit from Barcelona Supercomputing Center."
@@ -262,17 +265,18 @@ matcha_inference = gr.Interface(
             info=f"Controls speech pace, larger values for slower pace and smaller values for faster pace",
         ),
     ],
-    outputs=[gr.Audio(label="Matcha vocos", interactive=False, type="filepath")]
 )
-about_article = gr.Markdown(about)
 demo = gr.Blocks(theme=theme, css="./styles.css")
 with demo:
     gr.Markdown(title)
     gr.Markdown(description)
-    gr.TabbedInterface([matcha_inference, about_article], ["Demo", "About"])
     accent_dropdown.select(fn=rs_change, inputs=accent_dropdown, outputs=speaker_dropdown)
     gr.Markdown(article)

 with open("about.md", "r", encoding="utf-8") as f:
     about = f.read()
+with open("informacio.md", "r", encoding="utf-8") as f:
+    informacio = f.read()
 article = "Training and demo by The Language Technologies Unit from Barcelona Supercomputing Center."
             info=f"Controls speech pace, larger values for slower pace and smaller values for faster pace",
         ),
     ],
+    outputs=[gr.Audio(label="Matxa + alVoCat", interactive=False, type="filepath")]
 )
+about_tab = gr.Markdown(about)
+informacio_tab = gr.Markdown(informacio)
 demo = gr.Blocks(theme=theme, css="./styles.css")
 with demo:
     gr.Markdown(title)
     gr.Markdown(description)
+    gr.TabbedInterface([matcha_inference, about_tab, informacio_tab], ["Demo", "About", "Informació"])
     accent_dropdown.select(fn=rs_change, inputs=accent_dropdown, outputs=speaker_dropdown)
     gr.Markdown(article)

about_català.md → informacio.md RENAMED Viewed

@@ -1,7 +1,7 @@
 ## 📄 Sobre
 TTS natural i eficient en català: utilitzant Matcha-TTS amb la llengua catalana.
-Aquí trobaràs tota la informació sobre els nostres models Matxa 🍵 i alVoCat 🥑 , els quals han estat entrenats amb l'ús de l'aprenentatge profund. Si desitges informació específica sobre com entrenar aquests models, pots trobar-la [aquí](https://huggingface.co/BSC-LT/matcha-tts-cat-multispeaker) i [aquí](https://huggingface.co/BSC-LT/vocos-mel-22khz-cat) respectivament. El codi que hem utilitzat també es troba a Github [aquí](https://github.com/langtech-bsc/Matcha-TTS/tree/dev-cat).
 ## Taula de continguts
 <details>
@@ -22,12 +22,14 @@ Aquí trobaràs tota la informació sobre els nostres models Matxa 🍵 i alVoCa
 La importància de les tecnologies de text-a-veu (TTS) de codi obert per a les llengües minoritàries mai és exagerada. Aquestes tecnologies democratitzen l'accés a les solucions de TTS, proporcionant un marc perquè les comunitats desenvolupin i adapten models segons les seves necessitats lingüístiques. Per això, utilitzant un conjunt de tecnologies, hem desenvolupat diferents solucions de TTS de codi obert i en català.
-En primer lloc, vam crear un [model TTS per al català central](https://huggingface.co/BSC-LT/matcha-tts-cat-multispeaker) ajustant el model en anglès de Matcha-TTS. Matcha-TTS és un model d'avantguarda que utilitza aprenentatge profund, una forma d'IA, per entrenar models que reprodueixen patrons de parla humana. D'aquesta manera, permet generar veus sintètiques realistes a partir de text escrit. Després d'això, vam ajustar aquest model en català central per a tres altres dialectes catalans:
 * Balear
-* Nord-Occidental
 * Valencià
 ## Usos previstos i limitacions
@@ -276,7 +278,11 @@ Per a més informació, si us plau, envia un correu electrònic a <langtech@bsc.
 Copyright(c) 2023 by Language Technologies Unit, Barcelona Supercomputing Center.
 ### Llicència
-[Apache License, Version 2.0](https://www.apache.org/licenses/LICENSE-2.0)
 ### Finançament
-Aquest treball ha estat promogut i finançat per la Generalitat de Catalunya a través del [Projecte Aina](https://projecteaina.cat/).

 ## 📄 Sobre
 TTS natural i eficient en català: utilitzant Matcha-TTS amb la llengua catalana.
+Aquí trobaràs tota la informació sobre els nostres models 🍵 Matxa i 🥑 alVoCat ,els quals han estat entrenats amb l'ús de l'aprenentatge profund. Si desitges informació específica sobre com entrenar aquests models, pots trobar-la [aquí](https://huggingface.co/BSC-LT/matcha-tts-cat-multiaccent) i [aquí](https://huggingface.co/BSC-LT/vocos-mel-22khz-cat) respectivament. El codi que hem utilitzat també es troba a Github [aquí](https://github.com/langtech-bsc/Matcha-TTS/tree/dev-cat).
 ## Taula de continguts
 <details>
 La importància de les tecnologies de text-a-veu (TTS) de codi obert per a les llengües minoritàries mai és exagerada. Aquestes tecnologies democratitzen l'accés a les solucions de TTS, proporcionant un marc perquè les comunitats desenvolupin i adapten models segons les seves necessitats lingüístiques. Per això, utilitzant un conjunt de tecnologies, hem desenvolupat diferents solucions de TTS de codi obert i en català.
+Us presentem 🍵 Matxa, el primer model TTS neuronal multiparlant i multidialectal. Es combina amb el model vocoder 🥑 alVoCat, per generar unes veus expressives i d'alta qualitat, a més que funciona de una manera eficient en quatre dialectes:
 * Balear
+* Central
+* Nord-occidental
 * Valencià
+Tots dos models s'ha entrenat amb dades obertes;🍵 Els models Matxa són lliures per utilitzar-los amb finalitats no comercials, però per l'ús comercial necessita una llicència directament del locutor/de la locutora. Per obtenir més informació, consulteu la secció [Llicència](#informació-adicional) i la [pàgina del model](https://huggingface.co/BSC-LT/matcha-tts-cat-multiaccent/).
 ## Usos previstos i limitacions
 Copyright(c) 2023 by Language Technologies Unit, Barcelona Supercomputing Center.
 ### Llicència
+Aquesta pàgina de demostració i els scripts d'inferència es troben sota [GNU General Public License v3.0](https://www.gnu.org/licenses/gpl-3.0.en.html)
+Els pesos del model tenen la llicència [Creative Commons Attribution Non-comercial 4.0](https://www.creativecommons.org/licenses/by-nc/4.0/). Aquests models són lliures per l'ús no comercial i d'investigació. L'ús comercial és possible mitjançant una llicència directe amb el locutor/la locutora. Per a més informació, contacteu amb <[email protected]> i <[email protected]>. Per obtenir més informació, consulteu la [pàgina del model](https://huggingface.co/BSC-LT/matcha-tts-cat-multiaccent/).
 ### Finançament
+Aquest treball ha estat promogut i finançat per la Generalitat de Catalunya a través del [Projecte Aina](https://projecteaina.cat/).
+Una part de l'entrenament dels models va ser possible gràcies al temps de comput proporcionat pel [Centro de Supercomputación de Galicia (CESGA)](https://www.cesga.es/) i també pel [Barcelona Supercomputing Center](https://www.bsc.es/) amb el seu MareNostrum 5.