Baybars commited on
Commit
99aabf2
1 Parent(s): 2ae59fb

catalan information added

Browse files
Files changed (3) hide show
  1. about.md +1 -1
  2. infer_onnx.py +7 -3
  3. about_català.md → informacio.md +11 -5
about.md CHANGED
@@ -1,7 +1,7 @@
1
  ## 📄 About
2
  Natural and efficient TTS in Catalan: 🍵+🥑 .
3
 
4
- Here you'll be able to find all the information regarding our models 🍵 Matxa and 🥑 alVoCat, which have been trained with the use of deep learning. If you want specific information on how to train these model you can find it [here](https://huggingface.co/BSC-LT/matcha-tts-cat-multiaccent) and [here](https://huggingface.co/BSC-LT/vocos-mel-22khz-cat) respectively. The code we've used is also on Github [here](https://github.com/langtech-bsc/Matcha-TTS/tree/dev-cat).
5
 
6
  ## Table of Contents
7
  <details>
 
1
  ## 📄 About
2
  Natural and efficient TTS in Catalan: 🍵+🥑 .
3
 
4
+ Here you can find all the information regarding our models 🍵 Matxa and 🥑 alVoCat, which have been trained with the use of deep learning. If you want specific information on how to train these model you can find it [here](https://huggingface.co/BSC-LT/matcha-tts-cat-multiaccent) and [here](https://huggingface.co/BSC-LT/vocos-mel-22khz-cat) respectively. The code we've used is also on Github [here](https://github.com/langtech-bsc/Matcha-TTS/tree/dev-cat).
5
 
6
  ## Table of Contents
7
  <details>
infer_onnx.py CHANGED
@@ -213,6 +213,9 @@ You can synthesize test sentences below and check the technical details in the "
213
  with open("about.md", "r", encoding="utf-8") as f:
214
  about = f.read()
215
 
 
 
 
216
  article = "Training and demo by The Language Technologies Unit from Barcelona Supercomputing Center."
217
 
218
 
@@ -262,17 +265,18 @@ matcha_inference = gr.Interface(
262
  info=f"Controls speech pace, larger values for slower pace and smaller values for faster pace",
263
  ),
264
  ],
265
- outputs=[gr.Audio(label="Matcha vocos", interactive=False, type="filepath")]
266
  )
267
 
268
- about_article = gr.Markdown(about)
 
269
 
270
  demo = gr.Blocks(theme=theme, css="./styles.css")
271
 
272
  with demo:
273
  gr.Markdown(title)
274
  gr.Markdown(description)
275
- gr.TabbedInterface([matcha_inference, about_article], ["Demo", "About"])
276
  accent_dropdown.select(fn=rs_change, inputs=accent_dropdown, outputs=speaker_dropdown)
277
  gr.Markdown(article)
278
 
 
213
  with open("about.md", "r", encoding="utf-8") as f:
214
  about = f.read()
215
 
216
+ with open("informacio.md", "r", encoding="utf-8") as f:
217
+ informacio = f.read()
218
+
219
  article = "Training and demo by The Language Technologies Unit from Barcelona Supercomputing Center."
220
 
221
 
 
265
  info=f"Controls speech pace, larger values for slower pace and smaller values for faster pace",
266
  ),
267
  ],
268
+ outputs=[gr.Audio(label="Matxa + alVoCat", interactive=False, type="filepath")]
269
  )
270
 
271
+ about_tab = gr.Markdown(about)
272
+ informacio_tab = gr.Markdown(informacio)
273
 
274
  demo = gr.Blocks(theme=theme, css="./styles.css")
275
 
276
  with demo:
277
  gr.Markdown(title)
278
  gr.Markdown(description)
279
+ gr.TabbedInterface([matcha_inference, about_tab, informacio_tab], ["Demo", "About", "Informació"])
280
  accent_dropdown.select(fn=rs_change, inputs=accent_dropdown, outputs=speaker_dropdown)
281
  gr.Markdown(article)
282
 
about_català.md → informacio.md RENAMED
@@ -1,7 +1,7 @@
1
  ## 📄 Sobre
2
  TTS natural i eficient en català: utilitzant Matcha-TTS amb la llengua catalana.
3
 
4
- Aquí trobaràs tota la informació sobre els nostres models Matxa 🍵 i alVoCat 🥑 , els quals han estat entrenats amb l'ús de l'aprenentatge profund. Si desitges informació específica sobre com entrenar aquests models, pots trobar-la [aquí](https://huggingface.co/BSC-LT/matcha-tts-cat-multispeaker) i [aquí](https://huggingface.co/BSC-LT/vocos-mel-22khz-cat) respectivament. El codi que hem utilitzat també es troba a Github [aquí](https://github.com/langtech-bsc/Matcha-TTS/tree/dev-cat).
5
 
6
  ## Taula de continguts
7
  <details>
@@ -22,12 +22,14 @@ Aquí trobaràs tota la informació sobre els nostres models Matxa 🍵 i alVoCa
22
 
23
  La importància de les tecnologies de text-a-veu (TTS) de codi obert per a les llengües minoritàries mai és exagerada. Aquestes tecnologies democratitzen l'accés a les solucions de TTS, proporcionant un marc perquè les comunitats desenvolupin i adapten models segons les seves necessitats lingüístiques. Per això, utilitzant un conjunt de tecnologies, hem desenvolupat diferents solucions de TTS de codi obert i en català.
24
 
25
- En primer lloc, vam crear un [model TTS per al català central](https://huggingface.co/BSC-LT/matcha-tts-cat-multispeaker) ajustant el model en anglès de Matcha-TTS. Matcha-TTS és un model d'avantguarda que utilitza aprenentatge profund, una forma d'IA, per entrenar models que reprodueixen patrons de parla humana. D'aquesta manera, permet generar veus sintètiques realistes a partir de text escrit. Després d'això, vam ajustar aquest model en català central per a tres altres dialectes catalans:
26
 
27
  * Balear
28
- * Nord-Occidental
 
29
  * Valencià
30
 
 
31
 
32
  ## Usos previstos i limitacions
33
 
@@ -276,7 +278,11 @@ Per a més informació, si us plau, envia un correu electrònic a <langtech@bsc.
276
  Copyright(c) 2023 by Language Technologies Unit, Barcelona Supercomputing Center.
277
 
278
  ### Llicència
279
- [Apache License, Version 2.0](https://www.apache.org/licenses/LICENSE-2.0)
 
 
280
 
281
  ### Finançament
282
- Aquest treball ha estat promogut i finançat per la Generalitat de Catalunya a través del [Projecte Aina](https://projecteaina.cat/).
 
 
 
1
  ## 📄 Sobre
2
  TTS natural i eficient en català: utilitzant Matcha-TTS amb la llengua catalana.
3
 
4
+ Aquí trobaràs tota la informació sobre els nostres models 🍵 Matxa i 🥑 alVoCat ,els quals han estat entrenats amb l'ús de l'aprenentatge profund. Si desitges informació específica sobre com entrenar aquests models, pots trobar-la [aquí](https://huggingface.co/BSC-LT/matcha-tts-cat-multiaccent) i [aquí](https://huggingface.co/BSC-LT/vocos-mel-22khz-cat) respectivament. El codi que hem utilitzat també es troba a Github [aquí](https://github.com/langtech-bsc/Matcha-TTS/tree/dev-cat).
5
 
6
  ## Taula de continguts
7
  <details>
 
22
 
23
  La importància de les tecnologies de text-a-veu (TTS) de codi obert per a les llengües minoritàries mai és exagerada. Aquestes tecnologies democratitzen l'accés a les solucions de TTS, proporcionant un marc perquè les comunitats desenvolupin i adapten models segons les seves necessitats lingüístiques. Per això, utilitzant un conjunt de tecnologies, hem desenvolupat diferents solucions de TTS de codi obert i en català.
24
 
25
+ Us presentem 🍵 Matxa, el primer model TTS neuronal multiparlant i multidialectal. Es combina amb el model vocoder 🥑 alVoCat, per generar unes veus expressives i d'alta qualitat, a més que funciona de una manera eficient en quatre dialectes:
26
 
27
  * Balear
28
+ * Central
29
+ * Nord-occidental
30
  * Valencià
31
 
32
+ Tots dos models s'ha entrenat amb dades obertes;🍵 Els models Matxa són lliures per utilitzar-los amb finalitats no comercials, però per l'ús comercial necessita una llicència directament del locutor/de la locutora. Per obtenir més informació, consulteu la secció [Llicència](#informació-adicional) i la [pàgina del model](https://huggingface.co/BSC-LT/matcha-tts-cat-multiaccent/).
33
 
34
  ## Usos previstos i limitacions
35
 
 
278
  Copyright(c) 2023 by Language Technologies Unit, Barcelona Supercomputing Center.
279
 
280
  ### Llicència
281
+ Aquesta pàgina de demostració i els scripts d'inferència es troben sota [GNU General Public License v3.0](https://www.gnu.org/licenses/gpl-3.0.en.html)
282
+
283
+ Els pesos del model tenen la llicència [Creative Commons Attribution Non-comercial 4.0](https://www.creativecommons.org/licenses/by-nc/4.0/). Aquests models són lliures per l'ús no comercial i d'investigació. L'ús comercial és possible mitjançant una llicència directe amb el locutor/la locutora. Per a més informació, contacteu amb <[email protected]> i <[email protected]>. Per obtenir més informació, consulteu la [pàgina del model](https://huggingface.co/BSC-LT/matcha-tts-cat-multiaccent/).
284
 
285
  ### Finançament
286
+ Aquest treball ha estat promogut i finançat per la Generalitat de Catalunya a través del [Projecte Aina](https://projecteaina.cat/).
287
+
288
+ Una part de l'entrenament dels models va ser possible gràcies al temps de comput proporcionat pel [Centro de Supercomputación de Galicia (CESGA)](https://www.cesga.es/) i també pel [Barcelona Supercomputing Center](https://www.bsc.es/) amb el seu MareNostrum 5.