--- base_model: utter-project/mHuBERT-147 license: cc-by-nc-4.0 language: - uk tags: - automatic-speech-recognition datasets: - espnet/yodas2 metrics: - wer model-index: - name: w2v-bert-2.0-uk-v2.1 results: - task: name: Automatic Speech Recognition type: automatic-speech-recognition dataset: name: common_voice_10_0 type: common_voice_10_0 config: uk split: test args: uk metrics: - name: Wer type: wer value: 0.2035 --- # HuBERT for Ukrainian ## Community - Discord: https://discord.gg/yVAjkBgmt4 - Speech Recognition: https://t.me/speech_recognition_uk - Speech Synthesis: https://t.me/speech_synthesis_uk ## Install ```text uv venv --python 3.12 source .venv/bin/activate uv pip install -r requirements.txt # in development mode uv pip install -r requirements-dev.txt ``` ## Usage ```text python run_demo.py --- Predictions: ['тема прояку не люблять говорит офіійні жерела гнштабі і мінорони цехімічна зроя окупанти же тривали час використовуютьою заборонену'] References: ['тема про яку не люблять говорити офіційні джерела у генштабі і міноборони це хімічна зброя окупанти вже тривалий час використовують хімічну зброю заборонену'] --- --- Predictions: ['всіма конвенціями якщо спочатку це були гранати здороні ту перфіксують випадки застосування'] References: ['всіма конвенціями якщо спочатку це були гранати з дронів то тепер фіксують випадки застосування'] --- --- Predictions: ['хіммічних снарядів при чому складу трон речовони різніж насідки для нших військових теж різні'] References: ['хімічних снарядів причому склад отруйної речовони різний а отже й наслідки для наших військових теж різні'] --- --- Predictions: ['використовувує на фронті все що має і хімічне збронивині тактож щи маємо справило розбиралася маріямоганесян'] References: ['використовує на фронті все що має і хімічна зброя не вийняток тож з чим маємо справу розбиралася марія моганисян'] --- --- Predictions: ['двох тисяч випадків застосування росіянами боєприпасів зпоряджених набезпечними хімічними речовинами'] References: ['двох тисяч випадків застосування росіянами боєприпасів споряджених небезпечними хімічними речовинами'] --- --- Predictions: ['на всі писані норми маріямогонесян олександр моторний спецкор марафон єдині новини'] References: ['на всі писані норми марія моганисян олександр моторний спецкор марафон єдині новини'] --- Final: WER: 0.5 | CER: 0.1198 ```