hataphu
/

wav2vec2-vi-300m

Automatic Speech Recognition

Model card Files Files and versions Community

hataphu commited on 5 days ago

Commit

bbf4396

•

1 Parent(s): 55e9761

Update README.md

Files changed (1) hide show

README.md +22 -1

README.md CHANGED Viewed

@@ -9,4 +9,25 @@ base_model:
 pipeline_tag: automatic-speech-recognition
 ---
-Tôi đã fine-tune với 15Gb dữ liệu audio với kết quả Wer: 24.46

 pipeline_tag: automatic-speech-recognition
 ---
+Tôi đã fine-tune với 15Gb dữ liệu audio với kết quả Wer: 24.46
+## Cách sử dụng
+```
+mydevice = 'cuda'
+processor = Wav2Vec2Processor.from_pretrained("hataphu/wav2vec2-vi-300m")
+model = Wav2Vec2ForCTC.from_pretrained("hataphu/wav2vec2-vi-300m")
+model.to(mydevice)
+model.eval()
+audio_input, sampling_rate = torchaudio.load('audio-path-file')
+input_values = processor(
+    audio_input.squeeze().numpy(), sampling_rate=sampling_rate
+).input_values[0]
+logits = model(torch.tensor(input_values).unsqueeze(0).to(mydevice)).logits
+predicted_ids = torch.argmax(logits, dim=-1)
+transcription = processor.decode(predicted_ids[0])
+print(transcription)
+```