hataphu commited on
Commit
bbf4396
1 Parent(s): 55e9761

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +22 -1
README.md CHANGED
@@ -9,4 +9,25 @@ base_model:
9
  pipeline_tag: automatic-speech-recognition
10
  ---
11
 
12
- Tôi đã fine-tune với 15Gb dữ liệu audio với kết quả Wer: 24.46
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
9
  pipeline_tag: automatic-speech-recognition
10
  ---
11
 
12
+ Tôi đã fine-tune với 15Gb dữ liệu audio với kết quả Wer: 24.46
13
+
14
+ ## Cách sử dụng
15
+ ```
16
+ mydevice = 'cuda'
17
+ processor = Wav2Vec2Processor.from_pretrained("hataphu/wav2vec2-vi-300m")
18
+ model = Wav2Vec2ForCTC.from_pretrained("hataphu/wav2vec2-vi-300m")
19
+ model.to(mydevice)
20
+ model.eval()
21
+ audio_input, sampling_rate = torchaudio.load('audio-path-file')
22
+
23
+ input_values = processor(
24
+ audio_input.squeeze().numpy(), sampling_rate=sampling_rate
25
+ ).input_values[0]
26
+
27
+ logits = model(torch.tensor(input_values).unsqueeze(0).to(mydevice)).logits
28
+ predicted_ids = torch.argmax(logits, dim=-1)
29
+ transcription = processor.decode(predicted_ids[0])
30
+ print(transcription)
31
+ ```
32
+
33
+