Distil-Whisper: Robust Knowledge Distillation via Large-Scale Pseudo Labelling
Paper
•
2311.00430
•
Published
•
57
Note MaskLID方法通過屏蔽主要語言特徵,有效改善了CS場景下的語言識別,特別在多語言混合的句子中表現出色。該方法不僅提高了識別精度,且適用範圍廣泛,能處理大量網絡數據,對未來的自然語言處理應用有重要意義。