README.md · ysnow9876/alephbert-base-finetuned-for-shut at main

metadata

language:
  - he
tags:
  - language model
datasets:
  - responsa

AlephBERT-base-finetuned-for-shut

Hebrew Language Model

How to use:

from transformers import AutoModelForMaskedLM, AutoTokenizer

checkpoint = 'ysnow9876/alephbert-base-finetuned-for-shut'

tokenizer = AutoTokenizer.from_pretrained(checkpoint)

model= AutoModelForMaskedLM.from_pretrained(checkpoint)

#if not finetuning - disable dropout

model.eval()

Training Data

about 26,000 different responsa from different rabbis from the past few hundred years