Intel
/

albert-base-v2-sst2-int8-static-inc

Text Classification

text-classfication

Intel® Neural Compressor

neural-compressor

PostTrainingStatic

Inference Endpoints

Model card Files Files and versions Community

echarlaix HF staff commited on Mar 22

Commit

e620322

•

1 Parent(s): 19ad58c

update loading instructions

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -51,10 +51,10 @@ The linear modules **albert.encoder.albert_layer_groups.0.albert_layers.0.ffn_ou
 #### Load with Intel® Neural Compressor:
 ```python
-from optimum.intel.neural_compressor import IncQuantizedModelForSequenceClassification
 model_id = "Intel/albert-base-v2-sst2-int8-static"
-int8_model = IncQuantizedModelForSequenceClassification.from_pretrained(model_id)
 ```
 ### ONNX
@@ -78,4 +78,4 @@ The calibration dataloader is the eval dataloader. The calibration sampling size
 ```python
 from optimum.onnxruntime import ORTModelForSequenceClassification
 model = ORTModelForSequenceClassification.from_pretrained('Intel/albert-base-v2-sst2-int8-static')
-```

 #### Load with Intel® Neural Compressor:
 ```python
+from optimum.intel import INCModelForSequenceClassification
 model_id = "Intel/albert-base-v2-sst2-int8-static"
+int8_model = INCModelForSequenceClassification.from_pretrained(model_id)
 ```
 ### ONNX
 ```python
 from optimum.onnxruntime import ORTModelForSequenceClassification
 model = ORTModelForSequenceClassification.from_pretrained('Intel/albert-base-v2-sst2-int8-static')
+```