Upload ORT format for 430m model

Files changed (9) hide show

.gitattributes CHANGED Viewed

@@ -29,3 +29,7 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+430m/rwkv-4-pile-430m-uint8.ort filter=lfs diff=lfs merge=lfs -text
+430m/rwkv-4-pile-430m-uint8.with_runtime_opt.ort filter=lfs diff=lfs merge=lfs -text
+430m/rwkv-4-pile-430m.ort filter=lfs diff=lfs merge=lfs -text
+430m/rwkv-4-pile-430m.with_runtime_opt.ort filter=lfs diff=lfs merge=lfs -text

430m/rwkv-4-pile-430m-uint8.ort ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:87993b731797c9163a18ca5283fb636c134b54626e38959d4fe0825d26b47b71
+size 437061704

430m/rwkv-4-pile-430m-uint8.required_operators.config ADDED Viewed

+# Generated from model/s:
+# - /content/RWKV-LM/RWKV-v4/rwkv-uint8.ort
+ai.onnx;1;LayerNormalization
+ai.onnx;11;DynamicQuantizeLinear
+ai.onnx;13;Concat,DequantizeLinear,Exp,Gather,Max,Sigmoid,Unsqueeze
+ai.onnx;14;Add,Div,Mul,Relu,Sub
+com.microsoft;1;MatMulIntegerToFloat

430m/rwkv-4-pile-430m-uint8.required_operators.with_runtime_opt.config ADDED Viewed

+# Generated from model/s:
+# - /content/RWKV-LM/RWKV-v4/rwkv-uint8.with_runtime_opt.ort
+# - /content/RWKV-LM/RWKV-v4/tmpkudq58_8.without_runtime_opt/rwkv-uint8.ort
+ai.onnx;10;MatMulInteger
+ai.onnx;11;DynamicQuantizeLinear
+ai.onnx;13;Cast,Concat,DequantizeLinear,Exp,Gather,Max,Pow,ReduceMean,Sigmoid,Sqrt,Unsqueeze
+ai.onnx;14;Add,Div,Mul,Relu,Sub

430m/rwkv-4-pile-430m-uint8.with_runtime_opt.ort ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:338af68cf14dec59c64544a66d5a13533a3ef4823fc162908473604febb28786
+size 438774216

430m/rwkv-4-pile-430m.ort ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:ed6b7d9e5b9805b4c53aefffa00533a66fe4b0a1406e9cee7124914852e42ef6
+size 1727793456

430m/rwkv-4-pile-430m.required_operators.config ADDED Viewed

+# Generated from model/s:
+# - /content/RWKV-LM/RWKV-v4/rwkv.ort
+ai.onnx;1;LayerNormalization
+ai.onnx;13;Concat,Exp,Gather,MatMul,Max,Sigmoid,Unsqueeze
+ai.onnx;14;Add,Div,Mul,Relu,Sub

430m/rwkv-4-pile-430m.required_operators.with_runtime_opt.config ADDED Viewed

+# Generated from model/s:
+# - /content/RWKV-LM/RWKV-v4/rwkv.with_runtime_opt.ort
+# - /content/RWKV-LM/RWKV-v4/tmpjyhbv_6_.without_runtime_opt/rwkv.ort
+ai.onnx;13;Concat,Exp,Gather,MatMul,Max,Pow,ReduceMean,Sigmoid,Sqrt,Unsqueeze
+ai.onnx;14;Add,Div,Mul,Relu,Sub

430m/rwkv-4-pile-430m.with_runtime_opt.ort ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:79113d0ebfc391a3598b9ebe3d22bb03ec7413f71234be66f4811b08a46f37f1
+size 1729404824