Add new SentenceTransformer model.

Browse files

Files changed (12) hide show

1_Pooling/config.json +10 -0
README.md +634 -0
added_tokens.json +3 -0
config.json +28 -0
config_sentence_transformers.json +10 -0
model.safetensors +3 -0
modules.json +14 -0
sentence_bert_config.json +4 -0
sentencepiece.bpe.model +3 -0
special_tokens_map.json +56 -0
tokenizer.json +0 -0
tokenizer_config.json +90 -0

1_Pooling/config.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "word_embedding_dimension": 768,
+  "pooling_mode_cls_token": false,
+  "pooling_mode_mean_tokens": true,
+  "pooling_mode_max_tokens": false,
+  "pooling_mode_mean_sqrt_len_tokens": false,
+  "pooling_mode_weightedmean_tokens": false,
+  "pooling_mode_lasttoken": false,
+  "include_prompt": true
+}

README.md ADDED Viewed

	@@ -0,0 +1,634 @@

+---
+language: []
+library_name: sentence-transformers
+tags:
+- sentence-transformers
+- sentence-similarity
+- feature-extraction
+- generated_from_trainer
+- dataset_size:5000
+- loss:CoSENTLoss
+base_model: ymelka/camembert-cosmetic-finetuned
+datasets: []
+metrics:
+- pearson_cosine
+- spearman_cosine
+- pearson_manhattan
+- spearman_manhattan
+- pearson_euclidean
+- spearman_euclidean
+- pearson_dot
+- spearman_dot
+- pearson_max
+- spearman_max
+widget:
+- source_sentence: Un soin régulateur de pores hautement efficace, conçu pour réduire
+    visiblement l'apparence des pores dilatés. Sa formule ciblée aide à affiner le
+    grain de peau et à réguler la production de sébum, pour une peau plus lisse et
+    uniforme. Idéal pour les peaux matures en quête de perfection.
+  sentences:
+  - La Crème Confort 1ères Rides de Coup D’Eclat est un soin hydratant apaisant qui
+    procure une hydratation optimale à la peau tout en la régénérant. En 28 jours,
+    la peau devient moins sensible et réactive, tandis que les premiers signes de
+    l'âge sont corrigés et prévenus. Grâce à des ingrédients tels que l'huile de pépins
+    de raisin, l'huile de macadamia et la vitamine E, cette crème redonne à la peau
+    son éclat et sa vitalité, tout en lissant les ridules et affinant le grain de
+    peau. Pour une utilisation externe sur le visage et le cou, cette formule non-comédogène
+    convient à tous les types de peaux, y compris les peaux sensibles et réactives.
+    Il est recommandé d'appliquer la crème matin et soir par un léger massage sur
+    une peau démaquillée. Il est important de suivre les instructions d'utilisation
+    et de ne pas dépasser la posologie recommandée.
+  - La Source Micellaire Enchantée Rose D'Antan de Garancia est un produit de parapharmacie
+    multifonctionnel qui nettoie, démaquille, hydrate, apaise et illumine la peau
+    du visage, des yeux et des lèvres. Grâce à sa formule enrichie en actifs brevetés
+    hydratants et apaisants, cette eau micellaire réduit de manière significative
+    les sensations d'irritation et de picotement. Composée à 99,5% d'ingrédients d'origine
+    naturelle, elle contient notamment de l'extrait de racine de chicorée, un prébiotique
+    nourrissant pour le microbiote cutané. Pour l'utiliser, il suffit de tourner la
+    pompe vers la gauche, d'imbiber un coton d'eau micellaire et de le passer sur
+    le visage, les yeux et les lèvres sans rinçage. Laissez poser 5 secondes sur les
+    yeux avant de démaquiller. Ce produit convient à tous les types de peau et est
+    présenté dans un flacon pompe de 400 ml.
+  - Le tonique hydratant Cosrx Hydrium est un produit de parapharmacie qui rend la
+    peau plus fraîche et hydratée grâce à sa formule contenant de la vitamine B5 et
+    de l'acide hyaluronique. Ce tonique hydratant agit comme une base essentielle
+    pour la santé de la peau, en formant une barrière d'hydratation et en optimisant
+    l'équilibre des peaux abîmées. Il convient à tous les types de peau, y compris
+    les peaux sèches et à tendance acnéique. Les principaux ingrédients actifs incluent
+    des acides hyaluroniques de type 6, du D-panthénol et de l'allantoïne pour une
+    hydratation en profondeur et un effet apaisant sur les peaux sensibles. Pour une
+    utilisation optimale, appliquez le tonique après le nettoyage du visage, en massant
+    pour une meilleure absorption. Il peut également être utilisé comme masque en
+    feuille, brume ou mélange nettoyant. Présenté en flacon de 150 ml, ce tonique
+    hydratant est un allié idéal pour une peau fraîche et hydratée au quotidien.
+- source_sentence: Un soin hydratant et revitalisant qui apporte un éclat naturel
+    à la peau. Enrichi en ingrédients nourrissants et anti-âge, ce soin aide à réduire
+    les signes de fatigue et à améliorer la texture de la peau. Parfait pour revitaliser
+    la peau mature et lui redonner toute sa jeunesse.
+  sentences:
+  - L'Alphanova Solide Exfoliant Visage est un produit naturel et végan qui purifie
+    la peau et revitalise le teint. Composé d'huiles bio d'amande douce et de jojoba,
+    de feuilles de verveine et de poudre de coques de noix, il convient aux peaux
+    normales. Sans huile de palme ni sulfate, ce duo moussant doux et végétal offre
+    une mousse généreuse et onctueuse au parfum frais de verveine. Avec 99,9% d'ingrédients
+    d'origine naturelle, dont 73,4% issus de l'agriculture biologique, cet exfoliant
+    visage Alphanova permet jusqu'à 100 utilisations. Pour l'utiliser, il suffit d'appliquer
+    le nettoyant sur le visage humidifié, de masser délicatement en évitant le contour
+    des yeux, puis de rincer abondamment. Présenté en deux formats de 75g, cet exfoliant
+    offre une expérience de soin agréable et respectueuse de l'environnement.
+  - Le Clarins Doux Nettoyant Moussant Apaisant est spécialement conçu pour les femmes
+    ayant une peau très sèche ou sensible. Grâce à sa formule aux herbes des Alpes,
+    ce nettoyant apaise et adoucit la peau tout en la protégeant des agressions extérieures.
+    Enrichi en extraits de saponaire, de reine des près, d'aloé vera, de camomille
+    bio et de beurre de karité, il nettoie en douceur, purifie, hydrate et apaise
+    la peau. Sa texture mousse fine et onctueuse laisse la peau parfaitement nettoyée,
+    douce et protégée. Ce nettoyant peut être utilisé matin et/ou soir en massant
+    délicatement sur le visage et le cou, en évitant le contour des yeux. Il est recommandé
+    de rincer abondamment après utilisation. Évitez le contour des yeux lors de l'application.
+    Disponible en tube de 125 ml, ce nettoyant est idéal pour un nettoyage en douceur
+    des peaux très sèches ou sensibles.
+  - L'Eau Parfumée Bienfaisante Shiso de Roger&Gallet est un parfum unique aux notes
+    fraîches et raffinées, mêlant le shiso, le petitgrain et la mandarine pour une
+    sensation de fraîcheur naturelle. Enrichi en pivoine et en santal, ce parfum vert
+    fusant apporte une énergie vibrante et permet de s'ouvrir à de nouveaux horizons.
+    Idéal pour le corps, ce produit peut être utilisé en vaporisation pour accentuer
+    son effet énergisant. Les principaux ingrédients actifs incluent l'extrait de
+    feuille de Perilla ocymoides, connu pour ses propriétés revitalisantes. Il est
+    recommandé de vaporiser un nuage de parfum devant soi et de le traverser pour
+    profiter pleinement de ses bienfaits. Il est conseillé de ne pas utiliser ce produit
+    sur une peau irritée ou lésée. Profitez de cette fragrance unique pour vous sentir
+    revitalisé et plein d'énergie au quotidien.
+- source_sentence: Un nettoyant doux et hydratant, spécialement formulé pour éliminer
+    les impuretés tout en apportant de l'éclat à la peau. Sa formule adaptée aux peaux
+    matures aide à lutter contre les taches et les imperfections, tout en respectant
+    la sensibilité de la peau.
+  sentences:
+  - Le nettoyant visage naturel solide Respire est spécialement conçu pour les peaux
+    sensibles, offrant une formule douce et naturelle enrichie en huile de lin Bio,
+    huile de tournesol Bio et beurre de karité Bio. Ces ingrédients apaisent, hydratent
+    et protègent la peau, la laissant douce et saine. Sa formule sans ingrédients
+    controversés convient parfaitement aux peaux sensibles. Facile à utiliser, il
+    suffit de frotter doucement le nettoyant sur le visage humidifié, de masser légèrement
+    la peau et de rincer. Vegan et non-testé sur les animaux, ce nettoyant est testé
+    dermatologiquement et fabriqué en France. Il est idéal pour une peau apaisée et
+    saine, et convient aux peaux sensibles. Il est recommandé de rincer immédiatement
+    en cas de contact avec les yeux.
+  - Le Gamarde Lait Nettoyant Douceur Peaux Délicates Bio est un nettoyant et démaquillant
+    doux spécialement conçu pour les peaux délicates, sèches ou mixtes. Sa formule
+    à base d'ingrédients naturels et biologiques, tels que l'eau de Gamarde les Bains,
+    l'huile d'argan et l'huile de noisette, permet d'éliminer en douceur les impuretés
+    et le maquillage tenace tout en respectant l'équilibre de la peau. Enrichi en
+    huiles essentielles de Palmarosa et d'orange douce, ce lait nettoyant laisse la
+    peau propre, douce et apaisée. Pour l'utiliser, il suffit d'appliquer une petite
+    quantité sur le visage et le cou, puis de retirer avec un coton sec avant de tonifier
+    la peau avec la Lotion Apaisante Douceur. Ce produit convient parfaitement pour
+    un usage quotidien et ne présente aucune contre-indication particulière.
+  - La serviette à cheveux Les Tendances D'Emma en couleur marron est un accessoire
+    pratique et efficace pour sécher les cheveux en douceur. Fabriquée à partir de
+    90% de viscose de bambou et 10% de polyester, elle absorbe 4 fois mieux qu'une
+    serviette classique. Son attache astucieuse permet de la maintenir en place sur
+    la tête, évitant ainsi de traumatiser les cheveux lors du séchage. Idéale pour
+    tous, y compris ceux qui ont opté pour des colorations naturelles, cette serviette
+    simplifie la vie au quotidien. Facile à utiliser, il suffit de la placer sur la
+    tête, de tourner et de glisser dans l'attache prévue. Lavable en machine, elle
+    est pratique et écologique. Cette serviette à cheveux est conçue, fabriquée et
+    imprimée en France dans une démarche éco-responsable. Un produit incontournable
+    pour prendre soin de ses cheveux en toute simplicité.
+- source_sentence: Un soin anti-rides et régulateur de sébum, spécialement conçu pour
+    traiter les rides et ridules tout en régulant l'excès de sébum. Sa formule hydratante
+    et apaisante convient parfaitement aux peaux sensibles.
+  sentences:
+  - Le Phyt's Men Soin Anti-Rides est un fluide frais et non gras conçu pour atténuer
+    les premiers signes de l'âge chez les hommes. Certifié Bio et d'origine naturelle,
+    ce soin hydrate, raffermit et illumine la peau masculine. Sa formule contient
+    des huiles végétales de sésame, noisette, chanvre, nigelle et beurre de karité,
+    ainsi que des huiles essentielles de petit grain et géranium, pour leurs propriétés
+    protectrices, apaisantes et tonifiantes. L'extrait de ginseng contribue à revitaliser
+    la peau. Il est recommandé d'appliquer ce produit quotidiennement sur l'ensemble
+    du visage. Ce soin est destiné à lutter contre les premiers signes de l'âge et
+    est à usage externe uniquement. Il convient de noter que ce produit est déconseillé
+    en cas d'allergie à l'un de ses composants.
+  - L'Eau Thermale Spray Brumisateur Apaisant d'Avène est un soin essentiel pour les
+    peaux sensibles, hypersensibles, allergiques et irritées. Grâce à sa composition
+    unique en eau thermale d'Avène, ce spray apaise et sublime toutes les peaux, même
+    les plus sensibles, en leur procurant une sensation d'apaisement, de confort et
+    de bien-être. Les propriétés apaisantes et anti-irritantes de l'eau thermale d'Avène
+    ont été démontrées par de nombreux travaux scientifiques, en faisant un véritable
+    principe actif pour le traitement des affections cutanées. Il est recommandé pour
+    les peaux atopiques, sébo-squameuses, couperosiques et sujettes aux photo-allergies.
+    Les principaux ingrédients actifs de ce spray sont l'eau thermale Avène et le
+    gaz (nitrogène), qui contribuent à apaiser la peau et à la protéger. Pour l'utiliser,
+    il suffit de pulvériser une fine brume sur le visage. Ce soin a été testé par
+    100 utilisateurs qui ont tous apprécié ses bienfaits. Il est important de noter
+    que ce produit est contre-indiqué en cas d'allergie à l'un de ses composants.
+  - Le soin raffermissant corps et buste Copaïba Demain L'Empire 200ml est un produit
+    de parapharmacie de haute qualité, formulé avec des ingrédients naturels et actifs
+    pour offrir à la peau une hydratation, une protection et une fermeté optimales.
+    Grâce à sa composition riche en huile de macadamia, beurre de babassu et autres
+    actifs puissants, ce soin aide à améliorer l'élasticité de la peau, à réduire
+    les rides, à prévenir les vergetures et à protéger contre les agressions extérieures.
+    En utilisant ce produit quotidiennement, la peau retrouve sa jeunesse et sa vitalité,
+    avec une texture douce et un parfum frais et vivifiant. Les principaux ingrédients
+    actifs tels que la chitine, l'extrait végétal tropical et l'acide hyaluronique
+    agissent en synergie pour rajeunir la peau et lui apporter une hydratation optimale.
+    Il est recommandé d'appliquer ce soin sur tout le corps, en massant délicatement
+    jusqu'à absorption complète. Il est conseillé de l'utiliser régulièrement pour
+    des résultats visibles en seulement quelques mois. Il est important de noter que
+    ce produit est destiné à un usage externe uniquement et qu'il est préférable de
+    consulter un professionnel de la santé en cas de réaction allergique.
+- source_sentence: En complément du nettoyant et du soin, il est recommandé d'utiliser
+    un masque purifiant et matifiant une à deux fois par semaine. Ce masque aidera
+    à resserrer les pores, purifier la peau en profondeur et réguler l'excès de sébum
+    pour un teint plus éclatant et uniforme.
+  sentences:
+  - La Crème Moussante Nettoyante Hydratante CeraVe est un produit développé en collaboration
+    avec des dermatologues pour nettoyer, démaquiller et hydrater en douceur les peaux
+    normales à sèches. Enrichie en céramides essentiels, acide hyaluronique et acides
+    aminés, sa formule élimine efficacement les impuretés, la pollution et le maquillage
+    longue tenue tout en restaurant la barrière cutanée. Grâce à la Technologie MVE,
+    les actifs sont diffusés en continu pour une hydratation prolongée. Cette crème
+    convient pour le visage et les yeux, est hypoallergénique et non-comédogène. Utilisez-la
+    matin et soir sur une peau humide, faites mousser et rincez abondamment. Présentée
+    en flacon pompe de 236 ml, elle laisse la peau douce, hydratée et propre sans
+    laisser de résidus.
+  - Le Fond de Teint Correcteur Fluide Avène en teinte miel est spécialement conçu
+    pour corriger les imperfections cutanées modérées et unifier le teint de manière
+    naturelle. Sa formule résistante à l'eau et à la sueur offre une haute tenue tout
+    en protégeant la peau des rayons UV grâce à son indice de protection 20. Enrichi
+    en pré-tocophéryl, il prévient le vieillissement photo-induit. Ce fond de teint
+    contient un complexe pigmentaire photo-correcteur pour un teint homogène et lumineux.
+    Il convient à tous les types de peaux sensibles, claires ou mates, et permet de
+    camoufler efficacement les imperfections modérées. Pour une application optimale,
+    il est recommandé de l'appliquer avec les doigts en unifiant sur l'ensemble du
+    visage et du cou. Ce produit de parapharmacie est testé en centre de recherche
+    dermatologique et utilisé à l'Atelier de Maquillage Médical de la Station thermale
+    d'Avène.
+  - Le Masque Purifiant Aromatique à l'Argile Darphin Skin Mat est un soin visage
+    qui absorbe l'excès de sébum et purifie en profondeur l'épiderme. Grâce à sa formule,
+    ce masque nettoie, clarifie et purifie la peau, la laissant plus fraîche et plus
+    claire. Adapté à tous les types de peaux, il s'applique en fine couche sur le
+    visage et le cou, en évitant le contour des yeux, et se laisse poser pendant 10
+    à 15 minutes avant de rincer à l'eau tiède. Ce masque contient de l'argile, connue
+    pour ses propriétés absorbantes et purifiantes, ainsi que des ingrédients aromatiques
+    pour une expérience sensorielle agréable. Il est recommandé de l'utiliser une
+    à deux fois par semaine pour des résultats optimaux. Il est conseillé de ne pas
+    l'utiliser sur une peau irritée ou lésée, et de faire un test préalable sur une
+    petite zone de la peau pour éviter toute réaction allergique. Profitez des bienfaits
+    de ce masque pour retrouver une peau nette et éclatante.
+pipeline_tag: sentence-similarity
+model-index:
+- name: SentenceTransformer based on ymelka/camembert-cosmetic-finetuned
+  results:
+  - task:
+      type: semantic-similarity
+      name: Semantic Similarity
+    dataset:
+      name: stsb fr dev
+      type: stsb-fr-dev
+    metrics:
+    - type: pearson_cosine
+      value: 0.9019691000053579
+      name: Pearson Cosine
+    - type: spearman_cosine
+      value: 0.9452471183140297
+      name: Spearman Cosine
+    - type: pearson_manhattan
+      value: 0.8895868989951163
+      name: Pearson Manhattan
+    - type: spearman_manhattan
+      value: 0.9377240474149173
+      name: Spearman Manhattan
+    - type: pearson_euclidean
+      value: 0.8892108374147165
+      name: Pearson Euclidean
+    - type: spearman_euclidean
+      value: 0.9387698579518865
+      name: Spearman Euclidean
+    - type: pearson_dot
+      value: 0.8103426051476122
+      name: Pearson Dot
+    - type: spearman_dot
+      value: 0.9167943283318608
+      name: Spearman Dot
+    - type: pearson_max
+      value: 0.9019691000053579
+      name: Pearson Max
+    - type: spearman_max
+      value: 0.9452471183140297
+      name: Spearman Max
+---
+# SentenceTransformer based on ymelka/camembert-cosmetic-finetuned
+This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [ymelka/camembert-cosmetic-finetuned](https://huggingface.co/ymelka/camembert-cosmetic-finetuned). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
+## Model Details
+### Model Description
+- **Model Type:** Sentence Transformer
+- **Base model:** [ymelka/camembert-cosmetic-finetuned](https://huggingface.co/ymelka/camembert-cosmetic-finetuned) <!-- at revision cd4cb90f9388340c5f02740130efd30336c08905 -->
+- **Maximum Sequence Length:** 512 tokens
+- **Output Dimensionality:** 768 tokens
+- **Similarity Function:** Cosine Similarity
+<!-- - **Training Dataset:** Unknown -->
+<!-- - **Language:** Unknown -->
+<!-- - **License:** Unknown -->
+### Model Sources
+- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
+- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
+- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
+### Full Model Architecture
+```
+SentenceTransformer(
+  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: CamembertModel
+  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
+)
+```
+## Usage
+### Direct Usage (Sentence Transformers)
+First install the Sentence Transformers library:
+```bash
+pip install -U sentence-transformers
+```
+Then you can load this model and run inference.
+```python
+from sentence_transformers import SentenceTransformer
+# Download from the 🤗 Hub
+model = SentenceTransformer("ymelka/camembert-cosmetic-similarity-cp1200")
+# Run inference
+sentences = [
+    "En complément du nettoyant et du soin, il est recommandé d'utiliser un masque purifiant et matifiant une à deux fois par semaine. Ce masque aidera à resserrer les pores, purifier la peau en profondeur et réguler l'excès de sébum pour un teint plus éclatant et uniforme.",
+    "Le Masque Purifiant Aromatique à l'Argile Darphin Skin Mat est un soin visage qui absorbe l'excès de sébum et purifie en profondeur l'épiderme. Grâce à sa formule, ce masque nettoie, clarifie et purifie la peau, la laissant plus fraîche et plus claire. Adapté à tous les types de peaux, il s'applique en fine couche sur le visage et le cou, en évitant le contour des yeux, et se laisse poser pendant 10 à 15 minutes avant de rincer à l'eau tiède. Ce masque contient de l'argile, connue pour ses propriétés absorbantes et purifiantes, ainsi que des ingrédients aromatiques pour une expérience sensorielle agréable. Il est recommandé de l'utiliser une à deux fois par semaine pour des résultats optimaux. Il est conseillé de ne pas l'utiliser sur une peau irritée ou lésée, et de faire un test préalable sur une petite zone de la peau pour éviter toute réaction allergique. Profitez des bienfaits de ce masque pour retrouver une peau nette et éclatante.",
+    "Le Fond de Teint Correcteur Fluide Avène en teinte miel est spécialement conçu pour corriger les imperfections cutanées modérées et unifier le teint de manière naturelle. Sa formule résistante à l'eau et à la sueur offre une haute tenue tout en protégeant la peau des rayons UV grâce à son indice de protection 20. Enrichi en pré-tocophéryl, il prévient le vieillissement photo-induit. Ce fond de teint contient un complexe pigmentaire photo-correcteur pour un teint homogène et lumineux. Il convient à tous les types de peaux sensibles, claires ou mates, et permet de camoufler efficacement les imperfections modérées. Pour une application optimale, il est recommandé de l'appliquer avec les doigts en unifiant sur l'ensemble du visage et du cou. Ce produit de parapharmacie est testé en centre de recherche dermatologique et utilisé à l'Atelier de Maquillage Médical de la Station thermale d'Avène.",
+]
+embeddings = model.encode(sentences)
+print(embeddings.shape)
+# [3, 768]
+# Get the similarity scores for the embeddings
+similarities = model.similarity(embeddings, embeddings)
+print(similarities.shape)
+# [3, 3]
+```
+<!--
+### Direct Usage (Transformers)
+<details><summary>Click to see the direct usage in Transformers</summary>
+</details>
+-->
+<!--
+### Downstream Usage (Sentence Transformers)
+You can finetune this model on your own dataset.
+<details><summary>Click to expand</summary>
+</details>
+-->
+<!--
+### Out-of-Scope Use
+*List how the model may foreseeably be misused and address what users ought not to do with the model.*
+-->
+## Evaluation
+### Metrics
+#### Semantic Similarity
+* Dataset: `stsb-fr-dev`
+* Evaluated with [<code>EmbeddingSimilarityEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.EmbeddingSimilarityEvaluator)
+| Metric              | Value      |
+|:--------------------|:-----------|
+| pearson_cosine      | 0.902      |
+| **spearman_cosine** | **0.9452** |
+| pearson_manhattan   | 0.8896     |
+| spearman_manhattan  | 0.9377     |
+| pearson_euclidean   | 0.8892     |
+| spearman_euclidean  | 0.9388     |
+| pearson_dot         | 0.8103     |
+| spearman_dot        | 0.9168     |
+| pearson_max         | 0.902      |
+| spearman_max        | 0.9452     |
+<!--
+## Bias, Risks and Limitations
+*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
+-->
+<!--
+### Recommendations
+*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
+-->
+## Training Details
+### Training Dataset
+#### Unnamed Dataset
+* Size: 5,000 training samples
+* Columns: <code>sentence1</code>, <code>sentence2</code>, and <code>score</code>
+* Approximate statistics based on the first 1000 samples:
+  |         | sentence1                                                                          | sentence2                                                                             | score                                                          |
+  |:--------|:-----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|:---------------------------------------------------------------|
+  | type    | string                                                                             | string                                                                                | float                                                          |
+  | details | <ul><li>min: 30 tokens</li><li>mean: 55.51 tokens</li><li>max: 90 tokens</li></ul> | <ul><li>min: 124 tokens</li><li>mean: 199.72 tokens</li><li>max: 503 tokens</li></ul> | <ul><li>min: 0.0</li><li>mean: 0.47</li><li>max: 1.0</li></ul> |
+* Samples:
+  | sentence1                                                                                                                                                                                                                                                                                                                                                   | sentence2                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            | score                           |
+  |:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:--------------------------------|
+  | <code>En complément, un sérum anti-imperfections peut être utilisé pour cibler spécifiquement les problèmes de peau tels que les imperfections et les rougeurs. Ce sérum aidera à purifier la peau et à réduire l'apparence des boutons.</code>                                                                                                             | <code>Le sérum anti-imperfections Endro à base d'huile végétale de noisette et d'huiles essentielles bio est un concentré d'actifs naturels et antibactériens qui laisse la peau saine et les pores resserrés. Grâce à son action ciblée et hyper concentrée, il lutte efficacement contre les imperfections cutanées, réduisant ainsi les boutons et les rougeurs. Ce sérum convient aux adultes et aux adolescents à partir de 10 ans, et 73,35% des utilisateurs ont constaté une amélioration de leur peau en une semaine seulement. Les principaux ingrédients actifs tels que l'huile de noisette, l'huile essentielle de palmarosa et l'huile essentielle d'arbre à thé agissent en synergie pour purifier la peau et réguler l'excès de sébum. Pour une utilisation optimale, il est recommandé d'appliquer une petite goutte du sérum sur les zones à traiter le soir avant de dormir, en évitant le contour des yeux. Cependant, ce produit n'est pas adapté aux femmes enceintes ou allaitantes. En cas de contact avec les yeux, il est important de rincer abondamment et d'éviter toute exposition au soleil après application. Avec Endro Sérum Anti-Imperfections, retrouvez une peau nette et éclatante en toute simplicité.</code> | <code>0.9809522032737732</code> |
+  | <code>Un soin régulateur et matifiant, idéal pour traiter les imperfections et les pores dilatés. Sa formule spécifique permettra de réduire l'apparence des imperfections tout en resserrant les pores pour une peau plus lisse et uniforme.</code>                                                                                                        | <code>Le La Roche-Posay Effaclar MAT Soin Hydratant Sébo-Régulateur Visage Peaux Grasses est un soin spécialement conçu pour les peaux grasses sensibles sujettes à la brillance. Sa formule anti-brillance et anti-pores dilatés, grâce à l'association de Sebulyse, de microsphères absorbantes et de perlite, régule la production de sébum et matifie la peau immédiatement. Ce soin hydratant offre un effet matifiant et hydratant longue durée, tout en étant une excellente base de maquillage. Il convient aux adultes et aux adolescents, et est idéal pour les peaux à imperfections, à tendance acnéique et sujettes à la brillance. Pour une utilisation optimale, il est recommandé d'appliquer le produit matin et/ou soir sur l'ensemble du visage. Il est important de noter que ce produit est testé sous contrôle dermatologique, non comédogène et hypoallergénique.</code>                                                                                                                                                                                                                                                                                                                                                      | <code>0.9946829676628112</code> |
+  | <code>Un complément de traitement anti-taches, conçu pour cibler spécifiquement les taches pigmentaires. Ce complément concentré en actifs éclaircissants aidera à atténuer les taches existantes et à prévenir l'apparition de nouvelles taches. Il est recommandé de l'utiliser en complément des autres soins pour une action ciblée et efficace.</code> | <code>Le Lierac Lumilogie Anti-Taches est un traitement ciblé pour les 3 types de taches cutanées : naissantes, visibles et incrustées. Grâce à sa formule innovante inspirée des techniques esthétiques combinées, ce produit agit sur les taches à tous les stades de leur développement. Enrichi en Hexyl R., Lys de mer et Extrait de plantain, il freine la production de mélanine, diminue les taches visibles et lutte contre l'incrustation de la mélanine en profondeur. De plus, les concentrés de vitamines E et B3 ainsi que les 7 hydroxy acides activent le renouvellement cellulaire pour éliminer la mélanine en surface. En résulte un teint unifié et plus uniforme dès la première utilisation, avec une efficacité prouvée dès 7 jours et une correction visible des taches dès 28 jours. Pour une utilisation optimale, appliquez 2 pressions du concentré jour le matin et du concentré nuit le soir sur l'ensemble du visage, en évitant le contour des yeux. Veillez à éviter le contour des yeux et à utiliser une protection solaire avec IP en cas d'exposition au soleil.</code>                                                                                                                                         | <code>0.9939286708831788</code> |
+* Loss: [<code>CoSENTLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cosentloss) with these parameters:
+  ```json
+  {
+      "scale": 20.0,
+      "similarity_fct": "pairwise_cos_sim"
+  }
+  ```
+### Evaluation Dataset
+#### Unnamed Dataset
+* Size: 1,000 evaluation samples
+* Columns: <code>sentence1</code>, <code>sentence2</code>, and <code>score</code>
+* Approximate statistics based on the first 1000 samples:
+  |         | sentence1                                                                          | sentence2                                                                             | score                                                          |
+  |:--------|:-----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|:---------------------------------------------------------------|
+  | type    | string                                                                             | string                                                                                | float                                                          |
+  | details | <ul><li>min: 30 tokens</li><li>mean: 54.83 tokens</li><li>max: 88 tokens</li></ul> | <ul><li>min: 120 tokens</li><li>mean: 197.93 tokens</li><li>max: 491 tokens</li></ul> | <ul><li>min: 0.0</li><li>mean: 0.46</li><li>max: 1.0</li></ul> |
+* Samples:
+  | sentence1                                                                                                                                                                                                                                                                    | sentence2                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      | score                           |
+  |:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:--------------------------------|
+  | <code>Un complément hydratant et correcteur, idéal pour les peaux sensibles et sujettes aux taches. Ce complément aidera à hydrater en profondeur, à atténuer les rides et à réduire l'apparence des pores pour une peau plus lisse et uniforme.</code>                      | <code>L'Huile Végétale de Karité Bio de Puressentiel est un produit nutritif, réparateur et apaisant, idéal pour nourrir et réparer en profondeur la peau et les cheveux. Cette huile 100% pure et naturelle est recommandée pour une utilisation externe sur la peau et les cheveux. Enrichie en beurre de karité issu de l'agriculture biologique, elle offre des propriétés nourrissantes et réparatrices. Pour une utilisation sur le visage et le corps, il est conseillé de chauffer une noisette de beurre de karité dans la paume de la main et de l'appliquer sur les zones sèches et craquelées. Pour les cheveux secs et abîmés, il suffit de chauffer une petite noisette de beurre de karité entre les mains et de l'appliquer sur les pointes et les longueurs. Il est important d'éviter le contact avec les yeux et les muqueuses, et de se laver les mains après application. Il est recommandé de conserver le produit à l'abri de la lumière, de l'air et de la chaleur. Disponible en pot de 100 ml, cette huile de karité bio est un allié naturel pour prendre soin de sa peau et de ses cheveux.</code> | <code>0.0544042661786079</code> |
+  | <code>Un soin anti-âge global, conçu pour traiter les rides, les taches pigmentaires et les imperfections. Sa formule régulatrice et éclatante aidera à lisser la peau, à atténuer les taches et à réduire les imperfections pour un teint plus uniforme et lumineux.</code> | <code>Le sérum contour des yeux anti-rides Maison Éole Elle Et Lui Émerveillé est un produit de parapharmacie haut de gamme qui agit efficacement contre les rides, les ridules, les cernes et les poches. Sa formule complète enrichie en Bakuchiol, alternative naturelle au Rétinol A, nourrit la peau en profondeur et réduit les tâches cutanées. Grâce à ses actifs tels que l'huile de pépin de raisin, le Bisabolol et le Resvératrol, ce sérum hydrate intensément, lisse la peau et prévient le vieillissement cutané. Son utilisation matin et soir sur une peau propre permet d'obtenir un regard éclatant et reposé. Le flacon-pipette de 15ml facilite son application. Ce produit convient à tous les types de peau et ne contient ni parabène, ni silicone, ni ingrédients d'origine animale. Il est recommandé de suivre les instructions d'utilisation pour des résultats optimaux.</code>                                                                                                                                                                                                                   | <code>0.0781720206141471</code> |
+  | <code>Un soin anti-rides et éclat, enrichi en actifs régénérants et illuminants. Ce soin aidera à lisser les rides, à uniformiser le teint et à redonner de l'éclat à la peau fatiguée.</code>                                                                               | <code>L'Eau Micellaire Sebiaclear de SVR est un produit de parapharmacie qui purifie, nettoie et démaquille la peau en un seul geste. Adaptée aux peaux sensibles mixtes à grasses, cette eau micellaire aide à éliminer les impuretés, les boutons, les points noirs et l'excès de sébum sans dessécher la peau. Grâce à sa formule innovante contenant de la gluconolactone et de la niacinamide, elle offre une haute efficacité tout en respectant la peau. Les micelles présentes dans le produit nettoient et démaquillent en douceur, laissant la peau nette et fraîche. Pour l'utiliser, il suffit d'appliquer l'eau micellaire matin et/ou soir à l'aide d'un coton sur le visage et les yeux, sans rinçage. Avec une présentation en flacon de 400 ml, ce produit convient aux peaux sensibles à tendance acnéique et offre des résultats visibles dès 7 jours d'utilisation. Il est recommandé de ne pas l'utiliser en cas d'allergie à l'un des ingrédients et de consulter un professionnel de santé en cas de doute.</code>                                                                                      | <code>0.0607918016612529</code> |
+* Loss: [<code>CoSENTLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cosentloss) with these parameters:
+  ```json
+  {
+      "scale": 20.0,
+      "similarity_fct": "pairwise_cos_sim"
+  }
+  ```
+### Training Hyperparameters
+#### Non-Default Hyperparameters
+- `eval_strategy`: steps
+- `per_device_train_batch_size`: 16
+- `per_device_eval_batch_size`: 16
+- `learning_rate`: 2e-05
+- `weight_decay`: 0.01
+- `num_train_epochs`: 4
+- `warmup_ratio`: 0.1
+- `bf16`: True
+- `load_best_model_at_end`: True
+- `batch_sampler`: no_duplicates
+#### All Hyperparameters
+<details><summary>Click to expand</summary>
+- `overwrite_output_dir`: False
+- `do_predict`: False
+- `eval_strategy`: steps
+- `prediction_loss_only`: True
+- `per_device_train_batch_size`: 16
+- `per_device_eval_batch_size`: 16
+- `per_gpu_train_batch_size`: None
+- `per_gpu_eval_batch_size`: None
+- `gradient_accumulation_steps`: 1
+- `eval_accumulation_steps`: None
+- `learning_rate`: 2e-05
+- `weight_decay`: 0.01
+- `adam_beta1`: 0.9
+- `adam_beta2`: 0.999
+- `adam_epsilon`: 1e-08
+- `max_grad_norm`: 1.0
+- `num_train_epochs`: 4
+- `max_steps`: -1
+- `lr_scheduler_type`: linear
+- `lr_scheduler_kwargs`: {}
+- `warmup_ratio`: 0.1
+- `warmup_steps`: 0
+- `log_level`: passive
+- `log_level_replica`: warning
+- `log_on_each_node`: True
+- `logging_nan_inf_filter`: True
+- `save_safetensors`: True
+- `save_on_each_node`: False
+- `save_only_model`: False
+- `restore_callback_states_from_checkpoint`: False
+- `no_cuda`: False
+- `use_cpu`: False
+- `use_mps_device`: False
+- `seed`: 42
+- `data_seed`: None
+- `jit_mode_eval`: False
+- `use_ipex`: False
+- `bf16`: True
+- `fp16`: False
+- `fp16_opt_level`: O1
+- `half_precision_backend`: auto
+- `bf16_full_eval`: False
+- `fp16_full_eval`: False
+- `tf32`: None
+- `local_rank`: 0
+- `ddp_backend`: None
+- `tpu_num_cores`: None
+- `tpu_metrics_debug`: False
+- `debug`: []
+- `dataloader_drop_last`: False
+- `dataloader_num_workers`: 0
+- `dataloader_prefetch_factor`: None
+- `past_index`: -1
+- `disable_tqdm`: False
+- `remove_unused_columns`: True
+- `label_names`: None
+- `load_best_model_at_end`: True
+- `ignore_data_skip`: False
+- `fsdp`: []
+- `fsdp_min_num_params`: 0
+- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
+- `fsdp_transformer_layer_cls_to_wrap`: None
+- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
+- `deepspeed`: None
+- `label_smoothing_factor`: 0.0
+- `optim`: adamw_torch
+- `optim_args`: None
+- `adafactor`: False
+- `group_by_length`: False
+- `length_column_name`: length
+- `ddp_find_unused_parameters`: None
+- `ddp_bucket_cap_mb`: None
+- `ddp_broadcast_buffers`: False
+- `dataloader_pin_memory`: True
+- `dataloader_persistent_workers`: False
+- `skip_memory_metrics`: True
+- `use_legacy_prediction_loop`: False
+- `push_to_hub`: False
+- `resume_from_checkpoint`: None
+- `hub_model_id`: None
+- `hub_strategy`: every_save
+- `hub_private_repo`: False
+- `hub_always_push`: False
+- `gradient_checkpointing`: False
+- `gradient_checkpointing_kwargs`: None
+- `include_inputs_for_metrics`: False
+- `eval_do_concat_batches`: True
+- `fp16_backend`: auto
+- `push_to_hub_model_id`: None
+- `push_to_hub_organization`: None
+- `mp_parameters`:
+- `auto_find_batch_size`: False
+- `full_determinism`: False
+- `torchdynamo`: None
+- `ray_scope`: last
+- `ddp_timeout`: 1800
+- `torch_compile`: False
+- `torch_compile_backend`: None
+- `torch_compile_mode`: None
+- `dispatch_batches`: None
+- `split_batches`: None
+- `include_tokens_per_second`: False
+- `include_num_input_tokens_seen`: False
+- `neftune_noise_alpha`: None
+- `optim_target_modules`: None
+- `batch_eval_metrics`: False
+- `batch_sampler`: no_duplicates
+- `multi_dataset_batch_sampler`: proportional
+</details>
+### Training Logs
+| Epoch  | Step | Training Loss | loss   | stsb-fr-dev_spearman_cosine |
+|:------:|:----:|:-------------:|:------:|:---------------------------:|
+| 0      | 0    | -             | -      | 0.4986                      |
+| 0.3195 | 100  | 4.6554        | 4.3185 | 0.8719                      |
+| 0.6390 | 200  | 4.2773        | 4.1772 | 0.8984                      |
+| 0.9585 | 300  | 4.1015        | 4.0808 | 0.9128                      |
+| 1.2748 | 400  | 4.0285        | 4.0244 | 0.9215                      |
+| 1.5942 | 500  | 3.9269        | 4.0512 | 0.9317                      |
+| 1.9137 | 600  | 3.8057        | 3.9970 | 0.9348                      |
+| 2.2300 | 700  | 3.7665        | 4.0250 | 0.9350                      |
+| 2.5495 | 800  | 3.7541        | 3.9587 | 0.9396                      |
+| 2.8690 | 900  | 3.6029        | 4.0481 | 0.9407                      |
+| 3.1853 | 1000 | 3.6183        | 3.9964 | 0.9416                      |
+| 3.5048 | 1100 | 3.5848        | 3.9711 | 0.9454                      |
+| 3.8243 | 1200 | 3.5029        | 3.9985 | 0.9452                      |
+### Framework Versions
+- Python: 3.10.12
+- Sentence Transformers: 3.0.1
+- Transformers: 4.41.2
+- PyTorch: 2.3.0+cu121
+- Accelerate: 0.31.0
+- Datasets: 2.20.0
+- Tokenizers: 0.19.1
+## Citation
+### BibTeX
+#### Sentence Transformers
+```bibtex
+@inproceedings{reimers-2019-sentence-bert,
+    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
+    author = "Reimers, Nils and Gurevych, Iryna",
+    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
+    month = "11",
+    year = "2019",
+    publisher = "Association for Computational Linguistics",
+    url = "https://arxiv.org/abs/1908.10084",
+}
+```
+#### CoSENTLoss
+```bibtex
+@online{kexuefm-8847,
+    title={CoSENT: A more efficient sentence vector scheme than Sentence-BERT},
+    author={Su Jianlin},
+    year={2022},
+    month={Jan},
+    url={https://kexue.fm/archives/8847},
+}
+```
+<!--
+## Glossary
+*Clearly define terms in order to be accessible across audiences.*
+-->
+<!--
+## Model Card Authors
+*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
+-->
+<!--
+## Model Card Contact
+*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
+-->

added_tokens.json ADDED Viewed

	@@ -0,0 +1,3 @@

+{
+  "<unk>NOTUSED": 32005
+}

config.json ADDED Viewed

	@@ -0,0 +1,28 @@

+{
+  "_name_or_path": "/content/models/camembert-cosmetic-similarity/checkpoint-1200",
+  "architectures": [
+    "CamembertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 5,
+  "classifier_dropout": null,
+  "eos_token_id": 6,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "camembert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 32005
+}

config_sentence_transformers.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "__version__": {
+    "sentence_transformers": "3.0.1",
+    "transformers": "4.41.2",
+    "pytorch": "2.3.0+cu121"
+  },
+  "prompts": {},
+  "default_prompt_name": null,
+  "similarity_fn_name": null
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:57bf51aa0df0dcc627fec1fdaa9ef97b5ceb783e0271057016526f16ecf351f2
+size 442510176

modules.json ADDED Viewed

	@@ -0,0 +1,14 @@

+[
+  {
+    "idx": 0,
+    "name": "0",
+    "path": "",
+    "type": "sentence_transformers.models.Transformer"
+  },
+  {
+    "idx": 1,
+    "name": "1",
+    "path": "1_Pooling",
+    "type": "sentence_transformers.models.Pooling"
+  }
+]

sentence_bert_config.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "max_seq_length": 512,
+  "do_lower_case": false
+}

sentencepiece.bpe.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:988bc5a00281c6d210a5d34bd143d0363741a432fefe741bf71e61b1869d4314
+size 810912

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,56 @@

+{
+  "additional_special_tokens": [
+    "<s>NOTUSED",
+    "</s>NOTUSED",
+    "<unk>NOTUSED"
+  ],
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "cls_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<pad>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,90 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>NOTUSED",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>NOTUSED",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "4": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "5": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "6": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "32004": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "32005": {
+      "content": "<unk>NOTUSED",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [
+    "<s>NOTUSED",
+    "</s>NOTUSED",
+    "<unk>NOTUSED"
+  ],
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": "<mask>",
+  "max_length": 512,
+  "model_max_length": 512,
+  "pad_to_multiple_of": null,
+  "pad_token": "<pad>",
+  "pad_token_type_id": 0,
+  "padding_side": "right",
+  "sep_token": "</s>",
+  "stride": 0,
+  "tokenizer_class": "CamembertTokenizer",
+  "truncation_side": "right",
+  "truncation_strategy": "longest_first",
+  "unk_token": "<unk>"
+}