ymelka commited on
Commit
d769d7b
1 Parent(s): fee4ab3

Add new SentenceTransformer model.

Browse files
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,634 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language: []
3
+ library_name: sentence-transformers
4
+ tags:
5
+ - sentence-transformers
6
+ - sentence-similarity
7
+ - feature-extraction
8
+ - generated_from_trainer
9
+ - dataset_size:5000
10
+ - loss:CoSENTLoss
11
+ base_model: ymelka/camembert-cosmetic-finetuned
12
+ datasets: []
13
+ metrics:
14
+ - pearson_cosine
15
+ - spearman_cosine
16
+ - pearson_manhattan
17
+ - spearman_manhattan
18
+ - pearson_euclidean
19
+ - spearman_euclidean
20
+ - pearson_dot
21
+ - spearman_dot
22
+ - pearson_max
23
+ - spearman_max
24
+ widget:
25
+ - source_sentence: Un soin régulateur de pores hautement efficace, conçu pour réduire
26
+ visiblement l'apparence des pores dilatés. Sa formule ciblée aide à affiner le
27
+ grain de peau et à réguler la production de sébum, pour une peau plus lisse et
28
+ uniforme. Idéal pour les peaux matures en quête de perfection.
29
+ sentences:
30
+ - La Crème Confort 1ères Rides de Coup D’Eclat est un soin hydratant apaisant qui
31
+ procure une hydratation optimale à la peau tout en la régénérant. En 28 jours,
32
+ la peau devient moins sensible et réactive, tandis que les premiers signes de
33
+ l'âge sont corrigés et prévenus. Grâce à des ingrédients tels que l'huile de pépins
34
+ de raisin, l'huile de macadamia et la vitamine E, cette crème redonne à la peau
35
+ son éclat et sa vitalité, tout en lissant les ridules et affinant le grain de
36
+ peau. Pour une utilisation externe sur le visage et le cou, cette formule non-comédogène
37
+ convient à tous les types de peaux, y compris les peaux sensibles et réactives.
38
+ Il est recommandé d'appliquer la crème matin et soir par un léger massage sur
39
+ une peau démaquillée. Il est important de suivre les instructions d'utilisation
40
+ et de ne pas dépasser la posologie recommandée.
41
+ - La Source Micellaire Enchantée Rose D'Antan de Garancia est un produit de parapharmacie
42
+ multifonctionnel qui nettoie, démaquille, hydrate, apaise et illumine la peau
43
+ du visage, des yeux et des lèvres. Grâce à sa formule enrichie en actifs brevetés
44
+ hydratants et apaisants, cette eau micellaire réduit de manière significative
45
+ les sensations d'irritation et de picotement. Composée à 99,5% d'ingrédients d'origine
46
+ naturelle, elle contient notamment de l'extrait de racine de chicorée, un prébiotique
47
+ nourrissant pour le microbiote cutané. Pour l'utiliser, il suffit de tourner la
48
+ pompe vers la gauche, d'imbiber un coton d'eau micellaire et de le passer sur
49
+ le visage, les yeux et les lèvres sans rinçage. Laissez poser 5 secondes sur les
50
+ yeux avant de démaquiller. Ce produit convient à tous les types de peau et est
51
+ présenté dans un flacon pompe de 400 ml.
52
+ - Le tonique hydratant Cosrx Hydrium est un produit de parapharmacie qui rend la
53
+ peau plus fraîche et hydratée grâce à sa formule contenant de la vitamine B5 et
54
+ de l'acide hyaluronique. Ce tonique hydratant agit comme une base essentielle
55
+ pour la santé de la peau, en formant une barrière d'hydratation et en optimisant
56
+ l'équilibre des peaux abîmées. Il convient à tous les types de peau, y compris
57
+ les peaux sèches et à tendance acnéique. Les principaux ingrédients actifs incluent
58
+ des acides hyaluroniques de type 6, du D-panthénol et de l'allantoïne pour une
59
+ hydratation en profondeur et un effet apaisant sur les peaux sensibles. Pour une
60
+ utilisation optimale, appliquez le tonique après le nettoyage du visage, en massant
61
+ pour une meilleure absorption. Il peut également être utilisé comme masque en
62
+ feuille, brume ou mélange nettoyant. Présenté en flacon de 150 ml, ce tonique
63
+ hydratant est un allié idéal pour une peau fraîche et hydratée au quotidien.
64
+ - source_sentence: Un soin hydratant et revitalisant qui apporte un éclat naturel
65
+ à la peau. Enrichi en ingrédients nourrissants et anti-âge, ce soin aide à réduire
66
+ les signes de fatigue et à améliorer la texture de la peau. Parfait pour revitaliser
67
+ la peau mature et lui redonner toute sa jeunesse.
68
+ sentences:
69
+ - L'Alphanova Solide Exfoliant Visage est un produit naturel et végan qui purifie
70
+ la peau et revitalise le teint. Composé d'huiles bio d'amande douce et de jojoba,
71
+ de feuilles de verveine et de poudre de coques de noix, il convient aux peaux
72
+ normales. Sans huile de palme ni sulfate, ce duo moussant doux et végétal offre
73
+ une mousse généreuse et onctueuse au parfum frais de verveine. Avec 99,9% d'ingrédients
74
+ d'origine naturelle, dont 73,4% issus de l'agriculture biologique, cet exfoliant
75
+ visage Alphanova permet jusqu'à 100 utilisations. Pour l'utiliser, il suffit d'appliquer
76
+ le nettoyant sur le visage humidifié, de masser délicatement en évitant le contour
77
+ des yeux, puis de rincer abondamment. Présenté en deux formats de 75g, cet exfoliant
78
+ offre une expérience de soin agréable et respectueuse de l'environnement.
79
+ - Le Clarins Doux Nettoyant Moussant Apaisant est spécialement conçu pour les femmes
80
+ ayant une peau très sèche ou sensible. Grâce à sa formule aux herbes des Alpes,
81
+ ce nettoyant apaise et adoucit la peau tout en la protégeant des agressions extérieures.
82
+ Enrichi en extraits de saponaire, de reine des près, d'aloé vera, de camomille
83
+ bio et de beurre de karité, il nettoie en douceur, purifie, hydrate et apaise
84
+ la peau. Sa texture mousse fine et onctueuse laisse la peau parfaitement nettoyée,
85
+ douce et protégée. Ce nettoyant peut être utilisé matin et/ou soir en massant
86
+ délicatement sur le visage et le cou, en évitant le contour des yeux. Il est recommandé
87
+ de rincer abondamment après utilisation. Évitez le contour des yeux lors de l'application.
88
+ Disponible en tube de 125 ml, ce nettoyant est idéal pour un nettoyage en douceur
89
+ des peaux très sèches ou sensibles.
90
+ - L'Eau Parfumée Bienfaisante Shiso de Roger&Gallet est un parfum unique aux notes
91
+ fraîches et raffinées, mêlant le shiso, le petitgrain et la mandarine pour une
92
+ sensation de fraîcheur naturelle. Enrichi en pivoine et en santal, ce parfum vert
93
+ fusant apporte une énergie vibrante et permet de s'ouvrir à de nouveaux horizons.
94
+ Idéal pour le corps, ce produit peut être utilisé en vaporisation pour accentuer
95
+ son effet énergisant. Les principaux ingrédients actifs incluent l'extrait de
96
+ feuille de Perilla ocymoides, connu pour ses propriétés revitalisantes. Il est
97
+ recommandé de vaporiser un nuage de parfum devant soi et de le traverser pour
98
+ profiter pleinement de ses bienfaits. Il est conseillé de ne pas utiliser ce produit
99
+ sur une peau irritée ou lésée. Profitez de cette fragrance unique pour vous sentir
100
+ revitalisé et plein d'énergie au quotidien.
101
+ - source_sentence: Un nettoyant doux et hydratant, spécialement formulé pour éliminer
102
+ les impuretés tout en apportant de l'éclat à la peau. Sa formule adaptée aux peaux
103
+ matures aide à lutter contre les taches et les imperfections, tout en respectant
104
+ la sensibilité de la peau.
105
+ sentences:
106
+ - Le nettoyant visage naturel solide Respire est spécialement conçu pour les peaux
107
+ sensibles, offrant une formule douce et naturelle enrichie en huile de lin Bio,
108
+ huile de tournesol Bio et beurre de karité Bio. Ces ingrédients apaisent, hydratent
109
+ et protègent la peau, la laissant douce et saine. Sa formule sans ingrédients
110
+ controversés convient parfaitement aux peaux sensibles. Facile à utiliser, il
111
+ suffit de frotter doucement le nettoyant sur le visage humidifié, de masser légèrement
112
+ la peau et de rincer. Vegan et non-testé sur les animaux, ce nettoyant est testé
113
+ dermatologiquement et fabriqué en France. Il est idéal pour une peau apaisée et
114
+ saine, et convient aux peaux sensibles. Il est recommandé de rincer immédiatement
115
+ en cas de contact avec les yeux.
116
+ - Le Gamarde Lait Nettoyant Douceur Peaux Délicates Bio est un nettoyant et démaquillant
117
+ doux spécialement conçu pour les peaux délicates, sèches ou mixtes. Sa formule
118
+ à base d'ingrédients naturels et biologiques, tels que l'eau de Gamarde les Bains,
119
+ l'huile d'argan et l'huile de noisette, permet d'éliminer en douceur les impuretés
120
+ et le maquillage tenace tout en respectant l'équilibre de la peau. Enrichi en
121
+ huiles essentielles de Palmarosa et d'orange douce, ce lait nettoyant laisse la
122
+ peau propre, douce et apaisée. Pour l'utiliser, il suffit d'appliquer une petite
123
+ quantité sur le visage et le cou, puis de retirer avec un coton sec avant de tonifier
124
+ la peau avec la Lotion Apaisante Douceur. Ce produit convient parfaitement pour
125
+ un usage quotidien et ne présente aucune contre-indication particulière.
126
+ - La serviette à cheveux Les Tendances D'Emma en couleur marron est un accessoire
127
+ pratique et efficace pour sécher les cheveux en douceur. Fabriquée à partir de
128
+ 90% de viscose de bambou et 10% de polyester, elle absorbe 4 fois mieux qu'une
129
+ serviette classique. Son attache astucieuse permet de la maintenir en place sur
130
+ la tête, évitant ainsi de traumatiser les cheveux lors du séchage. Idéale pour
131
+ tous, y compris ceux qui ont opté pour des colorations naturelles, cette serviette
132
+ simplifie la vie au quotidien. Facile à utiliser, il suffit de la placer sur la
133
+ tête, de tourner et de glisser dans l'attache prévue. Lavable en machine, elle
134
+ est pratique et écologique. Cette serviette à cheveux est conçue, fabriquée et
135
+ imprimée en France dans une démarche éco-responsable. Un produit incontournable
136
+ pour prendre soin de ses cheveux en toute simplicité.
137
+ - source_sentence: Un soin anti-rides et régulateur de sébum, spécialement conçu pour
138
+ traiter les rides et ridules tout en régulant l'excès de sébum. Sa formule hydratante
139
+ et apaisante convient parfaitement aux peaux sensibles.
140
+ sentences:
141
+ - Le Phyt's Men Soin Anti-Rides est un fluide frais et non gras conçu pour atténuer
142
+ les premiers signes de l'âge chez les hommes. Certifié Bio et d'origine naturelle,
143
+ ce soin hydrate, raffermit et illumine la peau masculine. Sa formule contient
144
+ des huiles végétales de sésame, noisette, chanvre, nigelle et beurre de karité,
145
+ ainsi que des huiles essentielles de petit grain et géranium, pour leurs propriétés
146
+ protectrices, apaisantes et tonifiantes. L'extrait de ginseng contribue à revitaliser
147
+ la peau. Il est recommandé d'appliquer ce produit quotidiennement sur l'ensemble
148
+ du visage. Ce soin est destiné à lutter contre les premiers signes de l'âge et
149
+ est à usage externe uniquement. Il convient de noter que ce produit est déconseillé
150
+ en cas d'allergie à l'un de ses composants.
151
+ - L'Eau Thermale Spray Brumisateur Apaisant d'Avène est un soin essentiel pour les
152
+ peaux sensibles, hypersensibles, allergiques et irritées. Grâce à sa composition
153
+ unique en eau thermale d'Avène, ce spray apaise et sublime toutes les peaux, même
154
+ les plus sensibles, en leur procurant une sensation d'apaisement, de confort et
155
+ de bien-être. Les propriétés apaisantes et anti-irritantes de l'eau thermale d'Avène
156
+ ont été démontrées par de nombreux travaux scientifiques, en faisant un véritable
157
+ principe actif pour le traitement des affections cutanées. Il est recommandé pour
158
+ les peaux atopiques, sébo-squameuses, couperosiques et sujettes aux photo-allergies.
159
+ Les principaux ingrédients actifs de ce spray sont l'eau thermale Avène et le
160
+ gaz (nitrogène), qui contribuent à apaiser la peau et à la protéger. Pour l'utiliser,
161
+ il suffit de pulvériser une fine brume sur le visage. Ce soin a été testé par
162
+ 100 utilisateurs qui ont tous apprécié ses bienfaits. Il est important de noter
163
+ que ce produit est contre-indiqué en cas d'allergie à l'un de ses composants.
164
+ - Le soin raffermissant corps et buste Copaïba Demain L'Empire 200ml est un produit
165
+ de parapharmacie de haute qualité, formulé avec des ingrédients naturels et actifs
166
+ pour offrir à la peau une hydratation, une protection et une fermeté optimales.
167
+ Grâce à sa composition riche en huile de macadamia, beurre de babassu et autres
168
+ actifs puissants, ce soin aide à améliorer l'élasticité de la peau, à réduire
169
+ les rides, à prévenir les vergetures et à protéger contre les agressions extérieures.
170
+ En utilisant ce produit quotidiennement, la peau retrouve sa jeunesse et sa vitalité,
171
+ avec une texture douce et un parfum frais et vivifiant. Les principaux ingrédients
172
+ actifs tels que la chitine, l'extrait végétal tropical et l'acide hyaluronique
173
+ agissent en synergie pour rajeunir la peau et lui apporter une hydratation optimale.
174
+ Il est recommandé d'appliquer ce soin sur tout le corps, en massant délicatement
175
+ jusqu'à absorption complète. Il est conseillé de l'utiliser régulièrement pour
176
+ des résultats visibles en seulement quelques mois. Il est important de noter que
177
+ ce produit est destiné à un usage externe uniquement et qu'il est préférable de
178
+ consulter un professionnel de la santé en cas de réaction allergique.
179
+ - source_sentence: En complément du nettoyant et du soin, il est recommandé d'utiliser
180
+ un masque purifiant et matifiant une à deux fois par semaine. Ce masque aidera
181
+ à resserrer les pores, purifier la peau en profondeur et réguler l'excès de sébum
182
+ pour un teint plus éclatant et uniforme.
183
+ sentences:
184
+ - La Crème Moussante Nettoyante Hydratante CeraVe est un produit développé en collaboration
185
+ avec des dermatologues pour nettoyer, démaquiller et hydrater en douceur les peaux
186
+ normales à sèches. Enrichie en céramides essentiels, acide hyaluronique et acides
187
+ aminés, sa formule élimine efficacement les impuretés, la pollution et le maquillage
188
+ longue tenue tout en restaurant la barrière cutanée. Grâce à la Technologie MVE,
189
+ les actifs sont diffusés en continu pour une hydratation prolongée. Cette crème
190
+ convient pour le visage et les yeux, est hypoallergénique et non-comédogène. Utilisez-la
191
+ matin et soir sur une peau humide, faites mousser et rincez abondamment. Présentée
192
+ en flacon pompe de 236 ml, elle laisse la peau douce, hydratée et propre sans
193
+ laisser de résidus.
194
+ - Le Fond de Teint Correcteur Fluide Avène en teinte miel est spécialement conçu
195
+ pour corriger les imperfections cutanées modérées et unifier le teint de manière
196
+ naturelle. Sa formule résistante à l'eau et à la sueur offre une haute tenue tout
197
+ en protégeant la peau des rayons UV grâce à son indice de protection 20. Enrichi
198
+ en pré-tocophéryl, il prévient le vieillissement photo-induit. Ce fond de teint
199
+ contient un complexe pigmentaire photo-correcteur pour un teint homogène et lumineux.
200
+ Il convient à tous les types de peaux sensibles, claires ou mates, et permet de
201
+ camoufler efficacement les imperfections modérées. Pour une application optimale,
202
+ il est recommandé de l'appliquer avec les doigts en unifiant sur l'ensemble du
203
+ visage et du cou. Ce produit de parapharmacie est testé en centre de recherche
204
+ dermatologique et utilisé à l'Atelier de Maquillage Médical de la Station thermale
205
+ d'Avène.
206
+ - Le Masque Purifiant Aromatique à l'Argile Darphin Skin Mat est un soin visage
207
+ qui absorbe l'excès de sébum et purifie en profondeur l'épiderme. Grâce à sa formule,
208
+ ce masque nettoie, clarifie et purifie la peau, la laissant plus fraîche et plus
209
+ claire. Adapté à tous les types de peaux, il s'applique en fine couche sur le
210
+ visage et le cou, en évitant le contour des yeux, et se laisse poser pendant 10
211
+ à 15 minutes avant de rincer à l'eau tiède. Ce masque contient de l'argile, connue
212
+ pour ses propriétés absorbantes et purifiantes, ainsi que des ingrédients aromatiques
213
+ pour une expérience sensorielle agréable. Il est recommandé de l'utiliser une
214
+ à deux fois par semaine pour des résultats optimaux. Il est conseillé de ne pas
215
+ l'utiliser sur une peau irritée ou lésée, et de faire un test préalable sur une
216
+ petite zone de la peau pour éviter toute réaction allergique. Profitez des bienfaits
217
+ de ce masque pour retrouver une peau nette et éclatante.
218
+ pipeline_tag: sentence-similarity
219
+ model-index:
220
+ - name: SentenceTransformer based on ymelka/camembert-cosmetic-finetuned
221
+ results:
222
+ - task:
223
+ type: semantic-similarity
224
+ name: Semantic Similarity
225
+ dataset:
226
+ name: stsb fr dev
227
+ type: stsb-fr-dev
228
+ metrics:
229
+ - type: pearson_cosine
230
+ value: 0.9019691000053579
231
+ name: Pearson Cosine
232
+ - type: spearman_cosine
233
+ value: 0.9452471183140297
234
+ name: Spearman Cosine
235
+ - type: pearson_manhattan
236
+ value: 0.8895868989951163
237
+ name: Pearson Manhattan
238
+ - type: spearman_manhattan
239
+ value: 0.9377240474149173
240
+ name: Spearman Manhattan
241
+ - type: pearson_euclidean
242
+ value: 0.8892108374147165
243
+ name: Pearson Euclidean
244
+ - type: spearman_euclidean
245
+ value: 0.9387698579518865
246
+ name: Spearman Euclidean
247
+ - type: pearson_dot
248
+ value: 0.8103426051476122
249
+ name: Pearson Dot
250
+ - type: spearman_dot
251
+ value: 0.9167943283318608
252
+ name: Spearman Dot
253
+ - type: pearson_max
254
+ value: 0.9019691000053579
255
+ name: Pearson Max
256
+ - type: spearman_max
257
+ value: 0.9452471183140297
258
+ name: Spearman Max
259
+ ---
260
+
261
+ # SentenceTransformer based on ymelka/camembert-cosmetic-finetuned
262
+
263
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [ymelka/camembert-cosmetic-finetuned](https://huggingface.co/ymelka/camembert-cosmetic-finetuned). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
264
+
265
+ ## Model Details
266
+
267
+ ### Model Description
268
+ - **Model Type:** Sentence Transformer
269
+ - **Base model:** [ymelka/camembert-cosmetic-finetuned](https://huggingface.co/ymelka/camembert-cosmetic-finetuned) <!-- at revision cd4cb90f9388340c5f02740130efd30336c08905 -->
270
+ - **Maximum Sequence Length:** 512 tokens
271
+ - **Output Dimensionality:** 768 tokens
272
+ - **Similarity Function:** Cosine Similarity
273
+ <!-- - **Training Dataset:** Unknown -->
274
+ <!-- - **Language:** Unknown -->
275
+ <!-- - **License:** Unknown -->
276
+
277
+ ### Model Sources
278
+
279
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
280
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
281
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
282
+
283
+ ### Full Model Architecture
284
+
285
+ ```
286
+ SentenceTransformer(
287
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: CamembertModel
288
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
289
+ )
290
+ ```
291
+
292
+ ## Usage
293
+
294
+ ### Direct Usage (Sentence Transformers)
295
+
296
+ First install the Sentence Transformers library:
297
+
298
+ ```bash
299
+ pip install -U sentence-transformers
300
+ ```
301
+
302
+ Then you can load this model and run inference.
303
+ ```python
304
+ from sentence_transformers import SentenceTransformer
305
+
306
+ # Download from the 🤗 Hub
307
+ model = SentenceTransformer("ymelka/camembert-cosmetic-similarity-cp1200")
308
+ # Run inference
309
+ sentences = [
310
+ "En complément du nettoyant et du soin, il est recommandé d'utiliser un masque purifiant et matifiant une à deux fois par semaine. Ce masque aidera à resserrer les pores, purifier la peau en profondeur et réguler l'excès de sébum pour un teint plus éclatant et uniforme.",
311
+ "Le Masque Purifiant Aromatique à l'Argile Darphin Skin Mat est un soin visage qui absorbe l'excès de sébum et purifie en profondeur l'épiderme. Grâce à sa formule, ce masque nettoie, clarifie et purifie la peau, la laissant plus fraîche et plus claire. Adapté à tous les types de peaux, il s'applique en fine couche sur le visage et le cou, en évitant le contour des yeux, et se laisse poser pendant 10 à 15 minutes avant de rincer à l'eau tiède. Ce masque contient de l'argile, connue pour ses propriétés absorbantes et purifiantes, ainsi que des ingrédients aromatiques pour une expérience sensorielle agréable. Il est recommandé de l'utiliser une à deux fois par semaine pour des résultats optimaux. Il est conseillé de ne pas l'utiliser sur une peau irritée ou lésée, et de faire un test préalable sur une petite zone de la peau pour éviter toute réaction allergique. Profitez des bienfaits de ce masque pour retrouver une peau nette et éclatante.",
312
+ "Le Fond de Teint Correcteur Fluide Avène en teinte miel est spécialement conçu pour corriger les imperfections cutanées modérées et unifier le teint de manière naturelle. Sa formule résistante à l'eau et à la sueur offre une haute tenue tout en protégeant la peau des rayons UV grâce à son indice de protection 20. Enrichi en pré-tocophéryl, il prévient le vieillissement photo-induit. Ce fond de teint contient un complexe pigmentaire photo-correcteur pour un teint homogène et lumineux. Il convient à tous les types de peaux sensibles, claires ou mates, et permet de camoufler efficacement les imperfections modérées. Pour une application optimale, il est recommandé de l'appliquer avec les doigts en unifiant sur l'ensemble du visage et du cou. Ce produit de parapharmacie est testé en centre de recherche dermatologique et utilisé à l'Atelier de Maquillage Médical de la Station thermale d'Avène.",
313
+ ]
314
+ embeddings = model.encode(sentences)
315
+ print(embeddings.shape)
316
+ # [3, 768]
317
+
318
+ # Get the similarity scores for the embeddings
319
+ similarities = model.similarity(embeddings, embeddings)
320
+ print(similarities.shape)
321
+ # [3, 3]
322
+ ```
323
+
324
+ <!--
325
+ ### Direct Usage (Transformers)
326
+
327
+ <details><summary>Click to see the direct usage in Transformers</summary>
328
+
329
+ </details>
330
+ -->
331
+
332
+ <!--
333
+ ### Downstream Usage (Sentence Transformers)
334
+
335
+ You can finetune this model on your own dataset.
336
+
337
+ <details><summary>Click to expand</summary>
338
+
339
+ </details>
340
+ -->
341
+
342
+ <!--
343
+ ### Out-of-Scope Use
344
+
345
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
346
+ -->
347
+
348
+ ## Evaluation
349
+
350
+ ### Metrics
351
+
352
+ #### Semantic Similarity
353
+ * Dataset: `stsb-fr-dev`
354
+ * Evaluated with [<code>EmbeddingSimilarityEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.EmbeddingSimilarityEvaluator)
355
+
356
+ | Metric | Value |
357
+ |:--------------------|:-----------|
358
+ | pearson_cosine | 0.902 |
359
+ | **spearman_cosine** | **0.9452** |
360
+ | pearson_manhattan | 0.8896 |
361
+ | spearman_manhattan | 0.9377 |
362
+ | pearson_euclidean | 0.8892 |
363
+ | spearman_euclidean | 0.9388 |
364
+ | pearson_dot | 0.8103 |
365
+ | spearman_dot | 0.9168 |
366
+ | pearson_max | 0.902 |
367
+ | spearman_max | 0.9452 |
368
+
369
+ <!--
370
+ ## Bias, Risks and Limitations
371
+
372
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
373
+ -->
374
+
375
+ <!--
376
+ ### Recommendations
377
+
378
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
379
+ -->
380
+
381
+ ## Training Details
382
+
383
+ ### Training Dataset
384
+
385
+ #### Unnamed Dataset
386
+
387
+
388
+ * Size: 5,000 training samples
389
+ * Columns: <code>sentence1</code>, <code>sentence2</code>, and <code>score</code>
390
+ * Approximate statistics based on the first 1000 samples:
391
+ | | sentence1 | sentence2 | score |
392
+ |:--------|:-----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|:---------------------------------------------------------------|
393
+ | type | string | string | float |
394
+ | details | <ul><li>min: 30 tokens</li><li>mean: 55.51 tokens</li><li>max: 90 tokens</li></ul> | <ul><li>min: 124 tokens</li><li>mean: 199.72 tokens</li><li>max: 503 tokens</li></ul> | <ul><li>min: 0.0</li><li>mean: 0.47</li><li>max: 1.0</li></ul> |
395
+ * Samples:
396
+ | sentence1 | sentence2 | score |
397
+ |:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:--------------------------------|
398
+ | <code>En complément, un sérum anti-imperfections peut être utilisé pour cibler spécifiquement les problèmes de peau tels que les imperfections et les rougeurs. Ce sérum aidera à purifier la peau et à réduire l'apparence des boutons.</code> | <code>Le sérum anti-imperfections Endro à base d'huile végétale de noisette et d'huiles essentielles bio est un concentré d'actifs naturels et antibactériens qui laisse la peau saine et les pores resserrés. Grâce à son action ciblée et hyper concentrée, il lutte efficacement contre les imperfections cutanées, réduisant ainsi les boutons et les rougeurs. Ce sérum convient aux adultes et aux adolescents à partir de 10 ans, et 73,35% des utilisateurs ont constaté une amélioration de leur peau en une semaine seulement. Les principaux ingrédients actifs tels que l'huile de noisette, l'huile essentielle de palmarosa et l'huile essentielle d'arbre à thé agissent en synergie pour purifier la peau et réguler l'excès de sébum. Pour une utilisation optimale, il est recommandé d'appliquer une petite goutte du sérum sur les zones à traiter le soir avant de dormir, en évitant le contour des yeux. Cependant, ce produit n'est pas adapté aux femmes enceintes ou allaitantes. En cas de contact avec les yeux, il est important de rincer abondamment et d'éviter toute exposition au soleil après application. Avec Endro Sérum Anti-Imperfections, retrouvez une peau nette et éclatante en toute simplicité.</code> | <code>0.9809522032737732</code> |
399
+ | <code>Un soin régulateur et matifiant, idéal pour traiter les imperfections et les pores dilatés. Sa formule spécifique permettra de réduire l'apparence des imperfections tout en resserrant les pores pour une peau plus lisse et uniforme.</code> | <code>Le La Roche-Posay Effaclar MAT Soin Hydratant Sébo-Régulateur Visage Peaux Grasses est un soin spécialement conçu pour les peaux grasses sensibles sujettes à la brillance. Sa formule anti-brillance et anti-pores dilatés, grâce à l'association de Sebulyse, de microsphères absorbantes et de perlite, régule la production de sébum et matifie la peau immédiatement. Ce soin hydratant offre un effet matifiant et hydratant longue durée, tout en étant une excellente base de maquillage. Il convient aux adultes et aux adolescents, et est idéal pour les peaux à imperfections, à tendance acnéique et sujettes à la brillance. Pour une utilisation optimale, il est recommandé d'appliquer le produit matin et/ou soir sur l'ensemble du visage. Il est important de noter que ce produit est testé sous contrôle dermatologique, non comédogène et hypoallergénique.</code> | <code>0.9946829676628112</code> |
400
+ | <code>Un complément de traitement anti-taches, conçu pour cibler spécifiquement les taches pigmentaires. Ce complément concentré en actifs éclaircissants aidera à atténuer les taches existantes et à prévenir l'apparition de nouvelles taches. Il est recommandé de l'utiliser en complément des autres soins pour une action ciblée et efficace.</code> | <code>Le Lierac Lumilogie Anti-Taches est un traitement ciblé pour les 3 types de taches cutanées : naissantes, visibles et incrustées. Grâce à sa formule innovante inspirée des techniques esthétiques combinées, ce produit agit sur les taches à tous les stades de leur développement. Enrichi en Hexyl R., Lys de mer et Extrait de plantain, il freine la production de mélanine, diminue les taches visibles et lutte contre l'incrustation de la mélanine en profondeur. De plus, les concentrés de vitamines E et B3 ainsi que les 7 hydroxy acides activent le renouvellement cellulaire pour éliminer la mélanine en surface. En résulte un teint unifié et plus uniforme dès la première utilisation, avec une efficacité prouvée dès 7 jours et une correction visible des taches dès 28 jours. Pour une utilisation optimale, appliquez 2 pressions du concentré jour le matin et du concentré nuit le soir sur l'ensemble du visage, en évitant le contour des yeux. Veillez à éviter le contour des yeux et à utiliser une protection solaire avec IP en cas d'exposition au soleil.</code> | <code>0.9939286708831788</code> |
401
+ * Loss: [<code>CoSENTLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cosentloss) with these parameters:
402
+ ```json
403
+ {
404
+ "scale": 20.0,
405
+ "similarity_fct": "pairwise_cos_sim"
406
+ }
407
+ ```
408
+
409
+ ### Evaluation Dataset
410
+
411
+ #### Unnamed Dataset
412
+
413
+
414
+ * Size: 1,000 evaluation samples
415
+ * Columns: <code>sentence1</code>, <code>sentence2</code>, and <code>score</code>
416
+ * Approximate statistics based on the first 1000 samples:
417
+ | | sentence1 | sentence2 | score |
418
+ |:--------|:-----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|:---------------------------------------------------------------|
419
+ | type | string | string | float |
420
+ | details | <ul><li>min: 30 tokens</li><li>mean: 54.83 tokens</li><li>max: 88 tokens</li></ul> | <ul><li>min: 120 tokens</li><li>mean: 197.93 tokens</li><li>max: 491 tokens</li></ul> | <ul><li>min: 0.0</li><li>mean: 0.46</li><li>max: 1.0</li></ul> |
421
+ * Samples:
422
+ | sentence1 | sentence2 | score |
423
+ |:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:--------------------------------|
424
+ | <code>Un complément hydratant et correcteur, idéal pour les peaux sensibles et sujettes aux taches. Ce complément aidera à hydrater en profondeur, à atténuer les rides et à réduire l'apparence des pores pour une peau plus lisse et uniforme.</code> | <code>L'Huile Végétale de Karité Bio de Puressentiel est un produit nutritif, réparateur et apaisant, idéal pour nourrir et réparer en profondeur la peau et les cheveux. Cette huile 100% pure et naturelle est recommandée pour une utilisation externe sur la peau et les cheveux. Enrichie en beurre de karité issu de l'agriculture biologique, elle offre des propriétés nourrissantes et réparatrices. Pour une utilisation sur le visage et le corps, il est conseillé de chauffer une noisette de beurre de karité dans la paume de la main et de l'appliquer sur les zones sèches et craquelées. Pour les cheveux secs et abîmés, il suffit de chauffer une petite noisette de beurre de karité entre les mains et de l'appliquer sur les pointes et les longueurs. Il est important d'éviter le contact avec les yeux et les muqueuses, et de se laver les mains après application. Il est recommandé de conserver le produit à l'abri de la lumière, de l'air et de la chaleur. Disponible en pot de 100 ml, cette huile de karité bio est un allié naturel pour prendre soin de sa peau et de ses cheveux.</code> | <code>0.0544042661786079</code> |
425
+ | <code>Un soin anti-âge global, conçu pour traiter les rides, les taches pigmentaires et les imperfections. Sa formule régulatrice et éclatante aidera à lisser la peau, à atténuer les taches et à réduire les imperfections pour un teint plus uniforme et lumineux.</code> | <code>Le sérum contour des yeux anti-rides Maison Éole Elle Et Lui Émerveillé est un produit de parapharmacie haut de gamme qui agit efficacement contre les rides, les ridules, les cernes et les poches. Sa formule complète enrichie en Bakuchiol, alternative naturelle au Rétinol A, nourrit la peau en profondeur et réduit les tâches cutanées. Grâce à ses actifs tels que l'huile de pépin de raisin, le Bisabolol et le Resvératrol, ce sérum hydrate intensément, lisse la peau et prévient le vieillissement cutané. Son utilisation matin et soir sur une peau propre permet d'obtenir un regard éclatant et reposé. Le flacon-pipette de 15ml facilite son application. Ce produit convient à tous les types de peau et ne contient ni parabène, ni silicone, ni ingrédients d'origine animale. Il est recommandé de suivre les instructions d'utilisation pour des résultats optimaux.</code> | <code>0.0781720206141471</code> |
426
+ | <code>Un soin anti-rides et éclat, enrichi en actifs régénérants et illuminants. Ce soin aidera à lisser les rides, à uniformiser le teint et à redonner de l'éclat à la peau fatiguée.</code> | <code>L'Eau Micellaire Sebiaclear de SVR est un produit de parapharmacie qui purifie, nettoie et démaquille la peau en un seul geste. Adaptée aux peaux sensibles mixtes à grasses, cette eau micellaire aide à éliminer les impuretés, les boutons, les points noirs et l'excès de sébum sans dessécher la peau. Grâce à sa formule innovante contenant de la gluconolactone et de la niacinamide, elle offre une haute efficacité tout en respectant la peau. Les micelles présentes dans le produit nettoient et démaquillent en douceur, laissant la peau nette et fraîche. Pour l'utiliser, il suffit d'appliquer l'eau micellaire matin et/ou soir à l'aide d'un coton sur le visage et les yeux, sans rinçage. Avec une présentation en flacon de 400 ml, ce produit convient aux peaux sensibles à tendance acnéique et offre des résultats visibles dès 7 jours d'utilisation. Il est recommandé de ne pas l'utiliser en cas d'allergie à l'un des ingrédients et de consulter un professionnel de santé en cas de doute.</code> | <code>0.0607918016612529</code> |
427
+ * Loss: [<code>CoSENTLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cosentloss) with these parameters:
428
+ ```json
429
+ {
430
+ "scale": 20.0,
431
+ "similarity_fct": "pairwise_cos_sim"
432
+ }
433
+ ```
434
+
435
+ ### Training Hyperparameters
436
+ #### Non-Default Hyperparameters
437
+
438
+ - `eval_strategy`: steps
439
+ - `per_device_train_batch_size`: 16
440
+ - `per_device_eval_batch_size`: 16
441
+ - `learning_rate`: 2e-05
442
+ - `weight_decay`: 0.01
443
+ - `num_train_epochs`: 4
444
+ - `warmup_ratio`: 0.1
445
+ - `bf16`: True
446
+ - `load_best_model_at_end`: True
447
+ - `batch_sampler`: no_duplicates
448
+
449
+ #### All Hyperparameters
450
+ <details><summary>Click to expand</summary>
451
+
452
+ - `overwrite_output_dir`: False
453
+ - `do_predict`: False
454
+ - `eval_strategy`: steps
455
+ - `prediction_loss_only`: True
456
+ - `per_device_train_batch_size`: 16
457
+ - `per_device_eval_batch_size`: 16
458
+ - `per_gpu_train_batch_size`: None
459
+ - `per_gpu_eval_batch_size`: None
460
+ - `gradient_accumulation_steps`: 1
461
+ - `eval_accumulation_steps`: None
462
+ - `learning_rate`: 2e-05
463
+ - `weight_decay`: 0.01
464
+ - `adam_beta1`: 0.9
465
+ - `adam_beta2`: 0.999
466
+ - `adam_epsilon`: 1e-08
467
+ - `max_grad_norm`: 1.0
468
+ - `num_train_epochs`: 4
469
+ - `max_steps`: -1
470
+ - `lr_scheduler_type`: linear
471
+ - `lr_scheduler_kwargs`: {}
472
+ - `warmup_ratio`: 0.1
473
+ - `warmup_steps`: 0
474
+ - `log_level`: passive
475
+ - `log_level_replica`: warning
476
+ - `log_on_each_node`: True
477
+ - `logging_nan_inf_filter`: True
478
+ - `save_safetensors`: True
479
+ - `save_on_each_node`: False
480
+ - `save_only_model`: False
481
+ - `restore_callback_states_from_checkpoint`: False
482
+ - `no_cuda`: False
483
+ - `use_cpu`: False
484
+ - `use_mps_device`: False
485
+ - `seed`: 42
486
+ - `data_seed`: None
487
+ - `jit_mode_eval`: False
488
+ - `use_ipex`: False
489
+ - `bf16`: True
490
+ - `fp16`: False
491
+ - `fp16_opt_level`: O1
492
+ - `half_precision_backend`: auto
493
+ - `bf16_full_eval`: False
494
+ - `fp16_full_eval`: False
495
+ - `tf32`: None
496
+ - `local_rank`: 0
497
+ - `ddp_backend`: None
498
+ - `tpu_num_cores`: None
499
+ - `tpu_metrics_debug`: False
500
+ - `debug`: []
501
+ - `dataloader_drop_last`: False
502
+ - `dataloader_num_workers`: 0
503
+ - `dataloader_prefetch_factor`: None
504
+ - `past_index`: -1
505
+ - `disable_tqdm`: False
506
+ - `remove_unused_columns`: True
507
+ - `label_names`: None
508
+ - `load_best_model_at_end`: True
509
+ - `ignore_data_skip`: False
510
+ - `fsdp`: []
511
+ - `fsdp_min_num_params`: 0
512
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
513
+ - `fsdp_transformer_layer_cls_to_wrap`: None
514
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
515
+ - `deepspeed`: None
516
+ - `label_smoothing_factor`: 0.0
517
+ - `optim`: adamw_torch
518
+ - `optim_args`: None
519
+ - `adafactor`: False
520
+ - `group_by_length`: False
521
+ - `length_column_name`: length
522
+ - `ddp_find_unused_parameters`: None
523
+ - `ddp_bucket_cap_mb`: None
524
+ - `ddp_broadcast_buffers`: False
525
+ - `dataloader_pin_memory`: True
526
+ - `dataloader_persistent_workers`: False
527
+ - `skip_memory_metrics`: True
528
+ - `use_legacy_prediction_loop`: False
529
+ - `push_to_hub`: False
530
+ - `resume_from_checkpoint`: None
531
+ - `hub_model_id`: None
532
+ - `hub_strategy`: every_save
533
+ - `hub_private_repo`: False
534
+ - `hub_always_push`: False
535
+ - `gradient_checkpointing`: False
536
+ - `gradient_checkpointing_kwargs`: None
537
+ - `include_inputs_for_metrics`: False
538
+ - `eval_do_concat_batches`: True
539
+ - `fp16_backend`: auto
540
+ - `push_to_hub_model_id`: None
541
+ - `push_to_hub_organization`: None
542
+ - `mp_parameters`:
543
+ - `auto_find_batch_size`: False
544
+ - `full_determinism`: False
545
+ - `torchdynamo`: None
546
+ - `ray_scope`: last
547
+ - `ddp_timeout`: 1800
548
+ - `torch_compile`: False
549
+ - `torch_compile_backend`: None
550
+ - `torch_compile_mode`: None
551
+ - `dispatch_batches`: None
552
+ - `split_batches`: None
553
+ - `include_tokens_per_second`: False
554
+ - `include_num_input_tokens_seen`: False
555
+ - `neftune_noise_alpha`: None
556
+ - `optim_target_modules`: None
557
+ - `batch_eval_metrics`: False
558
+ - `batch_sampler`: no_duplicates
559
+ - `multi_dataset_batch_sampler`: proportional
560
+
561
+ </details>
562
+
563
+ ### Training Logs
564
+ | Epoch | Step | Training Loss | loss | stsb-fr-dev_spearman_cosine |
565
+ |:------:|:----:|:-------------:|:------:|:---------------------------:|
566
+ | 0 | 0 | - | - | 0.4986 |
567
+ | 0.3195 | 100 | 4.6554 | 4.3185 | 0.8719 |
568
+ | 0.6390 | 200 | 4.2773 | 4.1772 | 0.8984 |
569
+ | 0.9585 | 300 | 4.1015 | 4.0808 | 0.9128 |
570
+ | 1.2748 | 400 | 4.0285 | 4.0244 | 0.9215 |
571
+ | 1.5942 | 500 | 3.9269 | 4.0512 | 0.9317 |
572
+ | 1.9137 | 600 | 3.8057 | 3.9970 | 0.9348 |
573
+ | 2.2300 | 700 | 3.7665 | 4.0250 | 0.9350 |
574
+ | 2.5495 | 800 | 3.7541 | 3.9587 | 0.9396 |
575
+ | 2.8690 | 900 | 3.6029 | 4.0481 | 0.9407 |
576
+ | 3.1853 | 1000 | 3.6183 | 3.9964 | 0.9416 |
577
+ | 3.5048 | 1100 | 3.5848 | 3.9711 | 0.9454 |
578
+ | 3.8243 | 1200 | 3.5029 | 3.9985 | 0.9452 |
579
+
580
+
581
+ ### Framework Versions
582
+ - Python: 3.10.12
583
+ - Sentence Transformers: 3.0.1
584
+ - Transformers: 4.41.2
585
+ - PyTorch: 2.3.0+cu121
586
+ - Accelerate: 0.31.0
587
+ - Datasets: 2.20.0
588
+ - Tokenizers: 0.19.1
589
+
590
+ ## Citation
591
+
592
+ ### BibTeX
593
+
594
+ #### Sentence Transformers
595
+ ```bibtex
596
+ @inproceedings{reimers-2019-sentence-bert,
597
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
598
+ author = "Reimers, Nils and Gurevych, Iryna",
599
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
600
+ month = "11",
601
+ year = "2019",
602
+ publisher = "Association for Computational Linguistics",
603
+ url = "https://arxiv.org/abs/1908.10084",
604
+ }
605
+ ```
606
+
607
+ #### CoSENTLoss
608
+ ```bibtex
609
+ @online{kexuefm-8847,
610
+ title={CoSENT: A more efficient sentence vector scheme than Sentence-BERT},
611
+ author={Su Jianlin},
612
+ year={2022},
613
+ month={Jan},
614
+ url={https://kexue.fm/archives/8847},
615
+ }
616
+ ```
617
+
618
+ <!--
619
+ ## Glossary
620
+
621
+ *Clearly define terms in order to be accessible across audiences.*
622
+ -->
623
+
624
+ <!--
625
+ ## Model Card Authors
626
+
627
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
628
+ -->
629
+
630
+ <!--
631
+ ## Model Card Contact
632
+
633
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
634
+ -->
added_tokens.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ {
2
+ "<unk>NOTUSED": 32005
3
+ }
config.json ADDED
@@ -0,0 +1,28 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "/content/models/camembert-cosmetic-similarity/checkpoint-1200",
3
+ "architectures": [
4
+ "CamembertModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "bos_token_id": 5,
8
+ "classifier_dropout": null,
9
+ "eos_token_id": 6,
10
+ "hidden_act": "gelu",
11
+ "hidden_dropout_prob": 0.1,
12
+ "hidden_size": 768,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 3072,
15
+ "layer_norm_eps": 1e-05,
16
+ "max_position_embeddings": 514,
17
+ "model_type": "camembert",
18
+ "num_attention_heads": 12,
19
+ "num_hidden_layers": 12,
20
+ "output_past": true,
21
+ "pad_token_id": 1,
22
+ "position_embedding_type": "absolute",
23
+ "torch_dtype": "float32",
24
+ "transformers_version": "4.41.2",
25
+ "type_vocab_size": 1,
26
+ "use_cache": true,
27
+ "vocab_size": 32005
28
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.0.1",
4
+ "transformers": "4.41.2",
5
+ "pytorch": "2.3.0+cu121"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": null
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:57bf51aa0df0dcc627fec1fdaa9ef97b5ceb783e0271057016526f16ecf351f2
3
+ size 442510176
modules.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ }
14
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
sentencepiece.bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:988bc5a00281c6d210a5d34bd143d0363741a432fefe741bf71e61b1869d4314
3
+ size 810912
special_tokens_map.json ADDED
@@ -0,0 +1,56 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "additional_special_tokens": [
3
+ "<s>NOTUSED",
4
+ "</s>NOTUSED",
5
+ "<unk>NOTUSED"
6
+ ],
7
+ "bos_token": {
8
+ "content": "<s>",
9
+ "lstrip": false,
10
+ "normalized": false,
11
+ "rstrip": false,
12
+ "single_word": false
13
+ },
14
+ "cls_token": {
15
+ "content": "<s>",
16
+ "lstrip": false,
17
+ "normalized": false,
18
+ "rstrip": false,
19
+ "single_word": false
20
+ },
21
+ "eos_token": {
22
+ "content": "</s>",
23
+ "lstrip": false,
24
+ "normalized": false,
25
+ "rstrip": false,
26
+ "single_word": false
27
+ },
28
+ "mask_token": {
29
+ "content": "<mask>",
30
+ "lstrip": true,
31
+ "normalized": false,
32
+ "rstrip": false,
33
+ "single_word": false
34
+ },
35
+ "pad_token": {
36
+ "content": "<pad>",
37
+ "lstrip": false,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false
41
+ },
42
+ "sep_token": {
43
+ "content": "</s>",
44
+ "lstrip": false,
45
+ "normalized": false,
46
+ "rstrip": false,
47
+ "single_word": false
48
+ },
49
+ "unk_token": {
50
+ "content": "<unk>",
51
+ "lstrip": false,
52
+ "normalized": false,
53
+ "rstrip": false,
54
+ "single_word": false
55
+ }
56
+ }
tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json ADDED
@@ -0,0 +1,90 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>NOTUSED",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>NOTUSED",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "4": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "5": {
36
+ "content": "<s>",
37
+ "lstrip": false,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ },
43
+ "6": {
44
+ "content": "</s>",
45
+ "lstrip": false,
46
+ "normalized": false,
47
+ "rstrip": false,
48
+ "single_word": false,
49
+ "special": true
50
+ },
51
+ "32004": {
52
+ "content": "<mask>",
53
+ "lstrip": true,
54
+ "normalized": false,
55
+ "rstrip": false,
56
+ "single_word": false,
57
+ "special": true
58
+ },
59
+ "32005": {
60
+ "content": "<unk>NOTUSED",
61
+ "lstrip": false,
62
+ "normalized": false,
63
+ "rstrip": false,
64
+ "single_word": false,
65
+ "special": true
66
+ }
67
+ },
68
+ "additional_special_tokens": [
69
+ "<s>NOTUSED",
70
+ "</s>NOTUSED",
71
+ "<unk>NOTUSED"
72
+ ],
73
+ "bos_token": "<s>",
74
+ "clean_up_tokenization_spaces": true,
75
+ "cls_token": "<s>",
76
+ "eos_token": "</s>",
77
+ "mask_token": "<mask>",
78
+ "max_length": 512,
79
+ "model_max_length": 512,
80
+ "pad_to_multiple_of": null,
81
+ "pad_token": "<pad>",
82
+ "pad_token_type_id": 0,
83
+ "padding_side": "right",
84
+ "sep_token": "</s>",
85
+ "stride": 0,
86
+ "tokenizer_class": "CamembertTokenizer",
87
+ "truncation_side": "right",
88
+ "truncation_strategy": "longest_first",
89
+ "unk_token": "<unk>"
90
+ }