init

Browse files

Files changed (6) hide show

README.md +32 -0
dev.tsv +0 -0
loss.tsv +11 -0
pytorch_model.bin +3 -0
test.tsv +0 -0
training.log +364 -0

README.md ADDED Viewed

	@@ -0,0 +1,32 @@

+---
+tags:
+- flair
+- token-classification
+- sequence-tagger-model
+language: en
+widget:
+- text: "12 sets of 2 minutes 38 minutes between each set"
+---
+7-class NER English model using [Flair TransformerWordEmbeddings - distilroberta-base](https://github.com/flairNLP/flair/).
+| **tag**                        | **meaning** |
+|---------------------------------|-----------|
+| nb_rounds         | Number of rounds |
+| duration_br_sd         | Duration btwn rounds in seconds |
+| duration_br_min         | Duration btwn rounds in minutes |
+| duration_br_hr         | Duration btwn rounds in hours |
+| duration_wt_sd         | workout duration in seconds |
+| duration_wt_min         | workout duration in minutes |
+| duration_wt_hr         | workout duration in hours |
+---
+The dataset was created manually (perfectible). Sentences example :
+```
+19 sets of 3 minutes 21 minutes between sets
+start 7 sets of 32 seconds
+create 13 sets of 26 seconds
+init 8 series of 3 hours
+2 sets of 30 seconds 35 minutes between each cycle
+...
+```

dev.tsv ADDED Viewed

The diff for this file is too large to render. See raw diff

loss.tsv ADDED Viewed

	@@ -0,0 +1,11 @@

+EPOCH	TIMESTAMP	BAD_EPOCHS	LEARNING_RATE	TRAIN_LOSS	DEV_LOSS	DEV_PRECISION	DEV_RECALL	DEV_F1	DEV_ACCURACY
+1	15:37:11	0	0.0001	0.16075978090894327	0.0029305333737283945	0.9992	0.9992	0.9992	0.9992
+2	15:39:39	0	0.0001	0.11129908844900666	0.0013541270745918155	0.9992	0.9992	0.9992	0.9992
+3	15:42:09	1	0.0001	0.11176801912461394	0.0017125594895333052	0.9992	0.9992	0.9992	0.9992
+4	15:44:39	2	0.0001	0.11077808575201452	0.0035813269205391407	0.9992	0.9992	0.9992	0.9992
+5	15:47:07	0	0.0001	0.10987376058836824	0.0010140719823539257	0.9995	0.9995	0.9995	0.9995
+6	15:49:35	1	0.0001	0.10985530377211841	0.0014548080507665873	0.9993	0.9993	0.9993	0.9993
+7	15:52:04	2	0.0001	0.11081814550640288	0.0011286081280559301	0.9994	0.9994	0.9994	0.9994
+8	15:54:33	0	0.0001	0.1101565688396648	0.0014515728689730167	0.9995	0.9995	0.9995	0.9995
+9	15:57:02	1	0.0001	0.11015787282151847	0.0028099738992750645	0.9994	0.9994	0.9994	0.9994
+10	15:59:31	2	0.0001	0.1096125644685161	0.004609304014593363	0.9993	0.9993	0.9993	0.9993

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6178fe753987ccc16cf513c1d15ab22cd01d29eadcfa580549d99aaa771b7840
+size 338076137

test.tsv ADDED Viewed

The diff for this file is too large to render. See raw diff

training.log ADDED Viewed

	@@ -0,0 +1,364 @@

+2021-11-17 15:34:49,923 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:34:49,924 Model: "SequenceTagger(
+  (embeddings): TransformerWordEmbeddings(
+    (model): RobertaModel(
+      (embeddings): RobertaEmbeddings(
+        (word_embeddings): Embedding(50265, 768, padding_idx=1)
+        (position_embeddings): Embedding(514, 768, padding_idx=1)
+        (token_type_embeddings): Embedding(1, 768)
+        (LayerNorm): LayerNorm((768,), eps=1e-05, elementwise_affine=True)
+        (dropout): Dropout(p=0.1, inplace=False)
+      )
+      (encoder): RobertaEncoder(
+        (layer): ModuleList(
+          (0): RobertaLayer(
+            (attention): RobertaAttention(
+              (self): RobertaSelfAttention(
+                (query): Linear(in_features=768, out_features=768, bias=True)
+                (key): Linear(in_features=768, out_features=768, bias=True)
+                (value): Linear(in_features=768, out_features=768, bias=True)
+                (dropout): Dropout(p=0.1, inplace=False)
+              )
+              (output): RobertaSelfOutput(
+                (dense): Linear(in_features=768, out_features=768, bias=True)
+                (LayerNorm): LayerNorm((768,), eps=1e-05, elementwise_affine=True)
+                (dropout): Dropout(p=0.1, inplace=False)
+              )
+            )
+            (intermediate): RobertaIntermediate(
+              (dense): Linear(in_features=768, out_features=3072, bias=True)
+            )
+            (output): RobertaOutput(
+              (dense): Linear(in_features=3072, out_features=768, bias=True)
+              (LayerNorm): LayerNorm((768,), eps=1e-05, elementwise_affine=True)
+              (dropout): Dropout(p=0.1, inplace=False)
+            )
+          )
+          (1): RobertaLayer(
+            (attention): RobertaAttention(
+              (self): RobertaSelfAttention(
+                (query): Linear(in_features=768, out_features=768, bias=True)
+                (key): Linear(in_features=768, out_features=768, bias=True)
+                (value): Linear(in_features=768, out_features=768, bias=True)
+                (dropout): Dropout(p=0.1, inplace=False)
+              )
+              (output): RobertaSelfOutput(
+                (dense): Linear(in_features=768, out_features=768, bias=True)
+                (LayerNorm): LayerNorm((768,), eps=1e-05, elementwise_affine=True)
+                (dropout): Dropout(p=0.1, inplace=False)
+              )
+            )
+            (intermediate): RobertaIntermediate(
+              (dense): Linear(in_features=768, out_features=3072, bias=True)
+            )
+            (output): RobertaOutput(
+              (dense): Linear(in_features=3072, out_features=768, bias=True)
+              (LayerNorm): LayerNorm((768,), eps=1e-05, elementwise_affine=True)
+              (dropout): Dropout(p=0.1, inplace=False)
+            )
+          )
+          (2): RobertaLayer(
+            (attention): RobertaAttention(
+              (self): RobertaSelfAttention(
+                (query): Linear(in_features=768, out_features=768, bias=True)
+                (key): Linear(in_features=768, out_features=768, bias=True)
+                (value): Linear(in_features=768, out_features=768, bias=True)
+                (dropout): Dropout(p=0.1, inplace=False)
+              )
+              (output): RobertaSelfOutput(
+                (dense): Linear(in_features=768, out_features=768, bias=True)
+                (LayerNorm): LayerNorm((768,), eps=1e-05, elementwise_affine=True)
+                (dropout): Dropout(p=0.1, inplace=False)
+              )
+            )
+            (intermediate): RobertaIntermediate(
+              (dense): Linear(in_features=768, out_features=3072, bias=True)
+            )
+            (output): RobertaOutput(
+              (dense): Linear(in_features=3072, out_features=768, bias=True)
+              (LayerNorm): LayerNorm((768,), eps=1e-05, elementwise_affine=True)
+              (dropout): Dropout(p=0.1, inplace=False)
+            )
+          )
+          (3): RobertaLayer(
+            (attention): RobertaAttention(
+              (self): RobertaSelfAttention(
+                (query): Linear(in_features=768, out_features=768, bias=True)
+                (key): Linear(in_features=768, out_features=768, bias=True)
+                (value): Linear(in_features=768, out_features=768, bias=True)
+                (dropout): Dropout(p=0.1, inplace=False)
+              )
+              (output): RobertaSelfOutput(
+                (dense): Linear(in_features=768, out_features=768, bias=True)
+                (LayerNorm): LayerNorm((768,), eps=1e-05, elementwise_affine=True)
+                (dropout): Dropout(p=0.1, inplace=False)
+              )
+            )
+            (intermediate): RobertaIntermediate(
+              (dense): Linear(in_features=768, out_features=3072, bias=True)
+            )
+            (output): RobertaOutput(
+              (dense): Linear(in_features=3072, out_features=768, bias=True)
+              (LayerNorm): LayerNorm((768,), eps=1e-05, elementwise_affine=True)
+              (dropout): Dropout(p=0.1, inplace=False)
+            )
+          )
+          (4): RobertaLayer(
+            (attention): RobertaAttention(
+              (self): RobertaSelfAttention(
+                (query): Linear(in_features=768, out_features=768, bias=True)
+                (key): Linear(in_features=768, out_features=768, bias=True)
+                (value): Linear(in_features=768, out_features=768, bias=True)
+                (dropout): Dropout(p=0.1, inplace=False)
+              )
+              (output): RobertaSelfOutput(
+                (dense): Linear(in_features=768, out_features=768, bias=True)
+                (LayerNorm): LayerNorm((768,), eps=1e-05, elementwise_affine=True)
+                (dropout): Dropout(p=0.1, inplace=False)
+              )
+            )
+            (intermediate): RobertaIntermediate(
+              (dense): Linear(in_features=768, out_features=3072, bias=True)
+            )
+            (output): RobertaOutput(
+              (dense): Linear(in_features=3072, out_features=768, bias=True)
+              (LayerNorm): LayerNorm((768,), eps=1e-05, elementwise_affine=True)
+              (dropout): Dropout(p=0.1, inplace=False)
+            )
+          )
+          (5): RobertaLayer(
+            (attention): RobertaAttention(
+              (self): RobertaSelfAttention(
+                (query): Linear(in_features=768, out_features=768, bias=True)
+                (key): Linear(in_features=768, out_features=768, bias=True)
+                (value): Linear(in_features=768, out_features=768, bias=True)
+                (dropout): Dropout(p=0.1, inplace=False)
+              )
+              (output): RobertaSelfOutput(
+                (dense): Linear(in_features=768, out_features=768, bias=True)
+                (LayerNorm): LayerNorm((768,), eps=1e-05, elementwise_affine=True)
+                (dropout): Dropout(p=0.1, inplace=False)
+              )
+            )
+            (intermediate): RobertaIntermediate(
+              (dense): Linear(in_features=768, out_features=3072, bias=True)
+            )
+            (output): RobertaOutput(
+              (dense): Linear(in_features=3072, out_features=768, bias=True)
+              (LayerNorm): LayerNorm((768,), eps=1e-05, elementwise_affine=True)
+              (dropout): Dropout(p=0.1, inplace=False)
+            )
+          )
+        )
+      )
+      (pooler): RobertaPooler(
+        (dense): Linear(in_features=768, out_features=768, bias=True)
+        (activation): Tanh()
+      )
+    )
+  )
+  (word_dropout): WordDropout(p=0.05)
+  (locked_dropout): LockedDropout(p=0.5)
+  (embedding2nn): Linear(in_features=1536, out_features=1536, bias=True)
+  (linear): Linear(in_features=1536, out_features=16, bias=True)
+  (beta): 1.0
+  (weights): None
+  (weight_tensor) None
+)"
+2021-11-17 15:34:49,924 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:34:49,925 Corpus: "Corpus: 56700 train + 6300 dev + 7000 test sentences"
+2021-11-17 15:34:49,925 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:34:49,926 Parameters:
+2021-11-17 15:34:49,926  - learning_rate: "5e-05"
+2021-11-17 15:34:49,926  - mini_batch_size: "64"
+2021-11-17 15:34:49,926  - patience: "3"
+2021-11-17 15:34:49,927  - anneal_factor: "0.5"
+2021-11-17 15:34:49,927  - max_epochs: "10"
+2021-11-17 15:34:49,927  - shuffle: "True"
+2021-11-17 15:34:49,928  - train_with_dev: "False"
+2021-11-17 15:34:49,928  - batch_growth_annealing: "False"
+2021-11-17 15:34:49,928 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:34:49,929 Model training base path: "training/flair_ner/17112021_152905"
+2021-11-17 15:34:49,930 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:34:49,930 Device: cuda
+2021-11-17 15:34:49,931 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:34:49,931 Embeddings storage mode: cpu
+2021-11-17 15:34:49,933 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:35:02,874 epoch 1 - iter 88/886 - loss 0.50644155 - samples/sec: 435.49 - lr: 0.000050
+2021-11-17 15:35:15,686 epoch 1 - iter 176/886 - loss 0.32420832 - samples/sec: 439.83 - lr: 0.000050
+2021-11-17 15:35:28,472 epoch 1 - iter 264/886 - loss 0.25984089 - samples/sec: 440.71 - lr: 0.000050
+2021-11-17 15:35:41,245 epoch 1 - iter 352/886 - loss 0.22670251 - samples/sec: 441.16 - lr: 0.000050
+2021-11-17 15:35:54,419 epoch 1 - iter 440/886 - loss 0.20579280 - samples/sec: 427.72 - lr: 0.000050
+2021-11-17 15:36:07,202 epoch 1 - iter 528/886 - loss 0.19081105 - samples/sec: 440.90 - lr: 0.000050
+2021-11-17 15:36:19,841 epoch 1 - iter 616/886 - loss 0.18055071 - samples/sec: 445.85 - lr: 0.000050
+2021-11-17 15:36:32,361 epoch 1 - iter 704/886 - loss 0.17219026 - samples/sec: 450.10 - lr: 0.000050
+2021-11-17 15:36:45,001 epoch 1 - iter 792/886 - loss 0.16603222 - samples/sec: 445.79 - lr: 0.000050
+2021-11-17 15:36:57,735 epoch 1 - iter 880/886 - loss 0.16102375 - samples/sec: 442.72 - lr: 0.000050
+2021-11-17 15:36:58,592 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:36:58,593 EPOCH 1 done: loss 0.1608 - lr 0.0000500
+2021-11-17 15:37:11,841 DEV : loss 0.0029305333737283945 - f1-score (micro avg)  0.9992
+2021-11-17 15:37:11,924 BAD EPOCHS (no improvement): 0
+2021-11-17 15:37:11,924 saving best model
+2021-11-17 15:37:12,293 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:37:25,475 epoch 2 - iter 88/886 - loss 0.11026321 - samples/sec: 427.67 - lr: 0.000050
+2021-11-17 15:37:38,477 epoch 2 - iter 176/886 - loss 0.11169786 - samples/sec: 433.62 - lr: 0.000050
+2021-11-17 15:37:51,386 epoch 2 - iter 264/886 - loss 0.11076006 - samples/sec: 436.59 - lr: 0.000050
+2021-11-17 15:38:04,316 epoch 2 - iter 352/886 - loss 0.11026275 - samples/sec: 435.86 - lr: 0.000050
+2021-11-17 15:38:17,224 epoch 2 - iter 440/886 - loss 0.11058185 - samples/sec: 436.60 - lr: 0.000050
+2021-11-17 15:38:30,171 epoch 2 - iter 528/886 - loss 0.11105888 - samples/sec: 435.31 - lr: 0.000050
+2021-11-17 15:38:43,248 epoch 2 - iter 616/886 - loss 0.11093445 - samples/sec: 431.17 - lr: 0.000050
+2021-11-17 15:38:56,137 epoch 2 - iter 704/886 - loss 0.11079835 - samples/sec: 437.26 - lr: 0.000050
+2021-11-17 15:39:09,395 epoch 2 - iter 792/886 - loss 0.11148766 - samples/sec: 425.17 - lr: 0.000050
+2021-11-17 15:39:22,450 epoch 2 - iter 880/886 - loss 0.11140394 - samples/sec: 431.78 - lr: 0.000050
+2021-11-17 15:39:23,318 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:39:23,318 EPOCH 2 done: loss 0.1113 - lr 0.0000500
+2021-11-17 15:39:39,217 DEV : loss 0.0013541270745918155 - f1-score (micro avg)  0.9992
+2021-11-17 15:39:39,304 BAD EPOCHS (no improvement): 0
+2021-11-17 15:39:39,305 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:39:52,661 epoch 3 - iter 88/886 - loss 0.10886323 - samples/sec: 422.03 - lr: 0.000050
+2021-11-17 15:40:05,912 epoch 3 - iter 176/886 - loss 0.10787832 - samples/sec: 425.49 - lr: 0.000050
+2021-11-17 15:40:19,212 epoch 3 - iter 264/886 - loss 0.11035842 - samples/sec: 423.74 - lr: 0.000050
+2021-11-17 15:40:32,505 epoch 3 - iter 352/886 - loss 0.11104986 - samples/sec: 424.15 - lr: 0.000050
+2021-11-17 15:40:45,782 epoch 3 - iter 440/886 - loss 0.11091610 - samples/sec: 424.49 - lr: 0.000050
+2021-11-17 15:40:59,163 epoch 3 - iter 528/886 - loss 0.11110444 - samples/sec: 421.17 - lr: 0.000050
+2021-11-17 15:41:12,392 epoch 3 - iter 616/886 - loss 0.11146392 - samples/sec: 426.23 - lr: 0.000050
+2021-11-17 15:41:25,673 epoch 3 - iter 704/886 - loss 0.11154272 - samples/sec: 424.34 - lr: 0.000050
+2021-11-17 15:41:38,940 epoch 3 - iter 792/886 - loss 0.11160924 - samples/sec: 424.88 - lr: 0.000050
+2021-11-17 15:41:52,243 epoch 3 - iter 880/886 - loss 0.11176415 - samples/sec: 423.61 - lr: 0.000050
+2021-11-17 15:41:53,139 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:41:53,141 EPOCH 3 done: loss 0.1118 - lr 0.0000500
+2021-11-17 15:42:09,290 DEV : loss 0.0017125594895333052 - f1-score (micro avg)  0.9992
+2021-11-17 15:42:09,373 BAD EPOCHS (no improvement): 1
+2021-11-17 15:42:09,374 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:42:22,858 epoch 4 - iter 88/886 - loss 0.10978185 - samples/sec: 418.00 - lr: 0.000050
+2021-11-17 15:42:36,074 epoch 4 - iter 176/886 - loss 0.10973528 - samples/sec: 426.43 - lr: 0.000050
+2021-11-17 15:42:49,423 epoch 4 - iter 264/886 - loss 0.11060583 - samples/sec: 422.19 - lr: 0.000050
+2021-11-17 15:43:02,798 epoch 4 - iter 352/886 - loss 0.11082956 - samples/sec: 421.55 - lr: 0.000050
+2021-11-17 15:43:16,118 epoch 4 - iter 440/886 - loss 0.11054231 - samples/sec: 423.16 - lr: 0.000050
+2021-11-17 15:43:29,471 epoch 4 - iter 528/886 - loss 0.11108359 - samples/sec: 422.07 - lr: 0.000050
+2021-11-17 15:43:42,869 epoch 4 - iter 616/886 - loss 0.11117851 - samples/sec: 420.64 - lr: 0.000050
+2021-11-17 15:43:56,526 epoch 4 - iter 704/886 - loss 0.11137181 - samples/sec: 412.67 - lr: 0.000050
+2021-11-17 15:44:10,054 epoch 4 - iter 792/886 - loss 0.11142306 - samples/sec: 416.60 - lr: 0.000050
+2021-11-17 15:44:23,264 epoch 4 - iter 880/886 - loss 0.11088636 - samples/sec: 426.62 - lr: 0.000050
+2021-11-17 15:44:24,146 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:44:24,146 EPOCH 4 done: loss 0.1108 - lr 0.0000500
+2021-11-17 15:44:39,706 DEV : loss 0.0035813269205391407 - f1-score (micro avg)  0.9992
+2021-11-17 15:44:39,791 BAD EPOCHS (no improvement): 2
+2021-11-17 15:44:39,791 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:44:53,041 epoch 5 - iter 88/886 - loss 0.10802392 - samples/sec: 425.46 - lr: 0.000050
+2021-11-17 15:45:06,325 epoch 5 - iter 176/886 - loss 0.10760262 - samples/sec: 424.24 - lr: 0.000050
+2021-11-17 15:45:19,569 epoch 5 - iter 264/886 - loss 0.10806256 - samples/sec: 425.73 - lr: 0.000050
+2021-11-17 15:45:32,761 epoch 5 - iter 352/886 - loss 0.10865681 - samples/sec: 427.42 - lr: 0.000050
+2021-11-17 15:45:45,855 epoch 5 - iter 440/886 - loss 0.10912184 - samples/sec: 430.61 - lr: 0.000050
+2021-11-17 15:45:59,034 epoch 5 - iter 528/886 - loss 0.10891177 - samples/sec: 427.65 - lr: 0.000050
+2021-11-17 15:46:12,303 epoch 5 - iter 616/886 - loss 0.10963959 - samples/sec: 424.90 - lr: 0.000050
+2021-11-17 15:46:25,367 epoch 5 - iter 704/886 - loss 0.10977588 - samples/sec: 431.42 - lr: 0.000050
+2021-11-17 15:46:38,535 epoch 5 - iter 792/886 - loss 0.10983991 - samples/sec: 427.99 - lr: 0.000050
+2021-11-17 15:46:52,036 epoch 5 - iter 880/886 - loss 0.10983081 - samples/sec: 417.44 - lr: 0.000050
+2021-11-17 15:46:52,981 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:46:52,981 EPOCH 5 done: loss 0.1099 - lr 0.0000500
+2021-11-17 15:47:07,506 DEV : loss 0.0010140719823539257 - f1-score (micro avg)  0.9995
+2021-11-17 15:47:07,591 BAD EPOCHS (no improvement): 0
+2021-11-17 15:47:07,592 saving best model
+2021-11-17 15:47:08,183 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:47:21,511 epoch 6 - iter 88/886 - loss 0.10567650 - samples/sec: 422.90 - lr: 0.000050
+2021-11-17 15:47:34,509 epoch 6 - iter 176/886 - loss 0.10887869 - samples/sec: 433.61 - lr: 0.000050
+2021-11-17 15:47:47,528 epoch 6 - iter 264/886 - loss 0.10842350 - samples/sec: 432.88 - lr: 0.000050
+2021-11-17 15:48:00,526 epoch 6 - iter 352/886 - loss 0.10983462 - samples/sec: 433.80 - lr: 0.000050
+2021-11-17 15:48:13,643 epoch 6 - iter 440/886 - loss 0.10883770 - samples/sec: 429.63 - lr: 0.000050
+2021-11-17 15:48:26,632 epoch 6 - iter 528/886 - loss 0.10926475 - samples/sec: 434.11 - lr: 0.000050
+2021-11-17 15:48:39,864 epoch 6 - iter 616/886 - loss 0.10987226 - samples/sec: 425.93 - lr: 0.000050
+2021-11-17 15:48:52,954 epoch 6 - iter 704/886 - loss 0.11003466 - samples/sec: 430.54 - lr: 0.000050
+2021-11-17 15:49:06,114 epoch 6 - iter 792/886 - loss 0.11000339 - samples/sec: 428.26 - lr: 0.000050
+2021-11-17 15:49:19,283 epoch 6 - iter 880/886 - loss 0.10986999 - samples/sec: 427.94 - lr: 0.000050
+2021-11-17 15:49:20,160 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:49:20,161 EPOCH 6 done: loss 0.1099 - lr 0.0000500
+2021-11-17 15:49:35,569 DEV : loss 0.0014548080507665873 - f1-score (micro avg)  0.9993
+2021-11-17 15:49:35,652 BAD EPOCHS (no improvement): 1
+2021-11-17 15:49:35,653 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:49:48,878 epoch 7 - iter 88/886 - loss 0.10951206 - samples/sec: 426.18 - lr: 0.000050
+2021-11-17 15:50:01,971 epoch 7 - iter 176/886 - loss 0.11032338 - samples/sec: 430.47 - lr: 0.000050
+2021-11-17 15:50:15,172 epoch 7 - iter 264/886 - loss 0.11045747 - samples/sec: 426.91 - lr: 0.000050
+2021-11-17 15:50:28,317 epoch 7 - iter 352/886 - loss 0.11071942 - samples/sec: 428.73 - lr: 0.000050
+2021-11-17 15:50:41,502 epoch 7 - iter 440/886 - loss 0.11000396 - samples/sec: 427.62 - lr: 0.000050
+2021-11-17 15:50:54,735 epoch 7 - iter 528/886 - loss 0.11036286 - samples/sec: 425.91 - lr: 0.000050
+2021-11-17 15:51:08,179 epoch 7 - iter 616/886 - loss 0.11044996 - samples/sec: 419.40 - lr: 0.000050
+2021-11-17 15:51:21,435 epoch 7 - iter 704/886 - loss 0.11062300 - samples/sec: 425.15 - lr: 0.000050
+2021-11-17 15:51:34,569 epoch 7 - iter 792/886 - loss 0.11050441 - samples/sec: 429.10 - lr: 0.000050
+2021-11-17 15:51:47,616 epoch 7 - iter 880/886 - loss 0.11081751 - samples/sec: 432.02 - lr: 0.000050
+2021-11-17 15:51:48,504 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:51:48,504 EPOCH 7 done: loss 0.1108 - lr 0.0000500
+2021-11-17 15:52:04,138 DEV : loss 0.0011286081280559301 - f1-score (micro avg)  0.9994
+2021-11-17 15:52:04,221 BAD EPOCHS (no improvement): 2
+2021-11-17 15:52:04,221 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:52:17,523 epoch 8 - iter 88/886 - loss 0.10894525 - samples/sec: 423.73 - lr: 0.000050
+2021-11-17 15:52:30,625 epoch 8 - iter 176/886 - loss 0.11013192 - samples/sec: 430.14 - lr: 0.000050
+2021-11-17 15:52:43,834 epoch 8 - iter 264/886 - loss 0.11008158 - samples/sec: 426.69 - lr: 0.000050
+2021-11-17 15:52:57,028 epoch 8 - iter 352/886 - loss 0.11060585 - samples/sec: 427.15 - lr: 0.000050
+2021-11-17 15:53:10,298 epoch 8 - iter 440/886 - loss 0.11058677 - samples/sec: 424.70 - lr: 0.000050
+2021-11-17 15:53:23,599 epoch 8 - iter 528/886 - loss 0.11039821 - samples/sec: 423.70 - lr: 0.000050
+2021-11-17 15:53:36,716 epoch 8 - iter 616/886 - loss 0.11030582 - samples/sec: 429.67 - lr: 0.000050
+2021-11-17 15:53:49,982 epoch 8 - iter 704/886 - loss 0.10977816 - samples/sec: 424.83 - lr: 0.000050
+2021-11-17 15:54:03,181 epoch 8 - iter 792/886 - loss 0.11012337 - samples/sec: 426.98 - lr: 0.000050
+2021-11-17 15:54:16,462 epoch 8 - iter 880/886 - loss 0.11017103 - samples/sec: 424.37 - lr: 0.000050
+2021-11-17 15:54:17,329 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:54:17,329 EPOCH 8 done: loss 0.1102 - lr 0.0000500
+2021-11-17 15:54:32,948 DEV : loss 0.0014515728689730167 - f1-score (micro avg)  0.9995
+2021-11-17 15:54:33,031 BAD EPOCHS (no improvement): 0
+2021-11-17 15:54:33,032 saving best model
+2021-11-17 15:54:33,637 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:54:46,858 epoch 9 - iter 88/886 - loss 0.10922566 - samples/sec: 426.35 - lr: 0.000050
+2021-11-17 15:54:59,965 epoch 9 - iter 176/886 - loss 0.11082640 - samples/sec: 429.99 - lr: 0.000050
+2021-11-17 15:55:13,176 epoch 9 - iter 264/886 - loss 0.11164660 - samples/sec: 426.60 - lr: 0.000050
+2021-11-17 15:55:26,289 epoch 9 - iter 352/886 - loss 0.11113663 - samples/sec: 429.99 - lr: 0.000050
+2021-11-17 15:55:40,047 epoch 9 - iter 440/886 - loss 0.11075153 - samples/sec: 409.63 - lr: 0.000050
+2021-11-17 15:55:53,772 epoch 9 - iter 528/886 - loss 0.11070955 - samples/sec: 410.63 - lr: 0.000050
+2021-11-17 15:56:07,050 epoch 9 - iter 616/886 - loss 0.11027549 - samples/sec: 424.44 - lr: 0.000050
+2021-11-17 15:56:20,322 epoch 9 - iter 704/886 - loss 0.11003220 - samples/sec: 424.64 - lr: 0.000050
+2021-11-17 15:56:33,497 epoch 9 - iter 792/886 - loss 0.10976900 - samples/sec: 427.78 - lr: 0.000050
+2021-11-17 15:56:46,751 epoch 9 - iter 880/886 - loss 0.11015739 - samples/sec: 425.22 - lr: 0.000050
+2021-11-17 15:56:47,659 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:56:47,660 EPOCH 9 done: loss 0.1102 - lr 0.0000500
+2021-11-17 15:57:02,117 DEV : loss 0.0028099738992750645 - f1-score (micro avg)  0.9994
+2021-11-17 15:57:02,205 BAD EPOCHS (no improvement): 1
+2021-11-17 15:57:02,206 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:57:15,740 epoch 10 - iter 88/886 - loss 0.11323596 - samples/sec: 416.50 - lr: 0.000050
+2021-11-17 15:57:28,942 epoch 10 - iter 176/886 - loss 0.11324876 - samples/sec: 426.89 - lr: 0.000050
+2021-11-17 15:57:42,141 epoch 10 - iter 264/886 - loss 0.11189004 - samples/sec: 426.98 - lr: 0.000050
+2021-11-17 15:57:55,416 epoch 10 - iter 352/886 - loss 0.11062028 - samples/sec: 424.72 - lr: 0.000050
+2021-11-17 15:58:08,673 epoch 10 - iter 440/886 - loss 0.10959000 - samples/sec: 425.11 - lr: 0.000050
+2021-11-17 15:58:21,918 epoch 10 - iter 528/886 - loss 0.10964689 - samples/sec: 425.52 - lr: 0.000050
+2021-11-17 15:58:35,102 epoch 10 - iter 616/886 - loss 0.11011373 - samples/sec: 427.66 - lr: 0.000050
+2021-11-17 15:58:48,156 epoch 10 - iter 704/886 - loss 0.10975773 - samples/sec: 431.74 - lr: 0.000050
+2021-11-17 15:59:01,225 epoch 10 - iter 792/886 - loss 0.10955614 - samples/sec: 431.43 - lr: 0.000050
+2021-11-17 15:59:14,205 epoch 10 - iter 880/886 - loss 0.10966756 - samples/sec: 434.19 - lr: 0.000050
+2021-11-17 15:59:15,113 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:59:15,114 EPOCH 10 done: loss 0.1096 - lr 0.0000500
+2021-11-17 15:59:30,962 DEV : loss 0.004609304014593363 - f1-score (micro avg)  0.9993
+2021-11-17 15:59:31,047 BAD EPOCHS (no improvement): 2
+2021-11-17 15:59:31,418 ----------------------------------------------------------------------------------------------------
+2021-11-17 15:59:31,419 loading file training/flair_ner/17112021_152905/best-model.pt
+2021-11-17 15:59:49,424 0.9993	0.9993	0.9993	0.9993
+2021-11-17 15:59:49,425
+Results:
+- F-score (micro) 0.9993
+- F-score (macro) 0.9984
+- Accuracy 0.9993
+By class:
+                 precision    recall  f1-score   support
+      nb_rounds     0.9988    0.9991    0.9990      6882
+duration_br_min     0.9997    0.9979    0.9988      3303
+ duration_wt_sd     1.0000    1.0000    1.0000      3251
+duration_wt_min     1.0000    1.0000    1.0000      2698
+ duration_br_sd     0.9995    0.9995    0.9995      2003
+ duration_wt_hr     1.0000    1.0000    1.0000      1068
+ duration_br_hr     0.9830    1.0000    0.9914       231
+      micro avg     0.9993    0.9993    0.9993     19436
+      macro avg     0.9973    0.9995    0.9984     19436
+   weighted avg     0.9993    0.9993    0.9993     19436
+    samples avg     0.9993    0.9993    0.9993     19436
+2021-11-17 15:59:49,425 ----------------------------------------------------------------------------------------------------