Update Gyuyig vs Tsugdri binary classifier: center_crop 224 metrics, confusion matrix, training history

Browse files

Files changed (8) hide show

README.md +29 -29
config.yaml +6 -5
confusion_matrix.json +19 -19
confusion_matrix.png +0 -0
final_model.pt +1 -1
model_card.json +21 -21
results.json +174 -240
training_history.png +0 -0

README.md CHANGED Viewed

@@ -25,11 +25,11 @@ Fine-tuned [DINOv3 ViT-S](https://huggingface.co/facebook/dinov3-vits16-pretrain
 **Gyuyig**, **Tsugdri**
-**Experiment:** `dinov3_gyuyig_tsugdri_sub_warmstart` (`gyuyig_tsugdri_binary_classification`)
 **Pooling:** ViT **CLS token** (`last_hidden_state[:, 0, :]`)
 **Weights:** `final_model.pt` (best validation macro-F1 across stages A/B/C)
-**Warm-start:** [BDRC/4-class-balanced-script-classifier](https://huggingface.co/BDRC/4-class-balanced-script-classifier) (`final_model.pt` — prior test acc 82.6%, macro-F1 0.833)
 ## Data
@@ -43,56 +43,56 @@ Test split: balanced benchmark (60 images per parent class, held out of training
 | Split | Mode | Size |
 |-------|------|-----:|
-| train | `resize_letterbox` | 448 |
-| val | `resize_letterbox` | 448 |
-| test | `resize_letterbox` | 448 |
 ## Validation metrics (n=60)
 | Metric | Value |
 |--------|------:|
-| Accuracy | 85.0% |
-| Macro F1 | 0.850 |
-| Weighted F1 | 0.850 |
-| AUC-ROC | 0.902 |
-| Loss | 0.4520 |
-**Best checkpoint:** `best_stage_c_last_blocks.pt` epoch 7 val macro-F1 0.850
 ### Per-class (validation)
 ```
 precision    recall  f1-score   support
-      Gyuyig       0.89      0.80      0.84        30
-     Tsugdri       0.82      0.90      0.86        30
-    accuracy                           0.85        60
-   macro avg       0.85      0.85      0.85        60
-weighted avg       0.85      0.85      0.85        60
 ```
 ## Test / benchmark metrics (n=120)
 | Metric | Value |
 |--------|------:|
-| Accuracy | 80.8% |
-| Macro F1 | 0.808 |
-| Weighted F1 | 0.808 |
-| AUC-ROC | 0.868 |
-| Loss | 0.5354 |
 ### Per-class (test)
 ```
 precision    recall  f1-score   support
-      Gyuyig       0.79      0.83      0.81        60
-     Tsugdri       0.82      0.78      0.80        60
-    accuracy                           0.81       120
-   macro avg       0.81      0.81      0.81       120
-weighted avg       0.81      0.81      0.81       120
 ```
 ## Training
@@ -116,8 +116,8 @@ weighted avg       0.81      0.81      0.81       120
 | True \ Pred | Gyuyig | Tsugdri |
 |---|---:|---:|
-| **Gyuyig** | 50 | 10 |
-| **Tsugdri** | 13 | 47 |
 ## Files
@@ -137,7 +137,7 @@ weighted avg       0.81      0.81      0.81       120
 ```bash
 pip install -r requirements-inference.txt
-python inference.py --checkpoint final_model.pt --image path/to/page.jpg --preprocess resize_letterbox --preprocess-size 448
 ```
 ## Reproduce training

 **Gyuyig**, **Tsugdri**
+**Experiment:** `dinov3_gyuyig_tsugdri_binary` (`gyuyig_tsugdri_binary_classification`)
 **Pooling:** ViT **CLS token** (`last_hidden_state[:, 0, :]`)
 **Weights:** `final_model.pt` (best validation macro-F1 across stages A/B/C)
+**Warm-start:** [BDRC/4-class-balanced-script-classifier](https://huggingface.co/BDRC/4-class-balanced-script-classifier) (`final_model.pt` — prior test acc 92.1%, macro-F1 0.921)
 ## Data
 | Split | Mode | Size |
 |-------|------|-----:|
+| train | `center_crop` | 224 |
+| val | `center_crop` | 224 |
+| test | `center_crop` | 224 |
 ## Validation metrics (n=60)
 | Metric | Value |
 |--------|------:|
+| Accuracy | 91.7% |
+| Macro F1 | 0.916 |
+| Weighted F1 | 0.916 |
+| AUC-ROC | 0.931 |
+| Loss | 0.3915 |
+**Best checkpoint:** `best_stage_c_last_blocks.pt` epoch 1 val macro-F1 0.916
 ### Per-class (validation)
 ```
 precision    recall  f1-score   support
+      Gyuyig       0.88      0.97      0.92        30
+     Tsugdri       0.96      0.87      0.91        30
+    accuracy                           0.92        60
+   macro avg       0.92      0.92      0.92        60
+weighted avg       0.92      0.92      0.92        60
 ```
 ## Test / benchmark metrics (n=120)
 | Metric | Value |
 |--------|------:|
+| Accuracy | 85.0% |
+| Macro F1 | 0.848 |
+| Weighted F1 | 0.848 |
+| AUC-ROC | 0.930 |
+| Loss | 0.4047 |
 ### Per-class (test)
 ```
 precision    recall  f1-score   support
+      Gyuyig       0.78      0.97      0.87        60
+     Tsugdri       0.96      0.73      0.83        60
+    accuracy                           0.85       120
+   macro avg       0.87      0.85      0.85       120
+weighted avg       0.87      0.85      0.85       120
 ```
 ## Training
 | True \ Pred | Gyuyig | Tsugdri |
 |---|---:|---:|
+| **Gyuyig** | 58 | 2 |
+| **Tsugdri** | 16 | 44 |
 ## Files
 ```bash
 pip install -r requirements-inference.txt
+python inference.py --checkpoint final_model.pt --image path/to/page.jpg --preprocess resize_letterbox --preprocess-size 224
 ```
 ## Reproduce training

config.yaml CHANGED Viewed

@@ -1,9 +1,10 @@
-experiment: dinov3_gyuyig_tsugdri_sub_warmstart
 task: gyuyig_tsugdri_binary_classification
 balanced_dataset_repo: BDRC/gyuyig-tsugdri-binary-balanced-script-classification-dataset
 val_ratio: 0.15
 warmstart_repo: BDRC/4-class-balanced-script-classifier
 warmstart_checkpoint_file: final_model.pt
@@ -17,10 +18,10 @@ no_weighted_sampler: true
 skip_stage_c: false
 gradient_checkpointing: true
-train_preprocess: resize_letterbox
-val_preprocess: resize_letterbox
-test_preprocess: resize_letterbox
-preprocess_size: 448
 pooling: cls_token

+experiment: dinov3_gyuyig_tsugdri_binary
 task: gyuyig_tsugdri_binary_classification
 balanced_dataset_repo: BDRC/gyuyig-tsugdri-binary-balanced-script-classification-dataset
 val_ratio: 0.15
 warmstart_repo: BDRC/4-class-balanced-script-classifier
 warmstart_checkpoint_file: final_model.pt
 skip_stage_c: false
 gradient_checkpointing: true
+train_preprocess: center_crop
+val_preprocess: center_crop
+test_preprocess: center_crop
+preprocess_size: 224
 pooling: cls_token

confusion_matrix.json CHANGED Viewed

@@ -6,36 +6,36 @@
   ],
   "matrix": [
     [
-      50,
-      10
     ],
     [
-      13,
-      47
     ]
   ],
   "test_metrics": {
-    "loss": 0.5353951374689738,
-    "accuracy": 0.8083333333333333,
-    "macro_f1": 0.8082134667500521,
-    "weighted_f1": 0.8082134667500521,
-    "auc_roc": 0.8677777777777778
   },
   "val_metrics": {
-    "loss": 0.45204214652379354,
-    "accuracy": 0.85,
-    "macro_f1": 0.849624060150376,
-    "weighted_f1": 0.849624060150376,
-    "auc_roc": 0.9022222222222223
   },
   "preprocess": {
-    "train": "resize_letterbox",
-    "val": "resize_letterbox",
-    "test": "resize_letterbox",
-    "size": 448
   },
   "train_dataset": "BDRC/gyuyig-tsugdri-binary-balanced-script-classification-dataset",
   "benchmark_per_parent": 60,
-  "experiment": "dinov3_gyuyig_tsugdri_sub_warmstart",
   "repo_id": "BDRC/gyuyig-tsugdri-binary-script-classifier"
 }

   ],
   "matrix": [
     [
+      58,
+      2
     ],
     [
+      16,
+      44
     ]
   ],
   "test_metrics": {
+    "loss": 0.40474860469500223,
+    "accuracy": 0.85,
+    "macro_f1": 0.847930160518164,
+    "weighted_f1": 0.847930160518164,
+    "auc_roc": 0.9297222222222223
   },
   "val_metrics": {
+    "loss": 0.3914561231931051,
+    "accuracy": 0.9166666666666666,
+    "macro_f1": 0.9164578111946533,
+    "weighted_f1": 0.9164578111946533,
+    "auc_roc": 0.9311111111111111
   },
   "preprocess": {
+    "train": "center_crop",
+    "val": "center_crop",
+    "test": "center_crop",
+    "size": 224
   },
   "train_dataset": "BDRC/gyuyig-tsugdri-binary-balanced-script-classification-dataset",
   "benchmark_per_parent": 60,
+  "experiment": "dinov3_gyuyig_tsugdri_binary",
   "repo_id": "BDRC/gyuyig-tsugdri-binary-script-classifier"
 }

confusion_matrix.png CHANGED Viewed

final_model.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6753c4b49f6fa52b6d4580b926070cdea8dba7908f0e3a562f60dd42512e3148
 size 86670182

 version https://git-lfs.github.com/spec/v1
+oid sha256:9cce9a6920cff9cd5fc7add0a40b81969f36383fc1919fcb4c0adb1b0f2047b1
 size 86670182

model_card.json CHANGED Viewed

@@ -3,27 +3,27 @@
   "train_dataset_id": "BDRC/gyuyig-tsugdri-binary-balanced-script-classification-dataset",
   "warmstart_repo": "BDRC/4-class-balanced-script-classifier",
   "task": "gyuyig_tsugdri_binary_classification",
-  "experiment": "dinov3_gyuyig_tsugdri_sub_warmstart",
   "classes": [
     "Gyuyig",
     "Tsugdri"
   ],
   "pooling": "cls_token",
   "preprocess": {
-    "train": "resize_letterbox",
-    "val": "resize_letterbox",
-    "test": "resize_letterbox",
-    "size": 448
   },
   "warmstart": {
     "warmstart_repo": "BDRC/4-class-balanced-script-classifier",
     "warmstart_checkpoint": null,
     "warmstart_checkpoint_file": "final_model.pt",
     "checkpoint_test_metrics": {
-      "loss": 0.6574946736847913,
-      "accuracy": 0.825925925925926,
-      "macro_f1": 0.8326187473728457,
-      "weighted_f1": 0.82908384875598
     },
     "warmstart_pooling": "cls_token"
   },
@@ -66,21 +66,21 @@
   },
   "best_checkpoint": {
     "path": "best_stage_c_last_blocks.pt",
-    "epoch": 7,
-    "val_macro_f1": 0.849624060150376
   },
   "val_metrics": {
-    "loss": 0.45204214652379354,
-    "accuracy": 0.85,
-    "macro_f1": 0.849624060150376,
-    "weighted_f1": 0.849624060150376,
-    "auc_roc": 0.9022222222222223
   },
   "test_metrics": {
-    "loss": 0.5353951374689738,
-    "accuracy": 0.8083333333333333,
-    "macro_f1": 0.8082134667500521,
-    "weighted_f1": 0.8082134667500521,
-    "auc_roc": 0.8677777777777778
   }
 }

   "train_dataset_id": "BDRC/gyuyig-tsugdri-binary-balanced-script-classification-dataset",
   "warmstart_repo": "BDRC/4-class-balanced-script-classifier",
   "task": "gyuyig_tsugdri_binary_classification",
+  "experiment": "dinov3_gyuyig_tsugdri_binary",
   "classes": [
     "Gyuyig",
     "Tsugdri"
   ],
   "pooling": "cls_token",
   "preprocess": {
+    "train": "center_crop",
+    "val": "center_crop",
+    "test": "center_crop",
+    "size": 224
   },
   "warmstart": {
     "warmstart_repo": "BDRC/4-class-balanced-script-classifier",
     "warmstart_checkpoint": null,
     "warmstart_checkpoint_file": "final_model.pt",
     "checkpoint_test_metrics": {
+      "loss": 0.42663901050885517,
+      "accuracy": 0.9208333333333333,
+      "macro_f1": 0.9208489161207983,
+      "weighted_f1": 0.9208489161207983
     },
     "warmstart_pooling": "cls_token"
   },
   },
   "best_checkpoint": {
     "path": "best_stage_c_last_blocks.pt",
+    "epoch": 1,
+    "val_macro_f1": 0.9164578111946533
   },
   "val_metrics": {
+    "loss": 0.3914561231931051,
+    "accuracy": 0.9166666666666666,
+    "macro_f1": 0.9164578111946533,
+    "weighted_f1": 0.9164578111946533,
+    "auc_roc": 0.9311111111111111
   },
   "test_metrics": {
+    "loss": 0.40474860469500223,
+    "accuracy": 0.85,
+    "macro_f1": 0.847930160518164,
+    "weighted_f1": 0.847930160518164,
+    "auc_roc": 0.9297222222222223
   }
 }

results.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "experiment": "dinov3_gyuyig_tsugdri_sub_warmstart",
   "run_subdir": null,
   "task": "gyuyig_tsugdri_binary_classification",
   "balanced_parquet_dir": null,
@@ -8,10 +8,10 @@
   "benchmark_dataset_repo": null,
   "benchmark_per_parent": 60,
   "preprocess": {
-    "train": "resize_letterbox",
-    "val": "resize_letterbox",
-    "test": "resize_letterbox",
-    "size": 448
   },
   "pooling": "cls_token",
   "training_config": {
@@ -60,10 +60,10 @@
     "warmstart_checkpoint": null,
     "warmstart_checkpoint_file": "final_model.pt",
     "checkpoint_test_metrics": {
-      "loss": 0.6574946736847913,
-      "accuracy": 0.825925925925926,
-      "macro_f1": 0.8326187473728457,
-      "weighted_f1": 0.82908384875598
     },
     "warmstart_pooling": "cls_token"
   },
@@ -72,376 +72,310 @@
   },
   "best_checkpoint": {
     "path": "best_stage_c_last_blocks.pt",
-    "epoch": 7,
-    "val_macro_f1": 0.849624060150376
   },
   "val_metrics": {
-    "loss": 0.45204214652379354,
-    "accuracy": 0.85,
-    "macro_f1": 0.849624060150376,
-    "weighted_f1": 0.849624060150376,
-    "auc_roc": 0.9022222222222223
   },
   "val_confusion_matrix": [
     [
-      24,
-      6
     ],
     [
-      3,
-      27
     ]
   ],
-  "val_report": "              precision    recall  f1-score   support\n\n      Gyuyig       0.89      0.80      0.84        30\n     Tsugdri       0.82      0.90      0.86        30\n\n    accuracy                           0.85        60\n   macro avg       0.85      0.85      0.85        60\nweighted avg       0.85      0.85      0.85        60\n",
   "test_metrics": {
-    "loss": 0.5353951374689738,
-    "accuracy": 0.8083333333333333,
-    "macro_f1": 0.8082134667500521,
-    "weighted_f1": 0.8082134667500521,
-    "auc_roc": 0.8677777777777778
   },
   "test_confusion_matrix": [
     [
-      50,
-      10
     ],
     [
-      13,
-      47
     ]
   ],
-  "test_report": "              precision    recall  f1-score   support\n\n      Gyuyig       0.79      0.83      0.81        60\n     Tsugdri       0.82      0.78      0.80        60\n\n    accuracy                           0.81       120\n   macro avg       0.81      0.81      0.81       120\nweighted avg       0.81      0.81      0.81       120\n",
   "history": {
     "stage_a": [
       {
         "epoch": 1,
-        "train_loss": 0.868421577271961,
-        "train_acc": 0.39880952380952384,
         "lr_head": 5e-06,
-        "val_loss": 0.8907806555430094,
-        "val_accuracy": 0.3,
-        "val_macro_f1": 0.28,
-        "val_weighted_f1": 0.28
       },
       {
         "epoch": 2,
-        "train_loss": 0.6925251398767743,
-        "train_acc": 0.5744047619047619,
         "lr_head": 0.0005,
-        "val_loss": 0.6001647631327311,
-        "val_accuracy": 0.6166666666666667,
-        "val_macro_f1": 0.5911111111111111,
-        "val_weighted_f1": 0.5911111111111111
       },
       {
         "epoch": 3,
-        "train_loss": 0.5732808538845607,
-        "train_acc": 0.6964285714285714,
         "lr_head": 0.0004668412874366486,
-        "val_loss": 0.5495736837387085,
-        "val_accuracy": 0.7166666666666667,
-        "val_macro_f1": 0.7165879410947485,
-        "val_weighted_f1": 0.7165879410947485
       },
       {
         "epoch": 4,
-        "train_loss": 0.5409448828016009,
-        "train_acc": 0.7351190476190477,
         "lr_head": 0.00037624999999999996,
-        "val_loss": 0.5596829652786255,
-        "val_accuracy": 0.7166666666666667,
-        "val_macro_f1": 0.7127569698676429,
-        "val_weighted_f1": 0.7127569698676429
       },
       {
         "epoch": 5,
-        "train_loss": 0.517706477925891,
-        "train_acc": 0.7380952380952381,
         "lr_head": 0.0002525,
-        "val_loss": 0.570094374815623,
-        "val_accuracy": 0.6833333333333333,
-        "val_macro_f1": 0.6723196320781835,
-        "val_weighted_f1": 0.6723196320781833
       },
       {
         "epoch": 6,
-        "train_loss": 0.5244638267017546,
-        "train_acc": 0.7529761904761905,
         "lr_head": 0.00012875000000000007,
-        "val_loss": 0.5446342428525289,
-        "val_accuracy": 0.7166666666666667,
-        "val_macro_f1": 0.7159565580618212,
-        "val_weighted_f1": 0.7159565580618211
       },
       {
         "epoch": 7,
-        "train_loss": 0.49209926100004286,
-        "train_acc": 0.7797619047619048,
         "lr_head": 3.815871256335142e-05,
-        "val_loss": 0.5444834152857463,
-        "val_accuracy": 0.7166666666666667,
-        "val_macro_f1": 0.7159565580618212,
-        "val_weighted_f1": 0.7159565580618211
       }
     ],
     "stage_b": [
       {
         "epoch": 1,
-        "train_loss": 0.5235937989893413,
-        "train_acc": 0.75,
         "lr_head": 1.0000000000000002e-06,
         "lr_backbone": 1.0000000000000001e-07,
-        "val_loss": 0.5491747617721557,
-        "val_accuracy": 0.7166666666666667,
-        "val_macro_f1": 0.7165879410947485,
-        "val_weighted_f1": 0.7165879410947485
       },
       {
         "epoch": 2,
-        "train_loss": 0.5453660388787588,
-        "train_acc": 0.7529761904761905,
         "lr_head": 0.0001,
         "lr_backbone": 1e-05,
-        "val_loss": 0.5492973128954569,
-        "val_accuracy": 0.7333333333333333,
-        "val_macro_f1": 0.7306397306397306,
-        "val_weighted_f1": 0.7306397306397305
       },
       {
         "epoch": 3,
-        "train_loss": 0.49581416731788996,
-        "train_acc": 0.7916666666666666,
         "lr_head": 9.701478472890248e-05,
         "lr_backbone": 9.701478472890248e-06,
-        "val_loss": 0.538078244527181,
-        "val_accuracy": 0.7166666666666667,
-        "val_macro_f1": 0.7165879410947485,
-        "val_weighted_f1": 0.7165879410947485
       },
       {
         "epoch": 4,
-        "train_loss": 0.4958783601011549,
-        "train_acc": 0.7678571428571429,
         "lr_head": 8.84191999343894e-05,
         "lr_backbone": 8.841919993438941e-06,
-        "val_loss": 0.5364969690640767,
-        "val_accuracy": 0.7333333333333333,
-        "val_macro_f1": 0.7321428571428572,
-        "val_weighted_f1": 0.7321428571428572
       },
       {
         "epoch": 5,
-        "train_loss": 0.4718715477557409,
-        "train_acc": 0.7946428571428571,
         "lr_head": 7.525e-05,
         "lr_backbone": 7.525e-06,
-        "val_loss": 0.5267467339833577,
-        "val_accuracy": 0.7333333333333333,
-        "val_macro_f1": 0.7321428571428572,
-        "val_weighted_f1": 0.7321428571428572
       },
       {
         "epoch": 6,
-        "train_loss": 0.4493213253361838,
-        "train_acc": 0.8244047619047619,
         "lr_head": 5.909558479451306e-05,
         "lr_backbone": 5.909558479451306e-06,
-        "val_loss": 0.5186658461888631,
-        "val_accuracy": 0.7166666666666667,
-        "val_macro_f1": 0.7159565580618212,
-        "val_weighted_f1": 0.7159565580618211
       },
       {
         "epoch": 7,
-        "train_loss": 0.43445002465021043,
-        "train_acc": 0.8184523809523809,
         "lr_head": 4.190441520548695e-05,
         "lr_backbone": 4.190441520548696e-06,
-        "val_loss": 0.5154884020487468,
-        "val_accuracy": 0.7166666666666667,
-        "val_macro_f1": 0.7159565580618212,
-        "val_weighted_f1": 0.7159565580618211
       },
       {
         "epoch": 8,
-        "train_loss": 0.42955496197655085,
-        "train_acc": 0.8273809523809523,
         "lr_head": 2.5750000000000013e-05,
         "lr_backbone": 2.575000000000001e-06,
-        "val_loss": 0.5194342851638794,
-        "val_accuracy": 0.7666666666666667,
-        "val_macro_f1": 0.7643097643097643,
-        "val_weighted_f1": 0.7643097643097643
       },
       {
         "epoch": 9,
-        "train_loss": 0.4368310116586231,
-        "train_acc": 0.8154761904761905,
         "lr_head": 1.2580800065610596e-05,
         "lr_backbone": 1.2580800065610596e-06,
-        "val_loss": 0.5142494519551595,
-        "val_accuracy": 0.7333333333333333,
-        "val_macro_f1": 0.7321428571428572,
-        "val_weighted_f1": 0.7321428571428572
-      },
-      {
-        "epoch": 10,
-        "train_loss": 0.4370355563504355,
-        "train_acc": 0.8125,
-        "lr_head": 3.985215271097539e-06,
-        "lr_backbone": 3.985215271097539e-07,
-        "val_loss": 0.5129753907521566,
-        "val_accuracy": 0.7333333333333333,
-        "val_macro_f1": 0.7321428571428572,
-        "val_weighted_f1": 0.7321428571428572
       }
     ],
     "stage_c": [
       {
         "epoch": 1,
-        "train_loss": 0.4291627889587766,
-        "train_acc": 0.8273809523809523,
         "lr_head": 5.000000000000001e-07,
         "lr_backbone": 1.5000000000000002e-07,
-        "val_loss": 0.5183799107869466,
-        "val_accuracy": 0.7666666666666667,
-        "val_macro_f1": 0.7643097643097643,
-        "val_weighted_f1": 0.7643097643097643
       },
       {
         "epoch": 2,
-        "train_loss": 0.42413380600157236,
-        "train_acc": 0.8154761904761905,
         "lr_head": 5e-05,
         "lr_backbone": 1.5e-05,
-        "val_loss": 0.5204356749852498,
-        "val_accuracy": 0.7166666666666667,
-        "val_macro_f1": 0.7101449275362319,
-        "val_weighted_f1": 0.7101449275362319
       },
       {
         "epoch": 3,
-        "train_loss": 0.37433484338578726,
-        "train_acc": 0.875,
         "lr_head": 4.899745109695881e-05,
         "lr_backbone": 1.4699235329087644e-05,
-        "val_loss": 0.48167786995569867,
-        "val_accuracy": 0.7666666666666667,
-        "val_macro_f1": 0.7643097643097643,
-        "val_weighted_f1": 0.7643097643097643
       },
       {
         "epoch": 4,
-        "train_loss": 0.335602682970819,
-        "train_acc": 0.8839285714285714,
         "lr_head": 4.6071024937571735e-05,
         "lr_backbone": 1.3821307481271522e-05,
-        "val_loss": 0.45847638448079425,
-        "val_accuracy": 0.8166666666666667,
-        "val_macro_f1": 0.8153846153846154,
-        "val_weighted_f1": 0.8153846153846154
       },
       {
         "epoch": 5,
-        "train_loss": 0.2807346156665257,
-        "train_acc": 0.9255952380952381,
         "lr_head": 4.145780316514581e-05,
         "lr_backbone": 1.2437340949543742e-05,
-        "val_loss": 0.4557582457860311,
-        "val_accuracy": 0.8,
-        "val_macro_f1": 0.7991071428571428,
-        "val_weighted_f1": 0.7991071428571428
       },
       {
         "epoch": 6,
-        "train_loss": 0.2691161029395603,
-        "train_acc": 0.9375,
         "lr_head": 3.5531521571796694e-05,
         "lr_backbone": 1.0659456471539008e-05,
-        "val_loss": 0.44928998152414956,
-        "val_accuracy": 0.8333333333333334,
-        "val_macro_f1": 0.8331479421579533,
-        "val_weighted_f1": 0.8331479421579533
       },
       {
         "epoch": 7,
-        "train_loss": 0.23485895210788363,
-        "train_acc": 0.9375,
         "lr_head": 2.877229224726381e-05,
         "lr_backbone": 8.631687674179142e-06,
-        "val_loss": 0.45204214652379354,
-        "val_accuracy": 0.85,
-        "val_macro_f1": 0.849624060150376,
-        "val_weighted_f1": 0.849624060150376
-      },
-      {
-        "epoch": 8,
-        "train_loss": 0.22606890329292842,
-        "train_acc": 0.9553571428571429,
-        "lr_head": 2.1727707752736196e-05,
-        "lr_backbone": 6.518312325820858e-06,
-        "val_loss": 0.4554001530011495,
-        "val_accuracy": 0.7833333333333333,
-        "val_macro_f1": 0.783273131425396,
-        "val_weighted_f1": 0.783273131425396
-      },
-      {
-        "epoch": 9,
-        "train_loss": 0.19964813192685446,
-        "train_acc": 0.9672619047619048,
-        "lr_head": 1.4968478428203314e-05,
-        "lr_backbone": 4.490543528460994e-06,
-        "val_loss": 0.45547234614690146,
-        "val_accuracy": 0.8333333333333334,
-        "val_macro_f1": 0.8325892857142857,
-        "val_weighted_f1": 0.8325892857142857
-      },
-      {
-        "epoch": 10,
-        "train_loss": 0.21034001807371774,
-        "train_acc": 0.9583333333333334,
-        "lr_head": 9.042196834854196e-06,
-        "lr_backbone": 2.712659050456259e-06,
-        "val_loss": 0.45674578348795575,
-        "val_accuracy": 0.8333333333333334,
-        "val_macro_f1": 0.8325892857142857,
-        "val_weighted_f1": 0.8325892857142857
-      },
-      {
-        "epoch": 11,
-        "train_loss": 0.1949910166717711,
-        "train_acc": 0.9702380952380952,
-        "lr_head": 4.428975062428262e-06,
-        "lr_backbone": 1.3286925187284787e-06,
-        "val_loss": 0.4595174193382263,
-        "val_accuracy": 0.8166666666666667,
-        "val_macro_f1": 0.8153846153846154,
-        "val_weighted_f1": 0.8153846153846154
-      },
-      {
-        "epoch": 12,
-        "train_loss": 0.1842061841771716,
-        "train_acc": 0.9761904761904762,
-        "lr_head": 1.502548903041193e-06,
-        "lr_backbone": 4.5076467091235787e-07,
-        "val_loss": 0.4608180999755859,
-        "val_accuracy": 0.8166666666666667,
-        "val_macro_f1": 0.8153846153846154,
-        "val_weighted_f1": 0.8153846153846154
       }
     ]
   },
   "confusion_matrix": [
     [
-      50,
-      10
     ],
     [
-      13,
-      47
     ]
   ],
-  "report": "              precision    recall  f1-score   support\n\n      Gyuyig       0.79      0.83      0.81        60\n     Tsugdri       0.82      0.78      0.80        60\n\n    accuracy                           0.81       120\n   macro avg       0.81      0.81      0.81       120\nweighted avg       0.81      0.81      0.81       120\n",
   "idx_to_label": {
     "0": "Gyuyig",
     "1": "Tsugdri"

 {
+  "experiment": "dinov3_gyuyig_tsugdri_binary",
   "run_subdir": null,
   "task": "gyuyig_tsugdri_binary_classification",
   "balanced_parquet_dir": null,
   "benchmark_dataset_repo": null,
   "benchmark_per_parent": 60,
   "preprocess": {
+    "train": "center_crop",
+    "val": "center_crop",
+    "test": "center_crop",
+    "size": 224
   },
   "pooling": "cls_token",
   "training_config": {
     "warmstart_checkpoint": null,
     "warmstart_checkpoint_file": "final_model.pt",
     "checkpoint_test_metrics": {
+      "loss": 0.42663901050885517,
+      "accuracy": 0.9208333333333333,
+      "macro_f1": 0.9208489161207983,
+      "weighted_f1": 0.9208489161207983
     },
     "warmstart_pooling": "cls_token"
   },
   },
   "best_checkpoint": {
     "path": "best_stage_c_last_blocks.pt",
+    "epoch": 1,
+    "val_macro_f1": 0.9164578111946533
   },
   "val_metrics": {
+    "loss": 0.3914561231931051,
+    "accuracy": 0.9166666666666666,
+    "macro_f1": 0.9164578111946533,
+    "weighted_f1": 0.9164578111946533,
+    "auc_roc": 0.9311111111111111
   },
   "val_confusion_matrix": [
     [
+      29,
+      1
     ],
     [
+      4,
+      26
     ]
   ],
+  "val_report": "              precision    recall  f1-score   support\n\n      Gyuyig       0.88      0.97      0.92        30\n     Tsugdri       0.96      0.87      0.91        30\n\n    accuracy                           0.92        60\n   macro avg       0.92      0.92      0.92        60\nweighted avg       0.92      0.92      0.92        60\n",
   "test_metrics": {
+    "loss": 0.40474860469500223,
+    "accuracy": 0.85,
+    "macro_f1": 0.847930160518164,
+    "weighted_f1": 0.847930160518164,
+    "auc_roc": 0.9297222222222223
   },
   "test_confusion_matrix": [
     [
+      58,
+      2
     ],
     [
+      16,
+      44
     ]
   ],
+  "test_report": "              precision    recall  f1-score   support\n\n      Gyuyig       0.78      0.97      0.87        60\n     Tsugdri       0.96      0.73      0.83        60\n\n    accuracy                           0.85       120\n   macro avg       0.87      0.85      0.85       120\nweighted avg       0.87      0.85      0.85       120\n",
   "history": {
     "stage_a": [
       {
         "epoch": 1,
+        "train_loss": 0.8516533403169542,
+        "train_acc": 0.4017857142857143,
         "lr_head": 5e-06,
+        "val_loss": 0.8099705815315247,
+        "val_accuracy": 0.36666666666666664,
+        "val_macro_f1": 0.36666666666666664,
+        "val_weighted_f1": 0.36666666666666664
       },
       {
         "epoch": 2,
+        "train_loss": 0.6583722290538606,
+        "train_acc": 0.6309523809523809,
         "lr_head": 0.0005,
+        "val_loss": 0.6123360713322957,
+        "val_accuracy": 0.65,
+        "val_macro_f1": 0.6378269617706237,
+        "val_weighted_f1": 0.6378269617706238
       },
       {
         "epoch": 3,
+        "train_loss": 0.5344764121941158,
+        "train_acc": 0.7291666666666666,
         "lr_head": 0.0004668412874366486,
+        "val_loss": 0.5156712194283803,
+        "val_accuracy": 0.7833333333333333,
+        "val_macro_f1": 0.7827903091060986,
+        "val_weighted_f1": 0.7827903091060985
       },
       {
         "epoch": 4,
+        "train_loss": 0.4900844920249212,
+        "train_acc": 0.7529761904761905,
         "lr_head": 0.00037624999999999996,
+        "val_loss": 0.45860581994056704,
+        "val_accuracy": 0.7666666666666667,
+        "val_macro_f1": 0.7624434389140271,
+        "val_weighted_f1": 0.7624434389140272
       },
       {
         "epoch": 5,
+        "train_loss": 0.4637424250443776,
+        "train_acc": 0.7857142857142857,
         "lr_head": 0.0002525,
+        "val_loss": 0.43475709557533265,
+        "val_accuracy": 0.7666666666666667,
+        "val_macro_f1": 0.7624434389140271,
+        "val_weighted_f1": 0.7624434389140272
       },
       {
         "epoch": 6,
+        "train_loss": 0.4428629179795583,
+        "train_acc": 0.7827380952380952,
         "lr_head": 0.00012875000000000007,
+        "val_loss": 0.4212049206097921,
+        "val_accuracy": 0.85,
+        "val_macro_f1": 0.8499583217560434,
+        "val_weighted_f1": 0.8499583217560432
       },
       {
         "epoch": 7,
+        "train_loss": 0.4315942114307767,
+        "train_acc": 0.8095238095238095,
         "lr_head": 3.815871256335142e-05,
+        "val_loss": 0.4180481950441996,
+        "val_accuracy": 0.85,
+        "val_macro_f1": 0.8499583217560434,
+        "val_weighted_f1": 0.8499583217560432
       }
     ],
     "stage_b": [
       {
         "epoch": 1,
+        "train_loss": 0.42322553339458646,
+        "train_acc": 0.8125,
         "lr_head": 1.0000000000000002e-06,
         "lr_backbone": 1.0000000000000001e-07,
+        "val_loss": 0.42059502998987836,
+        "val_accuracy": 0.8666666666666667,
+        "val_macro_f1": 0.8666666666666667,
+        "val_weighted_f1": 0.8666666666666667
       },
       {
         "epoch": 2,
+        "train_loss": 0.43337753273191904,
+        "train_acc": 0.8095238095238095,
         "lr_head": 0.0001,
         "lr_backbone": 1e-05,
+        "val_loss": 0.4085062007109324,
+        "val_accuracy": 0.8666666666666667,
+        "val_macro_f1": 0.8666666666666667,
+        "val_weighted_f1": 0.8666666666666667
       },
       {
         "epoch": 3,
+        "train_loss": 0.4347181845278967,
+        "train_acc": 0.7886904761904762,
         "lr_head": 9.701478472890248e-05,
         "lr_backbone": 9.701478472890248e-06,
+        "val_loss": 0.3922509431838989,
+        "val_accuracy": 0.9166666666666666,
+        "val_macro_f1": 0.9164578111946533,
+        "val_weighted_f1": 0.9164578111946533
       },
       {
         "epoch": 4,
+        "train_loss": 0.4287990019434974,
+        "train_acc": 0.7708333333333334,
         "lr_head": 8.84191999343894e-05,
         "lr_backbone": 8.841919993438941e-06,
+        "val_loss": 0.3846385677655538,
+        "val_accuracy": 0.85,
+        "val_macro_f1": 0.849624060150376,
+        "val_weighted_f1": 0.849624060150376
       },
       {
         "epoch": 5,
+        "train_loss": 0.40112980774470736,
+        "train_acc": 0.8214285714285714,
         "lr_head": 7.525e-05,
         "lr_backbone": 7.525e-06,
+        "val_loss": 0.3696295181910197,
+        "val_accuracy": 0.9,
+        "val_macro_f1": 0.899888765294772,
+        "val_weighted_f1": 0.899888765294772
       },
       {
         "epoch": 6,
+        "train_loss": 0.3798623964900062,
+        "train_acc": 0.8422619047619048,
         "lr_head": 5.909558479451306e-05,
         "lr_backbone": 5.909558479451306e-06,
+        "val_loss": 0.365932967265447,
+        "val_accuracy": 0.9,
+        "val_macro_f1": 0.899888765294772,
+        "val_weighted_f1": 0.899888765294772
       },
       {
         "epoch": 7,
+        "train_loss": 0.3871297893070039,
+        "train_acc": 0.8214285714285714,
         "lr_head": 4.190441520548695e-05,
         "lr_backbone": 4.190441520548696e-06,
+        "val_loss": 0.3574748694896698,
+        "val_accuracy": 0.8833333333333333,
+        "val_macro_f1": 0.883300916921367,
+        "val_weighted_f1": 0.883300916921367
       },
       {
         "epoch": 8,
+        "train_loss": 0.39022268142019,
+        "train_acc": 0.8005952380952381,
         "lr_head": 2.5750000000000013e-05,
         "lr_backbone": 2.575000000000001e-06,
+        "val_loss": 0.3670339067776998,
+        "val_accuracy": 0.85,
+        "val_macro_f1": 0.849624060150376,
+        "val_weighted_f1": 0.849624060150376
       },
       {
         "epoch": 9,
+        "train_loss": 0.3902270041760944,
+        "train_acc": 0.7976190476190477,
         "lr_head": 1.2580800065610596e-05,
         "lr_backbone": 1.2580800065610596e-06,
+        "val_loss": 0.3644895474116007,
+        "val_accuracy": 0.8666666666666667,
+        "val_macro_f1": 0.8665183537263625,
+        "val_weighted_f1": 0.8665183537263625
       }
     ],
     "stage_c": [
       {
         "epoch": 1,
+        "train_loss": 0.4103491987500872,
+        "train_acc": 0.8125,
         "lr_head": 5.000000000000001e-07,
         "lr_backbone": 1.5000000000000002e-07,
+        "val_loss": 0.3914561231931051,
+        "val_accuracy": 0.9166666666666666,
+        "val_macro_f1": 0.9164578111946533,
+        "val_weighted_f1": 0.9164578111946533
       },
       {
         "epoch": 2,
+        "train_loss": 0.4436623099304381,
+        "train_acc": 0.7678571428571429,
         "lr_head": 5e-05,
         "lr_backbone": 1.5e-05,
+        "val_loss": 0.3777097463607788,
+        "val_accuracy": 0.9166666666666666,
+        "val_macro_f1": 0.9164578111946533,
+        "val_weighted_f1": 0.9164578111946533
       },
       {
         "epoch": 3,
+        "train_loss": 0.3808557249250866,
+        "train_acc": 0.8363095238095238,
         "lr_head": 4.899745109695881e-05,
         "lr_backbone": 1.4699235329087644e-05,
+        "val_loss": 0.3577085534731547,
+        "val_accuracy": 0.8666666666666667,
+        "val_macro_f1": 0.8665183537263625,
+        "val_weighted_f1": 0.8665183537263625
       },
       {
         "epoch": 4,
+        "train_loss": 0.3782187302907308,
+        "train_acc": 0.8392857142857143,
         "lr_head": 4.6071024937571735e-05,
         "lr_backbone": 1.3821307481271522e-05,
+        "val_loss": 0.3452535013357798,
+        "val_accuracy": 0.8833333333333333,
+        "val_macro_f1": 0.883300916921367,
+        "val_weighted_f1": 0.883300916921367
       },
       {
         "epoch": 5,
+        "train_loss": 0.38378763056936716,
+        "train_acc": 0.8392857142857143,
         "lr_head": 4.145780316514581e-05,
         "lr_backbone": 1.2437340949543742e-05,
+        "val_loss": 0.33214412728945414,
+        "val_accuracy": 0.8833333333333333,
+        "val_macro_f1": 0.883300916921367,
+        "val_weighted_f1": 0.883300916921367
       },
       {
         "epoch": 6,
+        "train_loss": 0.3539558429093588,
+        "train_acc": 0.8571428571428571,
         "lr_head": 3.5531521571796694e-05,
         "lr_backbone": 1.0659456471539008e-05,
+        "val_loss": 0.3277231236298879,
+        "val_accuracy": 0.8833333333333333,
+        "val_macro_f1": 0.883300916921367,
+        "val_weighted_f1": 0.883300916921367
       },
       {
         "epoch": 7,
+        "train_loss": 0.35197025750364574,
+        "train_acc": 0.8511904761904762,
         "lr_head": 2.877229224726381e-05,
         "lr_backbone": 8.631687674179142e-06,
+        "val_loss": 0.3296816150347392,
+        "val_accuracy": 0.8666666666666667,
+        "val_macro_f1": 0.8665183537263625,
+        "val_weighted_f1": 0.8665183537263625
       }
     ]
   },
   "confusion_matrix": [
     [
+      58,
+      2
     ],
     [
+      16,
+      44
     ]
   ],
+  "report": "              precision    recall  f1-score   support\n\n      Gyuyig       0.78      0.97      0.87        60\n     Tsugdri       0.96      0.73      0.83        60\n\n    accuracy                           0.85       120\n   macro avg       0.87      0.85      0.85       120\nweighted avg       0.87      0.85      0.85       120\n",
   "idx_to_label": {
     "0": "Gyuyig",
     "1": "Tsugdri"

training_history.png CHANGED Viewed