narySt commited on 4 days ago

Commit

e82406d

verified ·

1 Parent(s): 31c709f

Upload folder using huggingface_hub

Browse files

Files changed (35) hide show

.gitattributes +1 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/eval_config.yaml +31 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_latest.txt +17 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_108000.txt +17 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_118647.txt +17 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_12000.txt +17 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_24000.txt +17 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_36000.txt +17 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_39549.txt +17 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_48000.txt +17 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_60000.txt +17 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_72000.txt +17 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_79098.txt +17 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_84000.txt +17 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_96000.txt +17 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_initial_checkpoint.txt +17 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_model_best.txt +17 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_model_final.txt +17 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/predictions_checkpoint_latest.txt +0 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/predictions_checkpoint_step_108000.txt +0 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/predictions_checkpoint_step_118647.txt +0 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/predictions_checkpoint_step_12000.txt +0 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/predictions_checkpoint_step_24000.txt +0 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/predictions_checkpoint_step_36000.txt +0 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/predictions_checkpoint_step_39549.txt +0 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/predictions_checkpoint_step_48000.txt +0 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/predictions_checkpoint_step_60000.txt +0 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/predictions_checkpoint_step_72000.txt +0 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/predictions_checkpoint_step_79098.txt +0 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/predictions_checkpoint_step_84000.txt +0 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/predictions_checkpoint_step_96000.txt +0 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/predictions_initial_checkpoint.txt +3 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/predictions_model_best.txt +0 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/predictions_model_final.txt +0 -0
pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/summary.txt +13 -0

.gitattributes CHANGED Viewed

@@ -56,3 +56,4 @@ routing_rerun/N_4.0/wandb/run-20260524_000855-j30yot8x/run-j30yot8x.wandb filter
 routing_rerun/N_6.0/wandb/run-20260524_055222-tjovd8fs/run-tjovd8fs.wandb filter=lfs diff=lfs merge=lfs -text
 hnet_train_rerun/21-40-57/wandb/run-20260524_214058-3nxcy117/run-3nxcy117.wandb filter=lfs diff=lfs merge=lfs -text
 hnet_train_rerun/21-40-57/eval_results/predictions_initial_checkpoint.txt filter=lfs diff=lfs merge=lfs -text

 routing_rerun/N_6.0/wandb/run-20260524_055222-tjovd8fs/run-tjovd8fs.wandb filter=lfs diff=lfs merge=lfs -text
 hnet_train_rerun/21-40-57/wandb/run-20260524_214058-3nxcy117/run-3nxcy117.wandb filter=lfs diff=lfs merge=lfs -text
 hnet_train_rerun/21-40-57/eval_results/predictions_initial_checkpoint.txt filter=lfs diff=lfs merge=lfs -text
+pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/predictions_initial_checkpoint.txt filter=lfs diff=lfs merge=lfs -text

pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/eval_config.yaml ADDED Viewed

	@@ -0,0 +1,31 @@

+data:
+  path: /home/nikita/byte-llms-code//code_completion_exp/datasets/data_V4_full
+  max_context_len: 4096
+  max_target_len: 256
+  num_workers: 4
+  pin_memory: true
+  max_train_samples: null
+  max_val_samples: 2000
+model:
+  name: EleutherAI/pythia-1b
+  checkpoint_path: null
+  from_scratch: false
+paths:
+  checkpoints_dir: pythia_1b_rerun/pythia_1b_lr_2e-5
+  initial_checkpoint: auto
+  output_dir: pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results
+evaluation:
+  batch_size: 16
+  max_samples: null
+  compute_perplexity: true
+  bleu_tokenize: none
+  save_predictions: true
+  use_amp: true
+generation:
+  max_new_tokens: 64
+  temperature: 0.1
+  top_k: 0
+  top_p: 1.0
+  do_sample: true
+seed: 42
+device: cuda

pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_latest.txt ADDED Viewed

	@@ -0,0 +1,17 @@

+Checkpoint: checkpoint_latest.pt
+================================================================================
+exact_match: 0.3438372556840846
+token_accuracy: 0.3374259046123755
+bleu: 18.6529732811467
+perplexity: 2.8983173394235715
+num_samples: 35098
+gen_wall_time_s: 512.0860295599955
+gen_samples_per_s: 68.53926483828818
+gen_time_per_sample_ms: 14.59017692062213
+gen_chars_per_s: 1614.3303122530262
+gen_batch_mean_ms: 661.5939678456297
+gen_batch_p50_ms: 546.2466874998881
+gen_batch_p95_ms: 1306.078345699869
+gen_batch_max_ms: 5513.967688999855
+gen_num_batches: 732

pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_108000.txt ADDED Viewed

	@@ -0,0 +1,17 @@

+Checkpoint: checkpoint_step_108000.pt
+================================================================================
+exact_match: 0.3397629494558094
+token_accuracy: 0.336378091050009
+bleu: 18.52179690907158
+perplexity: 2.9245576470171004
+num_samples: 35098
+gen_wall_time_s: 528.5562085430115
+gen_samples_per_s: 66.4035336880238
+gen_time_per_sample_ms: 15.059439527694213
+gen_chars_per_s: 1577.5843449053834
+gen_batch_mean_ms: 669.8050106461807
+gen_batch_p50_ms: 554.5250684999701
+gen_batch_p95_ms: 1274.1037359000072
+gen_batch_max_ms: 5511.492358999931
+gen_num_batches: 732

pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_118647.txt ADDED Viewed

	@@ -0,0 +1,17 @@

+Checkpoint: checkpoint_step_118647.pt
+================================================================================
+exact_match: 0.34443558037495015
+token_accuracy: 0.3370600014636126
+bleu: 18.72229382305833
+perplexity: 2.8983173394235715
+num_samples: 35098
+gen_wall_time_s: 517.0126714489952
+gen_samples_per_s: 67.88615045281828
+gen_time_per_sample_ms: 14.730545086585993
+gen_chars_per_s: 1599.6609864166364
+gen_batch_mean_ms: 663.5231613442652
+gen_batch_p50_ms: 551.6623404996608
+gen_batch_p95_ms: 1254.7493076996939
+gen_batch_max_ms: 5509.677142999863
+gen_num_batches: 732

pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_12000.txt ADDED Viewed

	@@ -0,0 +1,17 @@

+Checkpoint: checkpoint_step_12000.pt
+================================================================================
+exact_match: 0.31092939768647787
+token_accuracy: 0.3056821432610619
+bleu: 16.91287733900013
+perplexity: 3.0910473571744728
+num_samples: 35098
+gen_wall_time_s: 489.6108111139956
+gen_samples_per_s: 71.68550857801252
+gen_time_per_sample_ms: 13.949820819248835
+gen_chars_per_s: 1568.268066329982
+gen_batch_mean_ms: 640.881225442608
+gen_batch_p50_ms: 530.8562299996993
+gen_batch_p95_ms: 1323.3005196497725
+gen_batch_max_ms: 3567.599123999571
+gen_num_batches: 732

pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_24000.txt ADDED Viewed

	@@ -0,0 +1,17 @@

+Checkpoint: checkpoint_step_24000.pt
+================================================================================
+exact_match: 0.3176819191976751
+token_accuracy: 0.31616360527698867
+bleu: 16.999023276021926
+perplexity: 3.049432811892437
+num_samples: 35098
+gen_wall_time_s: 517.3736476249842
+gen_samples_per_s: 67.838785684424
+gen_time_per_sample_ms: 14.740829894153062
+gen_chars_per_s: 1535.665768148862
+gen_batch_mean_ms: 669.2715530560091
+gen_batch_p50_ms: 551.570622500094
+gen_batch_p95_ms: 1301.835535300187
+gen_batch_max_ms: 5511.411889999181
+gen_num_batches: 732

pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_36000.txt ADDED Viewed

	@@ -0,0 +1,17 @@

+Checkpoint: checkpoint_step_36000.pt
+================================================================================
+exact_match: 0.3228389081998974
+token_accuracy: 0.31837898252313507
+bleu: 17.449522226725577
+perplexity: 2.9921718581044807
+num_samples: 35098
+gen_wall_time_s: 517.3814206280158
+gen_samples_per_s: 67.83776649226563
+gen_time_per_sample_ms: 14.741051359850013
+gen_chars_per_s: 1562.0835379418666
+gen_batch_mean_ms: 686.4863323565612
+gen_batch_p50_ms: 547.4083809999684
+gen_batch_p95_ms: 1377.9240408999108
+gen_batch_max_ms: 5507.957126999827
+gen_num_batches: 732

pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_39549.txt ADDED Viewed

	@@ -0,0 +1,17 @@

+Checkpoint: checkpoint_step_39549.pt
+================================================================================
+exact_match: 0.32688472277622654
+token_accuracy: 0.32353489052843065
+bleu: 17.599796716522864
+perplexity: 2.9765649173167703
+num_samples: 35098
+gen_wall_time_s: 535.7109377580045
+gen_samples_per_s: 65.51667611433899
+gen_time_per_sample_ms: 15.26328958225553
+gen_chars_per_s: 1543.2072443020552
+gen_batch_mean_ms: 681.6499375327907
+gen_batch_p50_ms: 560.1317364998977
+gen_batch_p95_ms: 1265.995824399715
+gen_batch_max_ms: 5511.29786599995
+gen_num_batches: 732

pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_48000.txt ADDED Viewed

	@@ -0,0 +1,17 @@

+Checkpoint: checkpoint_step_48000.pt
+================================================================================
+exact_match: 0.3267992478203886
+token_accuracy: 0.32422345372655725
+bleu: 16.98040900700143
+perplexity: 3.000834224455479
+num_samples: 35098
+gen_wall_time_s: 552.924158363734
+gen_samples_per_s: 63.47706004357877
+gen_time_per_sample_ms: 15.75372267262334
+gen_chars_per_s: 1491.5879285156116
+gen_batch_mean_ms: 498.38210237196296
+gen_batch_p50_ms: 425.19649300083984
+gen_batch_p95_ms: 1108.712311401905
+gen_batch_max_ms: 3580.2823460035142
+gen_num_batches: 1097

pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_60000.txt ADDED Viewed

	@@ -0,0 +1,17 @@

+Checkpoint: checkpoint_step_60000.pt
+================================================================================
+exact_match: 0.33198472847455696
+token_accuracy: 0.31948999753846974
+bleu: 18.78148144552106
+perplexity: 2.993654101091439
+num_samples: 35098
+gen_wall_time_s: 521.2763403879362
+gen_samples_per_s: 67.33089012610837
+gen_time_per_sample_ms: 14.852024058007187
+gen_chars_per_s: 1513.8035987068602
+gen_batch_mean_ms: 461.5683323910272
+gen_batch_p50_ms: 406.8481369977235
+gen_batch_p95_ms: 841.7265435971791
+gen_batch_max_ms: 3245.230978995096
+gen_num_batches: 1097

pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_72000.txt ADDED Viewed

	@@ -0,0 +1,17 @@

+Checkpoint: checkpoint_step_72000.pt
+================================================================================
+exact_match: 0.3257165650464414
+token_accuracy: 0.32552407310079634
+bleu: 17.554073235328627
+perplexity: 2.9570823713233994
+num_samples: 35098
+gen_wall_time_s: 556.0231101891404
+gen_samples_per_s: 63.123275556048085
+gen_time_per_sample_ms: 15.842016929430178
+gen_chars_per_s: 1494.0727908187314
+gen_batch_mean_ms: 486.72739216855683
+gen_batch_p50_ms: 430.15693000052124
+gen_batch_p95_ms: 946.6991030014475
+gen_batch_max_ms: 3250.2466439982527
+gen_num_batches: 1097

pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_79098.txt ADDED Viewed

	@@ -0,0 +1,17 @@

+Checkpoint: checkpoint_step_79098.pt
+================================================================================
+exact_match: 0.32924952988774286
+token_accuracy: 0.32587001789599035
+bleu: 17.66041023077036
+perplexity: 2.9432653848024013
+num_samples: 35098
+gen_wall_time_s: 558.4788690531059
+gen_samples_per_s: 62.84570812770093
+gen_time_per_sample_ms: 15.91198555624554
+gen_chars_per_s: 1479.9951185286538
+gen_batch_mean_ms: 481.4050168861154
+gen_batch_p50_ms: 412.99323799466947
+gen_batch_p95_ms: 985.8789092031672
+gen_batch_max_ms: 3919.5375990020693
+gen_num_batches: 1097

pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_84000.txt ADDED Viewed

	@@ -0,0 +1,17 @@

+Checkpoint: checkpoint_step_84000.pt
+================================================================================
+exact_match: 0.3267992478203886
+token_accuracy: 0.32729704017616573
+bleu: 17.15454805989793
+perplexity: 3.039049060843566
+num_samples: 35098
+gen_wall_time_s: 554.8222870400496
+gen_samples_per_s: 63.25989568163557
+gen_time_per_sample_ms: 15.807803494217607
+gen_chars_per_s: 1502.05573832661
+gen_batch_mean_ms: 499.97872161993917
+gen_batch_p50_ms: 430.8593480018317
+gen_batch_p95_ms: 1011.4186708029592
+gen_batch_max_ms: 3927.7867519995198
+gen_num_batches: 1097

pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_checkpoint_step_96000.txt ADDED Viewed

	@@ -0,0 +1,17 @@

+Checkpoint: checkpoint_step_96000.pt
+================================================================================
+exact_match: 0.32765399737876805
+token_accuracy: 0.32871408327955665
+bleu: 17.456606748558585
+perplexity: 3.008593212810714
+num_samples: 35098
+gen_wall_time_s: 569.5983627550886
+gen_samples_per_s: 61.61885689108127
+gen_time_per_sample_ms: 16.228798300617942
+gen_chars_per_s: 1483.8876922183517
+gen_batch_mean_ms: 500.05995249138255
+gen_batch_p50_ms: 431.5248690036242
+gen_batch_p95_ms: 1040.302878398508
+gen_batch_max_ms: 3247.8538199939067
+gen_num_batches: 1097

pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_initial_checkpoint.txt ADDED Viewed

	@@ -0,0 +1,17 @@

+Checkpoint: initial_checkpoint
+================================================================================
+exact_match: 0.0
+token_accuracy: 0.270582052117914
+bleu: 0.9973597289127779
+perplexity: 11.896337297460965
+num_samples: 35098
+gen_wall_time_s: 1114.1351297710041
+gen_samples_per_s: 31.502462369366214
+gen_time_per_sample_ms: 31.74355033822452
+gen_chars_per_s: 6894.466204991493
+gen_batch_mean_ms: 1458.6486288237702
+gen_batch_p50_ms: 1228.9804150000236
+gen_batch_p95_ms: 2486.2865908000094
+gen_batch_max_ms: 5505.641633999858
+gen_num_batches: 732

pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_model_best.txt ADDED Viewed

	@@ -0,0 +1,17 @@

+Checkpoint: model_best.pt
+================================================================================
+exact_match: 0.33959199954413355
+token_accuracy: 0.33668079274580376
+bleu: 18.43932275787846
+perplexity: 2.9246050551995744
+num_samples: 35098
+gen_wall_time_s: 551.2998683829064
+gen_samples_per_s: 63.664081950447
+gen_time_per_sample_ms: 15.707443967830258
+gen_chars_per_s: 1512.6196246809336
+gen_batch_mean_ms: 486.2616247575008
+gen_batch_p50_ms: 426.6929829973378
+gen_batch_p95_ms: 928.941303402826
+gen_batch_max_ms: 3925.172384995676
+gen_num_batches: 1097

pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/metrics_model_final.txt ADDED Viewed

	@@ -0,0 +1,17 @@

+Checkpoint: model_final.pt
+================================================================================
+exact_match: 0.34412217220354435
+token_accuracy: 0.33789825231350584
+bleu: 18.793073765848895
+perplexity: 2.898342720850918
+num_samples: 35098
+gen_wall_time_s: 549.0805001499248
+gen_samples_per_s: 63.92141041325743
+gen_time_per_sample_ms: 15.64421050059618
+gen_chars_per_s: 1505.380358206686
+gen_batch_mean_ms: 483.941579053738
+gen_batch_p50_ms: 425.6622940010857
+gen_batch_p95_ms: 903.3644577983071
+gen_batch_max_ms: 4074.6655790062505
+gen_num_batches: 1097

pythia_1b_rerun/pythia_1b_lr_2e-5/eval_results_full_updated/predictions_checkpoint_latest.txt ADDED Viewed