Spaces:

lvvignesh2122
/

Adaptive-AI-System

Sleeping

App Files Files Community

Adaptive-AI-System / evaluation

Ctrl+K

Ctrl+K

2 contributors

History: 2 commits

lvvignesh2122's picture

refactor(eval): improve evaluation rigor traceability and reporting

b9e3cd9 8 days ago

CHANGELOG.md

6.82 kB
refactor(eval): improve evaluation rigor traceability and reporting 8 days ago
ablation.py

7.06 kB
refactor(eval): improve evaluation rigor traceability and reporting 8 days ago
ablation_results.csv

406 Bytes
feat: add evaluation platform foundation with benchmarking, robustness testing, reproducibility and experiment tracking 10 days ago
assumptions.md

8.74 kB
refactor(eval): improve evaluation rigor traceability and reporting 8 days ago
benchmark.py

9.19 kB
refactor(eval): improve evaluation rigor traceability and reporting 8 days ago
benchmark_results.csv

346 Bytes
feat: add evaluation platform foundation with benchmarking, robustness testing, reproducibility and experiment tracking 10 days ago
config.py

2.17 kB
refactor(eval): improve evaluation rigor traceability and reporting 8 days ago
evaluation_report.md

0 Bytes
feat: add evaluation platform foundation with benchmarking, robustness testing, reproducibility and experiment tracking 10 days ago
failure_analysis.md

4.81 kB
refactor(eval): improve evaluation rigor traceability and reporting 8 days ago
historical_results.json

999 Bytes
refactor(eval): improve evaluation rigor traceability and reporting 8 days ago
report.py

14.9 kB
refactor(eval): improve evaluation rigor traceability and reporting 8 days ago
reproducibility.md

4.3 kB
refactor(eval): improve evaluation rigor traceability and reporting 8 days ago
robustness.py

5.46 kB
refactor(eval): improve evaluation rigor traceability and reporting 8 days ago
robustness_results.csv

341 Bytes
feat: add evaluation platform foundation with benchmarking, robustness testing, reproducibility and experiment tracking 10 days ago