zerank-2 — MLX (4bit)

zeroentropy/zerank-2 (Qwen3-4B base) の MLX 変換 + affine 4bit 量子化 (group_size=64)。2.1 GB。

ライセンス: CC-BY-NC-4.0 (非商用)。原典と同条件を継承し再配布も同条件。商用利用は contact@zeroentropy.dev へ。MLX フォーマット変換のみで、学習・データの帰属は ZeroEntropy にあります。

  • 変換: mlx_lm convert --hf-path zeroentropy/zerank-2 --mlx-path . --quantize --q-mode affine --q-bits 4 --q-group-size 64
  • 評価: mteb/scidocs-reranking 30 クエリ / 897 ペア
  • 結果: Kendall τ = 0.9043, nDCG@10 Δ = −0.0037 → PASS (size 優先用途、品質は affine8 推奨)
Downloads last month
50
Safetensors
Model size
0.6B params
Tensor type
BF16
·
U32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for soichisumi/zerank-2-mlx-4bit

Finetuned
Qwen/Qwen3-4B
Quantized
(6)
this model