Upload folder using huggingface_hub

Files changed (6) hide show

pretrain_imgnet_B_1024d16l.json ADDED Viewed

+{
+  "decoder_config": {
+    "image_dim": 4,
+    "patch_size": 2,
+    "decoder_style": "dit",
+    "num_layers": 16,
+    "hidden_size": 1024,
+    "intermediate_size": 4096,
+    "num_heads": 16,
+    "decode_mode": "diffusion"
+  },
+  "encoder_hidden_size": 768,
+  "latent_h": 32,
+  "latent_w": 32,
+  "latent_mean": [
+    -0.69,
+    -0.48,
+    -0.6,
+    0.28
+  ],
+  "latent_std": [
+    12.38,
+    11.22,
+    7.93,
+    21.22
+  ],
+  "pretrain_mode": "imagenet",
+  "source_ckpt": "ttvidt-dit-pretrain/tpigie65/checkpoints/epoch=19-step=100000.ckpt"
+}

pretrain_imgnet_B_1024d16l.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:71d51a561eafa5aeaf7f51a45594a09399c0ce5efadfdb1a79668235a736bc98
+size 1553397056

pretrain_imgnet_S_768d12l.json ADDED Viewed

+{
+  "decoder_config": {
+    "image_dim": 4,
+    "patch_size": 2,
+    "decoder_style": "dit",
+    "num_layers": 12,
+    "hidden_size": 768,
+    "intermediate_size": 3072,
+    "num_heads": 12,
+    "decode_mode": "diffusion"
+  },
+  "encoder_hidden_size": 768,
+  "latent_h": 32,
+  "latent_w": 32,
+  "latent_mean": [
+    -0.69,
+    -0.48,
+    -0.6,
+    0.28
+  ],
+  "latent_std": [
+    12.38,
+    11.22,
+    7.93,
+    21.22
+  ],
+  "pretrain_mode": "imagenet",
+  "source_ckpt": "ttvidt-dit-pretrain/hpdabz9q/checkpoints/epoch=19-step=100000.ckpt"
+}

pretrain_imgnet_S_768d12l.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:5160b2f96b77671691199f288cba00372d908c48b09e70fe14e8f2f76cbe3b5d
+size 656766368

pretrain_video_S_768d12l.json ADDED Viewed

+{
+  "decoder_config": {
+    "image_dim": 4,
+    "patch_size": 2,
+    "decoder_style": "dit",
+    "num_layers": 12,
+    "hidden_size": 768,
+    "intermediate_size": 3072,
+    "num_heads": 12,
+    "decode_mode": "diffusion"
+  },
+  "encoder_hidden_size": 768,
+  "latent_h": 32,
+  "latent_w": 32,
+  "latent_mean": [
+    -0.69,
+    -0.48,
+    -0.6,
+    0.28
+  ],
+  "latent_std": [
+    12.38,
+    11.22,
+    7.93,
+    21.22
+  ],
+  "pretrain_mode": "video",
+  "source_ckpt": "ttvidt-dit-pretrain/2u6ev4md/checkpoints/epoch=14-step=100000.ckpt"
+}

pretrain_video_S_768d12l.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:cea31019a66e765a279125bf365838b83397fa2bd445846e2dd2b0a263205a29
+size 656766368