Upload 6 files

Files changed (5) hide show

chat_template.jinja ADDED Viewed


1	+ {% for message in messages %}{% if message['role'] == 'user' %}USER: {{ message['content'] }}
2	+ ASSISTANT:{% elif message['role'] == 'assistant' %}{{ message['content'] }}{% endif %}{% endfor %}

preprocessor_config.json ADDED Viewed

+{
+  "feature_extractor_type": "GraniteSpeechFeatureExtractor",
+  "melspec_kwargs": {
+    "hop_length": 160,
+    "n_fft": 512,
+    "n_mels": 80,
+    "sample_rate": 16000,
+    "win_length": 400
+  },
+  "processor_class": "GraniteSpeechProcessor",
+  "projector_downsample_rate": 5,
+  "projector_window_size": 15,
+  "sampling_rate": 16000
+}

processor_config.json ADDED Viewed

+{
+  "audio_processor": {
+    "feature_extractor_type": "GraniteSpeechFeatureExtractor",
+    "melspec_kwargs": {
+      "hop_length": 160,
+      "n_fft": 512,
+      "n_mels": 80,
+      "sample_rate": 16000,
+      "win_length": 400
+    },
+    "projector_downsample_rate": 5,
+    "projector_window_size": 15,
+    "sampling_rate": 16000
+  },
+  "audio_token": "<|audio|>",
+  "processor_class": "GraniteSpeechProcessor"
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

+{
+  "add_prefix_space": false,
+  "backend": "tokenizers",
+  "bos_token": "<|end_of_text|>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "<|end_of_text|>",
+  "errors": "replace",
+  "is_local": false,
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "<|pad|>",
+  "padding_side": "left",
+  "processor_class": "GraniteSpeechProcessor",
+  "tokenizer_class": "GPT2Tokenizer",
+  "unk_token": "<|unk|>",
+  "chat_template": "{% for message in messages %}{% if message['role'] == 'user' %}USER: {{ message['content'] }}\n ASSISTANT:{% elif message['role'] == 'assistant' %}{{ message['content'] }}{% endif %}{% endfor %}"
+}