parakeet-ctc-0.6b-coreml

CoreML conversion of nvidia/parakeet-ctc-0.6b.


Architecture	CTC
Language	English
Sample rate	16000 Hz
Max audio	15.0s
Vocab size	1024
Framework	NVIDIA NeMo → CoreML (coremltools)

Components

File	Component	Best compute
`parakeet_mel_encoder.mlpackage`	mel_encoder	ANE / GPU
`parakeet_ctc_decoder.mlpackage`	ctc_decoder	ANE / GPU

Usage

pip install ovos-stt-plugin-coreml

from ovos_stt_plugin_coreml import CoremlSTT
from ovos_plugin_manager.utils.audio import AudioFile

stt = CoremlSTT(config={"metadata": "metadata.json"})

with AudioFile("speech.wav") as f:
    audio = f.read()
print(stt.execute(audio))

Source model

nvidia/parakeet-ctc-0.6b

Downloads last month: 44

Model tree for OpenVoiceOS/parakeet-ctc-0.6b-coreml

Base model

nvidia/parakeet-ctc-0.6b

Quantized

(8)

this model

Collection including OpenVoiceOS/parakeet-ctc-0.6b-coreml

STT/ASR - CoreML

Collection

models optimized for apple silicon • 80 items • Updated 23 days ago • 2