Spaces:

Ronaldodev
/

test

Running

Ronaldo commited on Apr 20

Commit

faeb342

1 Parent(s): 2651de0

update

Files changed (1) hide show

app.py CHANGED Viewed

@@ -137,8 +137,20 @@ def synthesize_speech(text, language):
             outputs = model(**inputs)
             waveform = outputs.waveform.cpu().numpy().flatten()
-        # Convertit en (sample_rate, audio_array) pour Gradio
-        return (22050, waveform), f"✅ Audio généré avec succès!"
     except Exception as e:
         logger.error(f"Erreur TTS: {e}")

             outputs = model(**inputs)
             waveform = outputs.waveform.cpu().numpy().flatten()
+        # Récupère le taux d'échantillonnage réel du modèle
+        sample_rate = model.config.sampling_rate
+        # Normalise l'amplitude pour une meilleure qualité audio
+        max_val = np.abs(waveform).max()
+        if max_val > 0:
+            # Normalise entre -0.95 et 0.95 pour éviter la saturation
+            waveform = (waveform / max_val) * 0.95
+        # Convertit en int16 pour une meilleure qualité
+        waveform_int16 = (waveform * 32767).astype(np.int16)
+        # Retourne au format (sample_rate, audio_array) pour Gradio
+        return (sample_rate, waveform_int16), f"✅ Audio généré ({len(waveform_int16)} samples @ {sample_rate}Hz)!"
     except Exception as e:
         logger.error(f"Erreur TTS: {e}")