Kartoffel-TTS (Based on Chatterbox) - German Text-to-Speech Demo
Generate high-quality speech from text with reference audio styling.
Text to synthesize (max chars 300)
Tief im verwunschenen Wald, wo die Bäume uralte Geheimnisse flüsterten, lebte ein kleiner Gnom namens Fips, der die Sprache der Tiere verstand.
Reference Audio File (Optional)
0:00
0:00
High volume
1x
Exaggeration (Neutral = 0.5, extreme values can be unstable)
↺
0.25
2
CFG/Pace
↺
0.2
1
More options
▼
Random seed (0 for random)
Temperature
↺
0.05
5
Generate
Output Audio