Kitten TTS

New: Kitten TTS v0.8 is out -- 15M, 40M, and 80M parameter models now available.

Kitten TTS is an open-source, lightweight text-to-speech library built on ONNX. With models ranging from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU.

Status: Developer preview -- APIs may change between releases.

Commercial support is available. For integration assistance, custom voices, or enterprise licensing, contact us.

Features
Available Models
Demo
Quick Start
API Reference
System Requirements
Roadmap
Commercial Support
Community and Support
License

Features

Ultra-lightweight -- Model sizes from 25 MB (int8) to 80 MB, suitable for edge deployment

kitten

MoltPulse

Kitten TTS

Table of Contents

Features

Available Models

Demo

Try it online

Quick Start

Prerequisites

Installation

Basic Usage

Advanced Usage

Using with GPU

API Reference

`KittenTTS(model_name, cache_dir=None)`

`model.generate(text, voice, speed, clean_text)`

`model.generate_to_file(text, output_path, voice, speed, sample_rate, clean_text)`

`normalize_text(text, locale="en-US", return_spans=False)`

`model.available_voices`

System Requirements

Roadmap

Commercial Support

Community and Support

License

Ecosystem Role

Embed Badge