An AI-Powered Speech Processing Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Enhancement, Separation, and Target Speaker Extraction, etc.

Python 2,896 229 Updated May 23, 2025

QwenLM / Qwen

The official repo of Qwen (通义千问) chat & pretrained large language model proposed by Alibaba Cloud.

Python 18,454 1,511 Updated Apr 29, 2025

hiyouga / LLaMA-Factory

Unified Efficient Fine-Tuning of 100+ LLMs & VLMs (ACL 2024)

Python 51,785 6,259 Updated Jun 7, 2025

kyutai-labs / moshi

Moshi is a speech-text foundation model and full-duplex spoken dialogue framework. It uses Mimi, a state-of-the-art streaming neural audio codec.

Python 8,394 708 Updated Jun 5, 2025

FunAudioLLM / FunAudioLLM-APP

Python 359 69 Updated Jul 22, 2024

FunAudioLLM / SenseVoice

Multilingual Voice Understanding Model

Python 5,838 512 Updated Mar 23, 2025

FunAudioLLM / CosyVoice

Multi-lingual large voice generation model, providing inference, training and deployment full-stack ability.

Python 14,379 1,504 Updated Jun 2, 2025

X-LANCE / SLAM-LLM

Speech, Language, Audio, Music Processing with Large Language Model

Python 823 80 Updated Apr 24, 2025

AudioKit / AudioKit

Audio synthesis, processing, & analysis platform for iOS, macOS and tvOS

Swift 11,010 1,580 Updated May 13, 2025

alibaba / INSPIRE

INSPIRE: Instruction-based Multi-Task Speech and Audio Processing Benchmark

3 Updated May 14, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

iris2c iris2c

Achievements

Achievements

Block or report iris2c

Stars

ximinng / LLM4SVG

ASLP-lab / SongEval

ace-step / ACE-Step

QwenLM / Qwen3

volcengine / verl

unslothai / unsloth

hiyouga / EasyR1

Liu-Tianchi / Nes2Net

mmmmayi / ExPO

BradyFU / Awesome-Multimodal-Large-Language-Models

ZeyueT / AudioX

Jiang-Yidi / UniCodec

stepfun-ai / Step-Audio

hpcaitech / Open-Sora

NUS-HPC-AI-Lab / VideoSys

deepseek-ai / DeepSeek-V3

tensorzero / tensorzero

FunAudioLLM / InspireMusic

lllyasviel / IC-Light

bacoo / zmake

modelscope / ClearerVoice-Studio