Stars
LLM
10 repositories
Robust Speech Recognition via Large-Scale Weak Supervision
支持接入Dify or Coze的微信聊天机器人,自带配置UI,支持Workflow,可自定义编排AI作业任务,原生支持永久记忆功能,支持GPT-SoVITS自定义音色,支持RVC翻唱,能够发送原生微信语音气泡
Dify Java Client 是一个用于与 Dify 平台进行交互的 Java 客户端库。它提供了对 Dify 应用 API 和知识库 API 的完整支持,让 Java 开发者能够轻松地将 Dify 的生成式 AI 能力集成到自己的应用中。
MuseTalk: Real-Time High Quality Lip Synchorization with Latent Space Inpainting
fay是一个帮助数字人(2.5d、3d、移动、pc、网页)或大语言模型(openai兼容、deepseek)连通业务系统的mcp框架。
An Industrial-Level Controllable and Efficient Zero-Shot Text-To-Speech System
Multi-lingual large voice generation model, providing inference, training and deployment full-stack ability.