Stars
Easy-to-use Speech Toolkit including Self-Supervised Learning model, SOTA/Streaming ASR with punctuation, Streaming TTS with text frontend, Speaker Verification System, End-to-End Speech Translatio…
Tensorflow implementation of Chinese/Mandarin TTS (Text-to-Speech) based on Tacotron-2 model.
A fast Text-to-Speech (TTS) model. Work well for English, Mandarin/Chinese, Japanese, Korean, Russian and Tibetan (so far). 快速语音合成模型,适用于英语、普通话/中文、日语、韩语、俄语和藏语(当前已测试)。
基于STM32的智能桌面天气预报系统,具有语音识别功能,能用语音搜索天气,可进行简单的对话功能。
Live2D Library for Python (C++ Wrapper): Supports model loading, lip-sync and basic face rigging, precise click test.
EdgePersona是全本地化智能数字人,算力要求低,轻量高效,完全离线,笔记本也可以跑
基于.Net8+AntBlazor+SemanticKernel 和KernelMemory 打造的AI知识库/智能体,支持本地离线AI大模型。可以不联网离线运行。支持aspire观测应用数据
一个拥有长期记忆, 表情动作, 语音对话/打断/声纹识别, FunctionCall, 多模型支持的AI Waifu客户端.
这是一个用于连接小智AI服务的Python客户端库。它提供了简单的接口来进行语音对话和文本交互。
使用chatgpt的api与vits语音合成,实现了与ai老婆语音聊天。并加入了记忆功能与信息总结功能,大大提升了对话的容量。从而实现了连续长对话的效果
🤖 可 DIY 的 多模态 AI 聊天机器人 | 🚀 快速接入 微信、 QQ、Telegram、等聊天平台 | 🦈支持DeepSeek、Grok、Claude、Ollama、Gemini、OpenAI | 工作流系统、网页搜索、AI画图、人设调教、虚拟女仆、语音对话 |
这是一个基于 Chrome SpeechRecognition API 实现的语音识别智能助手简易 Demo,接入 Kimi AI 及第三方语音合成实现的简易语音对话智能助手。
百聆 是一个类似GPT-4o的语音对话机器人,通过ASR+LLM+TTS实现,集成DeepSeek R1等优秀大模型,时延低至800ms,Mac等低配置 8E98 可运行,支持打断
实时STT,连接OpenAI接口/智谱AI(流式LLM)和GPT-SOVITS/Edge-TTS,通过网页的方式,进行跨网络的服务调用,实现实时对话的效果
可本地部署的AI语音工具箱 | A user-friendly audio toolkit for voice recognition, voice transcription, voice conversion etc.
本项目使用esp32、esp32s3接入Chatgpt、Claude、讯飞星火、豆包等15款大模型,实现语音对话聊天,支持语音唤醒、连续对话、音乐播放等功能,同时外接了一块显示屏实时显示对话的内容。
用CASIA database数据集做的,做的语音情感识别和语音识人的练习
傲 娇 钉 宫,鞭 写 鞭 骂 - 钉宫理惠 vscode-rainbow-fart 扩展语音包
TexTeller can convert image to latex formulas (image2latex, latex OCR) with higher accuracy and exhibits superior generalization ability, enabling it to cover most usage scenarios.
a super easy clip model with mnist dataset for study
Apply machine learning with DBSCAN clustering to identify tradable pairs in the S&P 500 for statistical arbitrage. Includes data preprocessing, clustering, cointegration analysis, and backtesting.