8000
We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
No 1. [1.3k星]FlowGram.ai:基于节点的流程构建引擎,助力开发者快速创建固定布局或自由连接布局的工作流。亮点:1. 提供固定布局和自由布局两种模式,满足多样化需求;2. 集成AI能力,赋能工作流智能化;3. 提供丰富的交互最佳实践,提升开发效率 No 2. [1.7k星]DeerFlow:深度研究的利器,结合语言模型与多种工具,助力高效研究与知识探索。亮点:1. 支持多语言模型集成,兼容OpenAI等API;2. 无缝集成MCP服务,拓展研究边界;3. 提供交互式修改研究计划,支持人类参与研究流程 No 3. [LG]《When Bad Data Leads to Good Models》 No 4. [122星]NanoNets/docext:一款无需OCR的本地部署文档信息提取工具,通过视觉语言模型轻松提取文档中的结构化信息。亮点:1. 完全本地化部署,保障数据隐私;2. 支持多页文档处理,满足复杂文件需求;3. 提供REST API接口,方便与现有系统集成 No 5. [120星]Flow-GRPO:通过在线强化学习训练流匹配模型,让AI生成更精准、更符合人类偏好的内容。亮点:1. 创新性地结合了流匹配与在线强化学习,提升生成效果;2. 提供多种预训练模型,涵盖文本渲染、人类偏好对齐等任务;3. 支持单节点和多节点训练,灵活适应不同计算环境 No 6. [CL]《Rethinking Invariance in In-context Learning》 No 7. [1.5k星]YASB:一个高度可配置的Windows状态栏,用Python打造你的个性化桌面体验。亮点:1. 支持超过30种可定制的桌面小部件,满足多样需求;2. 适配Windows 10和11,兼容性强;3. 开箱即用,安装简单,配置灵活 No 8. [LG]《Understanding In-context Learning of Addition via Activation Subspaces》 No 9. [7星]learning-from-rewards-llm-papers:为大语言模型(LLM)的后训练和测试时扩展提供奖励学习的前沿研究资源。亮点:1. 收录了超过60篇相关研究论文;2. 提供从标量奖励到多模态奖励的全面学习框架;3. 包含多种应用场景,如数学推理、代码生成和多模态任务 No 10. [21星]CAMELTrack:在线多目标跟踪的全新解决方案,让目标检测与跟踪更高效、更智能。亮点:1. 无需手工设计启发式规则,直接从数据中学习关联策略;2. 轻量级且快速,训练与推理效率高;3. 支持多种数据集,HOTA指标表现卓越,如DanceTrack数据集上HOTA达69.3 No 11. [70星]logitloom:探索指令和基础模型中的token轨迹树,帮助研究人员和开发者深入理解模型生成过程。亮点:1. 支持多种模型,包括指令模型和基础模型;2. 提供可视化树状结构,直观展示token生成路径;3. 可自定义扩展设置,灵活控制生成深度和分支数量 No 12. [246星]cased/kit:为代码智能开发提供一站式工具包,轻松构建AI驱动的开发工具。亮点:1. 支持代码库映射、符号提取和多种代码搜索;2. 提供代码依赖分析,支持Python和Terraform;3. 生成代码摘要,提升代码理解效率 No 13. [79星]Awesome-Large-Multimodal-Reasoning-Models:一站式探索多模态推理模型的前沿发展。亮点:1. 涵盖从基础到前沿的多模态模型,提供清晰发展脉络;2. 整合大量数据集和基准测试,助力研究与应用;3. 详细分析未来趋势,为研究者指明方向 No 14. [147星]Multiverse:首个AI多人世界模型,让多人游戏的AI模拟变得简单高效。亮点:1. 支持多人交互,模拟真实游戏场景;2. 提供高分辨率和低分辨率数据集,满足不同训练需求;3. 仅用Python和少量Shell脚本即可实现复杂功能 No 15. 人人能懂的AI前沿解读(5.10)http://t.cn/A6gP7o4W No 16. [568星]CAI: Cybersecurity AI,一个开源的、面向Bug Bounty的AI框架。亮点:1. 轻量级且模块化,易于扩展和集成;2. 支持超过300种模型,涵盖主流LLM供应商;3. 集成安全工具和实时追踪功能,助力高效安全测试 No 17. [216星]Multi-Agent-Custom-... No 18. [18星]Awesome Digital Twins:从视觉数据生成数字孪生模型的前沿研究汇总。亮点:1. 涵盖2021-2025年最新研究成果;2. 提供丰富的视觉数据生成数字孪生模型的论文资源;3. 附带Miro思维导图,直观呈现论文关系 No 19. 今日推介(第1766期):统一LLM推理器与验证器以实现更好的推理时扩展、通过激活子空间理解加法的上下文学习、“坏“数据有利于训练“好“模型、通过推理时缩放进行跨语言推理、反思上下文学习中的不变性 ...... No 20. [11星]arxiv_daily_aigc:一个AI驱动的arXiv论文爬虫、分析和整理工具,专注于AIGC领域。亮点:1. 每日自动抓取arXiv上的最新计算机视觉论文;2. 使用AI智能筛选与图像/视频/多模态生成相关的论文,并评分;3. 自动生成结构化的JSON数据和美观的HTML页面 No 21. [LG]《Putting the Value Back in RL: Better Test-Time Scaling by Unifying LLM Reasoners With Verifiers》 No 22. [1.2k星]SweetPad:让VSCode成为iOS开发的强大工具。亮点:1. 集成swift-format等工具,代码格式化更高效;2. 支持Simulator和物理设备调试,开发更灵活;3. 提供Autocomplete和Debug功能,提升开发效率 No 23. [696星]AgentDock:用AI Agents构建复杂任务的开源框架。AgentDock让你轻松打造可配置、确定性强的AI系统,解决复杂任务自动化难题。亮点:1. 支持多语言,覆盖12种语言的README翻译;2. 采用节点化架构,可扩展性强;3. 提供多种预配置Agent模板,如“Dr. Gregory House”诊断Agent,助力快速开发 No 24. [307星]Toolkami:仅用七个工具实现的极简AI Agent框架,轻松打造高效智能自动化流程。亮点:1. 仅需七个工具即可构建强大AI Agent;2. 支持热重载,实时更新代码无需重启;3. 提供Turbo模式,实现全自主运行 No 25. 为什么现在是创业的黄金时代? No 26. [357星]LegoGPT:从文字描述生成稳定乐高模型的AI神器。亮点:1. 首个能从文本生成物理稳定乐高模型的工具;2. 生成的乐高设计可直接用于搭建,砖块数量精准;3. 提供文本、图片和LDraw格式的输出,满足多种需求 No 27. 晚安~ [月亮] No 28. [339星]Buster:一个开源平台,用于部署 AI 数据分析师,旨在通过 AI 技术帮助公司的员工自主地探索和分析数据 No 29. [67星]VITA-Audio:一款高效的语音语言模型,能够快速生成音频和文本内容。亮点:1. 低延迟,首次音频生成时间从236毫秒缩短到53毫秒;2. 推理速度提升3-5倍;3. 开源数据训练,包含20万小时音频 No 30. [CL]《Crosslingual Reasoning through Test-Time Scaling》 No 31. [367星]HunyuanCustom:腾讯推出的多模态驱动的定制化视频生成框架,让视频创作更自由!亮点:1. 支持文本、图像、音频、视频等多种输入模态,满足多样化创作需求;2. 单主体视频定制效果出色,身份一致性高达0.627;3. 提供单GPU和多GPU推理方案,适配不同硬件环境 No 32. [133星]Reddit AI Trends:通过自动化Reddit洞察,帮你提前捕捉AI趋势。亮点:1. 每日更新,6 AM CDT准时发布最新趋势;2. 支持中英文双语报告;3. 涵盖多社区分析,全面掌握AI动态 No 33. 本文颠覆性地提出,在LLM预训练中包含适量的“坏”数据(如毒性内容),反而能促使模型形成对该概念更清晰、更少纠缠的内部线性表征,从而在后续结合推理时干预(ITI)等对齐技术后,能以更小的通用能力代价实现更有效的毒性控制,最终达成“坏数据造就好模型”的反直觉效果。 No 34. [CL]《X-Reasoner: Towards Generalizable Reasoning Across Modalities and Domains》 No 35. 早![太阳] No 36. [294星]ContextGem:让从文档中提取结构化数据变得轻而易举的LLM框架。亮点:1. 自动化动态提示,无需手动编写复杂代码;2. 提供强大的数据建模和验证功能,减少开发时间;3. 支持多语言输入输出,无需额外提示 No 37. [69星]Agentica-project/verl-pipeline:为大规模语言模型(LLM)的强化学习训练提供高效、灵活的解决方案。亮点:1. 支持高达70B参数模型和数百个GPU的扩展;2. 集成多种主流LLM框架,如PyTorch FSDP、Megatron-LM和vLLM;3. 提供多种强化学习算法,如PPO、GRPO和ReMax No 38. 本文通过对Llama-3-8B执行“常数加法”上下文学习任务的精细解剖,惊人地发现仅需三个特定注意力头便主导此能力,它们在结构化的6维激活子空间中(进一步分解为编码个位数的4维周期性子空间和编码十位数的2维子空间)表征和处理任务信息,并采用一种反直觉的“自我校正”机制聚合来自示例的信号,同时...全文//[LG]《Understanding In-context Learning of Addition via Activation Subspaces》 No 39. Splitwiser是一项旨在通过在单块GPU上利用多进程(并辅以NVIDIA MPS)并行运行LLM推理的提示计算和Token生成两个阶段,以提高资源利用率和降低推理延迟的初步探索性工作,其反直觉之处在于尝试在资源有限的单卡上运行多个推理实例并通过巧妙设计克服模型复制和数据同步的挑战,为GPU资源受限的用户提供...全文//[LG]《Splitwiser: Efficient LM inference with constrained resources》 No 40. [724星]Deep Research Web UI:一款AI驱动的研究助手,结合搜索引擎、网页爬取和大语言模型,帮你深度挖掘任何主题的信息。亮点:1. 实时反馈,AI响应即时呈现;2. 搜索可视化,以树状结构展示研究过程;3. 支持多语言搜索,覆盖更广信息源 No 41. [88星]Voila:开源的语音交互基础模型库,旨在提升人工智能与人类交互的体验。亮点:1. 实时低延迟语音处理,延迟低至195毫秒;2. 支持多种语言的语音识别与合成;3. 提供数百万种预建语音库,快速切换 No 42. [15星]Awesome-3D-Scene-Generation:一站式3D场景生成论文精选库,为研究人员和开发者提供前沿资源。亮点:1. 汇总超300篇最新研究论文;2. 涵盖多种生成方法,如基于LLM、神经3D生成等;3. 持续更新,紧跟学术前沿 No 43. 《Online Learning: A Comprehensive Survey》 No 44. 晚安~ [月亮] No 45. #听见微博# #微博声浪计划# 本期《TAI快报》 No 46. [517星]BLAFS:为容器瘦身的“减肥专家”,能帮你的容器减重高达95%!亮点:1. 一键式容器瘦身,操作简单;2. 支持多容器共享层,优化存储空间;3. 保留容器功能,瘦身不减能 No 47. '侯捷C++课程PPT及代码,动手学起来 No 48. Google Sheet已经这么强大了吗?都不用自己写代码爬了? [酷] 祖传爬虫手艺没用武之地了?[笑cry] ...... No 49. roomGPT.io:上传室内照片,生成梦幻家居 No 50. Miipher-2是一款创新的通用语音恢复模型,它通过巧妙结合冻结的预训练USM和高效的并行适配器,实现了无需外部条件信息即可对超过300种语言进行高质量、极高计算效率(RTF 0.0078)的语音恢复,专为百万小时级数据集的清洗而设计,反直觉地展示了大型SSL模型(即使其本身训练于含噪数据)在精细化数据修...全文//[AS]《Miipher-2: A Universal Speech Restoration Model for Million-Hour Scale Data Restoration》
The text was updated successfully, but these errors were encountered:
No branches or pull requests
No 1. [1.3k星]FlowGram.ai:基于节点的流程构建引擎,助力开发者快速创建固定布局或自由连接布局的工作流。亮点:1. 提供固定布局和自由布局两种模式,满足多样化需求;2. 集成AI能力,赋能工作流智能化;3. 提供丰富的交互最佳实践,提升开发效率
No 2. [1.7k星]DeerFlow:深度研究的利器,结合语言模型与多种工具,助力高效研究与知识探索。亮点:1. 支持多语言模型集成,兼容OpenAI等API;2. 无缝集成MCP服务,拓展研究边界;3. 提供交互式修改研究计划,支持人类参与研究流程
No 3. [LG]《When Bad Data Leads to Good Models》
No 4. [122星]NanoNets/docext:一款无需OCR的本地部署文档信息提取工具,通过视觉语言模型轻松提取文档中的结构化信息。亮点:1. 完全本地化部署,保障数据隐私;2. 支持多页文档处理,满足复杂文件需求;3. 提供REST API接口,方便与现有系统集成
No 5. [120星]Flow-GRPO:通过在线强化学习训练流匹配模型,让AI生成更精准、更符合人类偏好的内容。亮点:1. 创新性地结合了流匹配与在线强化学习,提升生成效果;2. 提供多种预训练模型,涵盖文本渲染、人类偏好对齐等任务;3. 支持单节点和多节点训练,灵活适应不同计算环境
No 6. [CL]《Rethinking Invariance in In-context Learning》
No 7. [1.5k星]YASB:一个高度可配置的Windows状态栏,用Python打造你的个性化桌面体验。亮点:1. 支持超过30种可定制的桌面小部件,满足多样需求;2. 适配Windows 10和11,兼容性强;3. 开箱即用,安装简单,配置灵活
No 8. [LG]《Understanding In-context Learning of Addition via Activation Subspaces》
No 9. [7星]learning-from-rewards-llm-papers:为大语言模型(LLM)的后训练和测试时扩展提供奖励学习的前沿研究资源。亮点:1. 收录了超过60篇相关研究论文;2. 提供从标量奖励到多模态奖励的全面学习框架;3. 包含多种应用场景,如数学推理、代码生成和多模态任务
No 10. [21星]CAMELTrack:在线多目标跟踪的全新解决方案,让目标检测与跟踪更高效、更智能。亮点:1. 无需手工设计启发式规则,直接从数据中学习关联策略;2. 轻量级且快速,训练与推理效率高;3. 支持多种数据集,HOTA指标表现卓越,如DanceTrack数据集上HOTA达69.3
No 11. [70星]logitloom:探索指令和基础模型中的token轨迹树,帮助研究人员和开发者深入理解模型生成过程。亮点:1. 支持多种模型,包括指令模型和基础模型;2. 提供可视化树状结构,直观展示token生成路径;3. 可自定义扩展设置,灵活控制生成深度和分支数量
No 12. [246星]cased/kit:为代码智能开发提供一站式工具包,轻松构建AI驱动的开发工具。亮点:1. 支持代码库映射、符号提取和多种代码搜索;2. 提供代码依赖分析,支持Python和Terraform;3. 生成代码摘要,提升代码理解效率
No 13. [79星]Awesome-Large-Multimodal-Reasoning-Models:一站式探索多模态推理模型的前沿发展。亮点:1. 涵盖从基础到前沿的多模态模型,提供清晰发展脉络;2. 整合大量数据集和基准测试,助力研究与应用;3. 详细分析未来趋势,为研究者指明方向
No 14. [147星]Multiverse:首个AI多人世界模型,让多人游戏的AI模拟变得简单高效。亮点:1. 支持多人交互,模拟真实游戏场景;2. 提供高分辨率和低分辨率数据集,满足不同训练需求;3. 仅用Python和少量Shell脚本即可实现复杂功能
No 15. 人人能懂的AI前沿解读(5.10)http://t.cn/A6gP7o4W
No 16. [568星]CAI: Cybersecurity AI,一个开源的、面向Bug Bounty的AI框架。亮点:1. 轻量级且模块化,易于扩展和集成;2. 支持超过300种模型,涵盖主流LLM供应商;3. 集成安全工具和实时追踪功能,助力高效安全测试
No 17. [216星]Multi-Agent-Custom-...
No 18. [18星]Awesome Digital Twins:从视觉数据生成数字孪生模型的前沿研究汇总。亮点:1. 涵盖2021-2025年最新研究成果;2. 提供丰富的视觉数据生成数字孪生模型的论文资源;3. 附带Miro思维导图,直观呈现论文关系
No 19. 今日推介(第1766期):统一LLM推理器与验证器以实现更好的推理时扩展、通过激活子空间理解加法的上下文学习、“坏“数据有利于训练“好“模型、通过推理时缩放进行跨语言推理、反思上下文学习中的不变性 ......
No 20. [11星]arxiv_daily_aigc:一个AI驱动的arXiv论文爬虫、分析和整理工具,专注于AIGC领域。亮点:1. 每日自动抓取arXiv上的最新计算机视觉论文;2. 使用AI智能筛选与图像/视频/多模态生成相关的论文,并评分;3. 自动生成结构化的JSON数据和美观的HTML页面
No 21. [LG]《Putting the Value Back in RL: Better Test-Time Scaling by Unifying LLM Reasoners With Verifiers》
No 22. [1.2k星]SweetPad:让VSCode成为iOS开发的强大工具。亮点:1. 集成swift-format等工具,代码格式化更高效;2. 支持Simulator和物理设备调试,开发更灵活;3. 提供Autocomplete和Debug功能,提升开发效率
No 23. [696星]AgentDock:用AI Agents构建复杂任务的开源框架。AgentDock让你轻松打造可配置、确定性强的AI系统,解决复杂任务自动化难题。亮点:1. 支持多语言,覆盖12种语言的README翻译;2. 采用节点化架构,可扩展性强;3. 提供多种预配置Agent模板,如“Dr. Gregory House”诊断Agent,助力快速开发
No 24. [307星]Toolkami:仅用七个工具实现的极简AI Agent框架,轻松打造高效智能自动化流程。亮点:1. 仅需七个工具即可构建强大AI Agent;2. 支持热重载,实时更新代码无需重启;3. 提供Turbo模式,实现全自主运行
No 25. 为什么现在是创业的黄金时代?
No 26. [357星]LegoGPT:从文字描述生成稳定乐高模型的AI神器。亮点:1. 首个能从文本生成物理稳定乐高模型的工具;2. 生成的乐高设计可直接用于搭建,砖块数量精准;3. 提供文本、图片和LDraw格式的输出,满足多种需求
No 27. 晚安~ [月亮]
No 28. [339星]Buster:一个开源平台,用于部署 AI 数据分析师,旨在通过 AI 技术帮助公司的员工自主地探索和分析数据
No 29. [67星]VITA-Audio:一款高效的语音语言模型,能够快速生成音频和文本内容。亮点:1. 低延迟,首次音频生成时间从236毫秒缩短到53毫秒;2. 推理速度提升3-5倍;3. 开源数据训练,包含20万小时音频
No 30. [CL]《Crosslingual Reasoning through Test-Time Scaling》
No 31. [367星]HunyuanCustom:腾讯推出的多模态驱动的定制化视频生成框架,让视频创作更自由!亮点:1. 支持文本、图像、音频、视频等多种输入模态,满足多样化创作需求;2. 单主体视频定制效果出色,身份一致性高达0.627;3. 提供单GPU和多GPU推理方案,适配不同硬件环境
No 32. [133星]Reddit AI Trends:通过自动化Reddit洞察,帮你提前捕捉AI趋势。亮点:1. 每日更新,6 AM CDT准时发布最新趋势;2. 支持中英文双语报告;3. 涵盖多社区分析,全面掌握AI动态
No 33. 本文颠覆性地提出,在LLM预训练中包含适量的“坏”数据(如毒性内容),反而能促使模型形成对该概念更清晰、更少纠缠的内部线性表征,从而在后续结合推理时干预(ITI)等对齐技术后,能以更小的通用能力代价实现更有效的毒性控制,最终达成“坏数据造就好模型”的反直觉效果。
No 34. [CL]《X-Reasoner: Towards Generalizable Reasoning Across Modalities and Domains》
No 35. 早![太阳]
No 36. [294星]ContextGem:让从文档中提取结构化数据变得轻而易举的LLM框架。亮点:1. 自动化动态提示,无需手动编写复杂代码;2. 提供强大的数据建模和验证功能,减少开发时间;3. 支持多语言输入输出,无需额外提示
No 37. [69星]Agentica-project/verl-pipeline:为大规模语言模型(LLM)的强化学习训练提供高效、灵活的解决方案。亮点:1. 支持高达70B参数模型和数百个GPU的扩展;2. 集成多种主流LLM框架,如PyTorch FSDP、Megatron-LM和vLLM;3. 提供多种强化学习算法,如PPO、GRPO和ReMax
No 38. 本文通过对Llama-3-8B执行“常数加法”上下文学习任务的精细解剖,惊人地发现仅需三个特定注意力头便主导此能力,它们在结构化的6维激活子空间中(进一步分解为编码个位数的4维周期性子空间和编码十位数的2维子空间)表征和处理任务信息,并采用一种反直觉的“自我校正”机制聚合来自示例的信号,同时...全文//[LG]《Understanding In-context Learning of Addition via Activation Subspaces》
No 39. Splitwiser是一项旨在通过在单块GPU上利用多进程(并辅以NVIDIA MPS)并行运行LLM推理的提示计算和Token生成两个阶段,以提高资源利用率和降低推理延迟的初步探索性工作,其反直觉之处在于尝试在资源有限的单卡上运行多个推理实例并通过巧妙设计克服模型复制和数据同步的挑战,为GPU资源受限的用户提供...全文//[LG]《Splitwiser: Efficient LM inference with constrained resources》
No 40. [724星]Deep Research Web UI:一款AI驱动的研究助手,结合搜索引擎、网页爬取和大语言模型,帮你深度挖掘任何主题的信息。亮点:1. 实时反馈,AI响应即时呈现;2. 搜索可视化,以树状结构展示研究过程;3. 支持多语言搜索,覆盖更广信息源
No 41. [88星]Voila:开源的语音交互基础模型库,旨在提升人工智能与人类交互的体验。亮点:1. 实时低延迟语音处理,延迟低至195毫秒;2. 支持多种语言的语音识别与合成;3. 提供数百万种预建语音库,快速切换
No 42. [15星]Awesome-3D-Scene-Generation:一站式3D场景生成论文精选库,为研究人员和开发者提供前沿资源。亮点:1. 汇总超300篇最新研究论文;2. 涵盖多种生成方法,如基于LLM、神经3D生成等;3. 持续更新,紧跟学术前沿
No 43. 《Online Learning: A Comprehensive Survey》
No 44. 晚安~ [月亮]
No 45. #听见微博# #微博声浪计划# 本期《TAI快报》
No 46. [517星]BLAFS:为容器瘦身的“减肥专家”,能帮你的容器减重高达95%!亮点:1. 一键式容器瘦身,操作简单;2. 支持多容器共享层,优化存储空间;3. 保留容器功能,瘦身不减能
No 47. '侯捷C++课程PPT及代码,动手学起来
No 48. Google Sheet已经这么强大了吗?都不用自己写代码爬了? [酷] 祖传爬虫手艺没用武之地了?[笑cry] ......
No 49. roomGPT.io:上传室内照片,生成梦幻家居
No 50. Miipher-2是一款创新的通用语音恢复模型,它通过巧妙结合冻结的预训练USM和高效的并行适配器,实现了无需外部条件信息即可对超过300种语言进行高质量、极高计算效率(RTF 0.0078)的语音恢复,专为百万小时级数据集的清洗而设计,反直觉地展示了大型SSL模型(即使其本身训练于含噪数据)在精细化数据修...全文//[AS]《Miipher-2: A Universal Speech Restoration Model for Million-Hour Scale Data Restoration》
The text was updated successfully, but these errors were encountered: