PromptForge

开源项目

发现优秀的开源项目

模型开源项目
LiteRT-LM - Google 端侧大模型推理框架
Google AI Edge 团队开源的端侧 LLM 推理引擎,基于 C++ 打造,专注在手机和边缘设备上高效运行大语言模型,是 Google 端侧 AI 战略的核心组件。
端侧AI大模型推理边缘计算
01305
工具开源项目
FFF.nvim - AI Agent 极速文件搜索引擎
专为 AI Agent 和 Neovim 设计的高性能文件搜索工具,内置记忆系统可根据频率、Git 状态、文件大小等智能排序,大幅减少 Agent 搜索轮次和 Token 消耗,支持 MCP 协议一键集成。
ai-agent文件搜索mcp
03503
工具开源项目
Pi Mono - AI Agent 全栈开发工具包
由 libGDX 作者打造的 AI Agent 开发工具包,包含编码代理 CLI、统一多模型 LLM API、终端 UI 库、Web UI 组件、Slack Bot 和 vLLM GPU Pod 管理,一站式解决 Agent 开发全链路需求。
ai-agent编码代理大模型API
031651
其他开源项目
Google LiteRT-LM
Google出品的轻量级端侧LLM推理引擎,C++实现,专为移动设备和嵌入式平台优化的大语言模型运行时
端侧推理C++LLM Runtime
00
其他开源项目
Google AI Edge Gallery
Google官方端侧AI模型体验平台,支持在手机上离线运行Gemma 4等开源大模型,完全本地推理、隐私安全、速度飞快
端侧AIGemma移动端
00
其他开源项目
RAG-Anything
下一代全模态RAG框架,基于LightRAG构建,支持文本、图片、表格、公式、图表等多模态文档的统一处理与检索增强生成
RAG多模态文档处理
00
其他开源项目
Pi Mono
全能AI Agent开发工具箱:编码Agent CLI、统一多LLM API、终端与Web UI库、Slack机器人、vLLM部署管理,一站式构建AI Agent应用
AI Agentcoding agentLLM API
00
其他开源项目
mngr
Imbue AI 开源的 Agent 管理 CLI 工具,用于在终端中管理和编排多个 AI Agent 的运行。轻量级设计,适合开发者快速调度 Agent 任务。
agent管理CLI编排
00
其他开源项目
Qwen-Code
通义千问团队开源的终端AI编码Agent,类似 Claude Code 的开源替代品。支持在终端中进行代码生成、编辑、调试等操作,基于 Qwen 模型。
qwen编码agent终端
00
其他开源项目
GitHub Copilot SDK
GitHub 官方推出的多平台 SDK,用于将 Copilot Agent 能力集成到任意应用和服务中。支持多种语言和平台,提供标准化的 AI 编码助手接入方式。
copilotSDKgithub
00
其他开源项目
Maths-CS-AI Compendium
成为顶级AI/ML研究工程师的系统化学习路线,覆盖数学、计算机科学和AI核心知识体系,含交互式内容。
AI学习机器学习教育
00
其他开源项目
Compound Engineering Plugin
Every公司开源的复合工程插件,为Claude Code、Codex等AI编码工具提供团队协作增强,支持多Agent工程化工作流。
Claude Code编码工具团队协作
00
其他开源项目
Last30Days Skill
AI Agent技能:自动跨Reddit、X、YouTube、HN、Polymarket等平台研究任意话题,并生成综合摘要报告。18k+ stars。
AI Agent研究信息聚合
00
其他开源项目
Headroom
LLM应用的上下文优化层,自动压缩和管理上下文窗口,减少Token消耗同时保持输出质量。支持多种压缩策略。
LLM上下文优化Token节省
00
其他开源项目
Compound Engineering Plugin
Every公司开源的复合工程插件,支持Claude Code和Codex,实现团队级多Agent协作开发工作流
Claude CodeCodex多Agent
00
其他开源项目
fff.nvim
为AI Agent打造的最快最精准文件搜索工具包,支持Neovim/Rust/C/NodeJS,让Agent高效定位代码
AI Agent文件搜索Neovim
00
其他开源项目
Koharu
基于机器学习的漫画翻译器,用Rust编写,自动识别漫画文字气泡并翻译,支持多语言
漫画翻译MLRust
00
其他开源项目
Headroom
LLM应用的上下文优化层,智能压缩和管理上下文窗口,减少token消耗同时保持输出质量
LLM上下文优化token压缩
00
其他开源项目
vercel-labs/just-bash
Vercel实验室出品的Bash for Agents工具,让AI Agent能够更安全高效地执行Bash命令,适合Agent自动化场景。
bashagentvercel
00
其他开源项目
microsoft/agent-framework
微软开源的AI Agent构建、编排与部署框架,支持Python和.NET,提供多Agent工作流支持,适合企业级Agent应用开发。
microsoftagentframework
00
其他开源项目
oh-my-openagent
最佳Agent编排框架(原oh-my-opencode),支持多Agent协作、插件系统和丰富的开发者工具,48000+ stars的热门项目。
agentorchestrationopen-source
00
其他开源项目
everything-claude-code
Claude Code / Codex / Cursor 等编码Agent的性能优化系统,包含技能树、本能反应、记忆管理、安全策略和研究优先开发方法论。GitHub本周增长23000+ stars。
agentclaude-codeoptimization
00
其他开源项目
Sim Studio
开源AI Agent编排平台,提供可视化界面来构建、部署和管理AI Agent工作流,是你AI团队的中央智能层
AI Agent工作流编排可视化
10
其他开源项目
screenpipe
基于屏幕活动的AI Agent框架,通过记录和理解你的屏幕操作来驱动自动化Agent,让AI真正知道你在做什么并为你工作
AI Agent屏幕录制自动化
20
其他开源项目
tokscale
AI编码Agent Token用量追踪CLI工具,支持Claude Code、Codex、OpenClaw、Gemini、Cursor等主流AI编码助手的token消耗监控,提供全球排行榜和2D/3D贡献图
CLIToken追踪AI编码
10
其他开源项目
Daft
高性能 AI 数据引擎,支持图片、音频、视频和结构化数据的大规模处理,Rust 核心 + Python 接口
data-enginemultimodalrust
10
其他开源项目
MLX-LM
Apple MLX 框架的 LLM 推理工具,让你在 Mac 上本地高效运行各种大语言模型
local-llmapple-siliconmlx
10
其他开源项目
CocoIndex
面向 AI 的数据转换框架,支持增量处理,性能极高,适合构建 RAG、搜索和分析的数据管道
data-pipelineragincremental-processing
30
其他开源项目
agent-browser
Vercel Labs 出品的 AI Agent 浏览器自动化 CLI 工具,让 AI 代理能够直接控制浏览器完成网页操作任务
browser-automationai-agentcli
20
其他开源项目
OpenCode
开源AI编码Agent,支持终端和桌面应用,多语言界面,一键安装,兼容所有主流LLM提供商,是Claude Code和Cursor的开源替代。
coding-agentterminalopen-source
10
其他开源项目
Oh My OpenAgent
4.8万星的开源Agent编排工具,支持多模型混用(Claude/Kimi/GLM/GPT/Gemini),自动任务分配和纪律执行,被称为比Claude Code更快的编码Agent。
coding-agentmulti-modelorchestration
10
其他开源项目
LightRAG
港大EMNLP2025论文实现,轻量级高效RAG框架,基于知识图谱增强检索,支持图存储、重排序、多模态数据处理和OpenSearch后端。
RAGknowledge-graphretrieval
20
其他开源项目
Microsoft Agent Framework
微软官方多Agent框架,支持Python和.NET双语言,提供图编排工作流、流式处理、检查点、人机交互等企业级能力,已整合Semantic Kernel和AutoGen。
multi-agentmicrosoftworkflow
20
其他开源项目
Superpowers
一个 Agentic 技能框架和软件开发方法论,帮助 AI 编码 Agent 获得可复用的超能力技能包
AI Agent技能框架开发方法论
10
其他开源项目
Repomix
将整个代码仓库打包成一个 AI 友好的单文件,方便喂给 Claude/ChatGPT/Gemini 等大模型进行代码分析
开发工具代码分析LLM
10
其他开源项目
Sim Studio
构建、部署和编排 AI Agent 的可视化平台,支持拖拽式工作流设计,是 AI 团队的中央智能调度层
AI Agent工作流可视化
20
其他开源项目
TimesFM
Google Research 开发的时间序列基础模型,预训练的通用时序预测模型,可零样本迁移到各种预测任务。
时间序列预测基础模型
20
其他开源项目
Onyx
开源 AI 平台,支持对接所有主流 LLM,提供高级 AI 对话功能,内置文档检索、权限管理和企业级部署能力。
AI平台RAG企业级
10
其他开源项目
Headroom
LLM 应用的上下文优化层,帮你智能管理和压缩 prompt 上下文,在有限 token 预算内最大化信息密度。
LLM上下文优化token管理
10
其他开源项目
GitHub Copilot SDK
GitHub官方发布的Copilot Agent多平台SDK,可将Copilot能力集成到任意应用和服务中
GitHub CopilotSDKAI集成
10
其他开源项目
Oh My OpenAgent
最强Agent增强框架(4.8万星),为各种编码Agent提供统一的插件系统、团队协作和HUD界面
Agent框架插件系统开发工具
10
其他开源项目
Just Bash
Vercel Labs推出的Agent Bash工具,让AI Agent安全高效地执行Bash命令,为Agent提供标准化的终端交互能力
Agent工具Bash终端
10
其他开源项目
mngr
Imbue开源的AI Agent管理CLI工具,像git管理代码一样管理编码Agent,支持SSH/Docker/Modal等多环境部署
Agent管理CLI工具多Agent
10
其他开源项目
Qwen Code
通义千问团队开源的终端AI编码Agent,类似Claude Code的开源替代品,支持本地运行和多模型切换
AI Agent编码助手终端工具
20
智能体开源项目
Goose — Block 开源可扩展 AI Agent
Block 公司开源的 AI Agent,不只是代码建议——能安装、执行、编辑和测试,支持任何 LLM
AI Agent开源代码助手
10
智能体开源项目
Microsoft Agent Framework — 微软多Agent编排框架
微软官方开源的 AI Agent 构建与编排框架,支持 Python/.NET 构建多Agent工作流
MicrosoftAgent多Agent
18511
ai-model开源项目
MLX-VLM — Mac 视觉语言模型推理与微调
在 Mac 上使用 Apple MLX 框架高效运行和微调视觉语言模型,支持多种主流 VLM 架构
MLXVLMMac
13362
其他开源项目
last30days-skill
AI Agent 技能插件,可自动调研 Reddit、X、YouTube、HN、Polymarket 等多平台内容,生成有依据的综合摘要报告。
AI-Agent研究工具信息聚合
10
其他开源项目
headroom
LLM应用的上下文优化层,帮助开发者智能压缩和管理上下文窗口,减少token消耗同时保持输出质量。
上下文优化token管理LLM工具
20
其他开源项目
system_prompts_leaks
收录了 ChatGPT、Claude、Gemini、Grok 等主流AI产品的系统提示词泄露合集,定期更新。是学习顶级AI产品提示词设计的宝藏资源。
系统提示词prompt-engineeringAI安全
20
其他开源项目
Maths-CS-AI Compendium
系统化的 AI/ML 研究工程师学习路线,覆盖数学基础、计算机科学核心和 AI 前沿,适合从零成长为顶尖 AI 研究工程师。
ailearningml
30
其他开源项目
AIChat
全能 LLM 命令行工具,集成 Shell 助手、Chat-REPL、RAG、AI 工具和 Agent 功能,支持 OpenAI/Claude/Gemini/Ollama 等主流模型。
llmclirag
30
其他开源项目
Koharu
基于机器学习的漫画翻译工具,用 Rust 编写,支持自动检测气泡文字、OCR 识别和翻译渲染,专为漫画场景优化。
mangatranslationml
30
其他开源项目
ForgeCode
基于 Rust 构建的 AI 编程助手,支持 Claude、GPT、Gemini、DeepSeek 等 300+ 模型,在终端中实现智能结对编程。
aicoding-assistantrust
40
开发工具开源项目
Compound Engineering Plugin
Every 公司开发的复合工程插件,适用于 Claude Code、Codex 等 AI 编码工具,实现多 Agent 协作工程化。
claude-codecodexengineering
30
AI 开发开源项目
Honcho
AI Agent 记忆管理库,为构建有状态的 Agent 提供记忆持久化和个性化交互能力。
agent-memorystateful-agentpersonalization
30
AI 工具开源项目
Chandra OCR
高精度 OCR 模型,擅长处理复杂表格、表单和手写文字,支持完整版式还原。
ocrdocument-aitable-extraction
30
效率工具开源项目
OpenScreen
免费开源的屏幕录制与演示工具,Screen Studio 的开源替代品。无订阅、无水印,支持商业使用。
screen-recordingdemoopen-source
30
其他开源项目
Skill Seekers
将文档网站、GitHub仓库和PDF自动转换为Claude AI技能包,支持冲突检测
Claude技能自动化
40
其他开源项目
Oumi
一站式开源LLM微调、评测和部署平台,支持 Qwen3、DeepSeek-R1 等主流开源模型
微调LLM部署
50
其他开源项目
PraisonAI
你的24/7 AI员工团队 - 低代码多Agent AI平台,支持自动规划、研究、编码,可投递到 Telegram/Discord/WhatsApp
多Agent低代码自动化
40
其他开源项目
Microsoft APM
微软推出的 Agent 包管理器,为 AI Agent 生态提供标准化的技能包发现、安装和版本管理方案
Agent包管理微软
40
其他开源项目
Local Deep Research - 本地深度研究引擎
本地化深度研究工具,SimpleQA基准达~95%准确率。支持Ollama等本地模型,搜索arXiv、PubMed等10+数据源,全程本地加密。
深度研究本地部署RAG
40
其他开源项目
MLX-VLM - Mac本地视觉语言模型
在Mac上使用Apple MLX框架运行和微调视觉语言模型(VLM)。支持主流开源VLM,本地推理无需GPU服务器。
VLMApple MLXMac
40
其他开源项目
FFF.nvim - AI Agent极速文件搜索
为AI编程Agent设计的极速文件搜索工具,内置记忆功能减少token消耗。支持MCP协议,可集成Claude Code、Codex等。
AI Agent文件搜索MCP
50
其他开源项目
Microsoft APM (Agent Package Manager)
微软推出的AI Agent包管理器,让你像管理npm包一样管理和分发AI Agent技能包。支持发现、安装、版本管理Agent工具。
AI Agent包管理微软
40
其他开源项目
Awesome Claude Code (社区版)
社区维护的 Claude Code 技能、钩子、斜杠命令和插件精选列表,36k+ Stars
Claude Codeawesome-listAgent技能
40
其他开源项目
Cursor2API
将 Cursor 免费 API 转换为 OpenAI/Anthropic 兼容格式的代理服务,支持 Claude Code 工具调用和图片
API代理CursorOpenAI兼容
40
其他开源项目
Supervision
Roboflow 开源的计算机视觉工具库,提供检测、跟踪、标注等可复用组件,37k+ Stars
计算机视觉目标检测Python
40
其他开源项目
Chandra OCR
Datalab 出品的高精度 OCR 模型,能处理复杂表格、表单和手写体,支持完整版式还原,本周 2.4k Star 增长
ocrdocument-aitable-extraction
50
其他开源项目
AI/ML Research Engineer Compendium
成为顶尖 AI/ML 研究工程师的完整学习路线图,涵盖数学、计算机科学和人工智能的核心知识体系,2.8k Star
learningaimachine-learning
50
其他开源项目
Cloudflare Temp Email
基于 CloudFlare 的免费临时域名邮箱,支持收发邮件、附件、IMAP/SMTP 和 Telegram Bot 集成,7.9k Star
cloudflareemailself-hosted
50
其他开源项目
Compound Engineering Plugin
Office 出品的 Claude Code/Codex 复合工程插件,支持多Agent团队协作、自动任务拆解和质量反馈循环,本周 1.4k+ Star
agentclaude-codecodex
40
其他开源项目
Strix
开源 AI 安全黑客工具,自动发现和修复应用漏洞,23k+ Star 的热门安全项目
安全AI漏洞扫描
40
其他开源项目
Honcho
为 AI Agent 构建有状态记忆的开源库,让 Agent 能记住上下文、用户偏好和历史交互
agent记忆开发框架
40
其他开源项目
OpenScreen
开源屏幕录制工具,可创建精美 Demo 视频,无水印、免费商用,Screen Studio 的开源替代品
工具录屏开源
70
其他开源项目
Oh My Codex
OpenAI Codex CLI 的增强框架,支持 hooks、Agent 团队、HUD 面板等扩展功能,让 Codex 不再孤军奋战
agentcodexcli
50
AI开源项目
TimesFM
Google Research开发的时间序列基础模型,专为时间序列预测设计,今日GitHub新增1100+ Star
时间序列预测Google
50
AI开源项目
VibeVoice
微软开源的前沿语音AI模型,支持语音合成、语音识别等多种语音任务,今日GitHub新增1000+ Star
语音AI微软TTS
50
工具开源项目
Dimillian 技能集合
知名iOS开发者Dimillian分享的Codex技能集合,展示如何为AI编程助手构建实用技能模块,Shell脚本为主,轻量高效。
Codex技能Shell
52659
工具开源项目
Claude Code 最佳实践指南
Claude Code完整最佳实践指南,涵盖子Agent、自定义命令、技能系统、编排工作流,附带可复制模板。GitHub Trending热门项目。
Claude Code最佳实践编程工具
50
智能体开源项目
Agent Lightning
微软开源的AI Agent训练优化框架,零代码改动即可将Agent变成可优化系统,支持所有主流Agent框架,内置强化学习、自动Prompt优化、SFT等算法。
agent训练强化学习微软
70
其他开源项目
Ruflo
Claude多Agent编排平台,支持智能Swarm部署、自主工作流协调和RAG集成,企业级架构。28K+ Stars本周热门。
Agent编排多AgentClaude
40
其他开源项目
TaxHacker
自托管AI记账应用,利用LLM自动分析收据、发票和交易记录,支持自定义分类规则和多语言。3K+ Stars。
财务自托管AI记账
50
其他开源项目
Honcho
为AI Agent构建有状态记忆的开源库,支持长期记忆、用户画像和个性化对话管理,轻量级易集成。
Agent记忆状态管理Python
70
其他开源项目
Social Auto Upload
自动化上传视频到社交媒体平台:抖音、小红书、视频号、TikTok、YouTube、Bilibili,支持定时发布和批量操作。
自动化视频发布多平台
50
其他开源项目
Chandra
高精度OCR模型,专门处理复杂表格、表单和手写体,支持完整版式还原。由Surya/Marker作者出品,8K+ Stars。
OCR文档处理表格识别
70
开发工具开源项目
Fastfetch
高性能系统信息展示工具,neofetch 的现代替代品,用C语言编写,支持Linux/macOS/Windows等多平台
系统信息CLIneofetch
60
安全工具开源项目
Sherlock
跨400+社交平台的用户名搜索工具,输入用户名即可追踪其在各大社交网络的账号
OSINT社交媒体用户名搜索
50
AI 工具开源项目
Claude How To
Claude Code 可视化实战指南——从基础概念到高级 Agent 编排,附带可复制的模板,15分钟快速上手
claude-code教程agent
60
其他开源项目
last30days-skill
AI Agent 技能插件,能跨 Reddit、X、YouTube、HN、Polymarket 等平台研究任意话题近30天动态,生成有据可查的综合摘要。本周 GitHub 新增 10k+ star。
agentresearchskill
40
其他开源项目
claude-subconscious
Letta AI 开发的 Claude Code 潜意识系统,为 Claude Code 添加持久记忆层,让它在多次会话间保持上下文连贯性。
Claude Codememory开发工具
40
其他开源项目
supermemory
AI 时代的记忆引擎,提供极速、可扩展的 Memory API。可以为任何 AI 应用添加长期记忆能力,支持语义搜索和上下文管理。
memoryAPIAI
60
其他开源项目
AI-Scientist-v2
SakanaAI 推出的 AI 科学家 v2,能够通过智能体树搜索自动完成研讨会级别的科学发现。支持自动文献综述、假设生成、实验设计与执行、论文撰写全流程。
AI科研自动化
50
AI开源项目
VibeVoice - 微软开源语音AI
微软推出的开源前沿语音AI,支持高质量语音合成与语音理解,GitHub Trending热门项目
语音AI微软TTS
60
AI开源项目
OpenBB - 开源金融数据平台
面向分析师、量化交易员和AI Agent的现代金融数据平台,支持多种数据源集成与分析
金融数据量化分析AI Agent
70
AI开源项目
Airi - AI虚拟伴侣框架
自托管AI虚拟伴侣容器,支持实时语音聊天、Minecraft和Factorio游戏陪玩,Web/macOS/Windows全平台支持,36k+ Star热门开源项目
AI伴侣语音聊天虚拟角色
70
其他开源项目
test
test
80
其他开源项目
Agentation
AI Agent 可视化反馈工具,实时展示 Agent 的执行过程、决策路径和工具调用链,让 Agent 行为透明可观测。
agentvisualizationobservability
70
其他开源项目
Claude Agent SDK Python
Anthropic 官方发布的 Claude Agent SDK Python 版,提供构建 AI Agent 的标准化框架,支持工具调用、多轮对话和 Agent 编排。
claudeagent-sdkanthropic
90
其他开源项目
Strix
开源 AI 安全黑客工具,自动发现并修复应用中的安全漏洞。利用 AI 模拟真实攻击者行为,进行自动化渗透测试。
securitypentestai-hacker
80
其他开源项目
Chandra OCR
新一代 OCR 模型,擅长处理复杂表格、表单和手写内容,完整保留文档布局结构
["OCR""文档解析""表格识别"
60
其他开源项目
Twenty CRM
开源现代 CRM 平台,社区驱动的 Salesforce 替代方案,基于 TypeScript 全栈构建,已获 42k+ Star
["CRM""开源""TypeScript"
70
其他开源项目
Onyx
开源AI对话平台,支持连接所有主流LLM,内置RAG知识库、文档解析、权限管理,适合企业级AI助手部署。
AI平台RAG企业AI
100
其他开源项目
insanely-fast-whisper
极速Whisper语音转文字工具,基于HuggingFace Transformers优化,速度比原版快数十倍,支持大文件批量转录。
语音识别Whisper转录
90
其他开源项目
Deep-Live-Cam
实时换脸和一键视频深度伪造工具,只需一张照片即可实现实时人脸替换,支持多种AI模型和实时摄像头处理。
深度伪造换脸实时处理
90
AI开源项目
VibeVoice
微软开源前沿语音AI框架,支持60分钟长音频一次转录(含说话人、时间戳)、实时TTS、50+语言,已集成HuggingFace Transformers
语音AITTSASR
100
AI开源项目
Dexter
自主金融研究Agent,自动拆解复杂金融问题、调用实时市场数据、自我验证结果,像Claude Code但专为金融研究打造
金融分析Agent自动化研究
100
AI开源项目
AI Scientist v2
AI自动科研系统v2:无需人工模板,自主生成假设、跑实验、写论文,首篇AI全自主论文已被ICLR Workshop接收
AI科研自动化论文生成
90
其他开源项目
chrome-devtools-mcp
Chrome 官方出品的 DevTools MCP 服务器,让 AI 编程助手直接操控浏览器开发者工具,实现自动化调试
ChromeDevToolsMCP
100
其他开源项目
TradingAgents-CN
基于多智能体 LLM 的中文金融交易框架,TradingAgents 中文增强版,支持A股市场分析和交易策略
多Agent金融交易中文
110
其他开源项目
claude-subconscious
给 Claude Code 添加「潜意识」记忆层,让 AI 编程助手在会话间保持上下文记忆,由 Letta AI 团队开发
Claude Code记忆上下文
140
其他开源项目
claude-plugins-official
Anthropic 官方维护的 Claude Code 高质量插件目录,提供经过审核的插件集合,是学习插件开发的最佳参考
Claude Code插件Anthropic
120
其他开源项目
vllm-omni
vLLM 多模态推理框架,支持文本、图像、音频等全模态模型的高效推理服务,是 vLLM 的下一代进化版本
多模态LLM推理vLLM
100
ai-agent开源项目
agentscope
可视化 Agent 构建与运行平台,支持可观测、可理解、可信赖的智能体开发,降低 Agent 开发门槛
agent-frameworkvisual-builderobservability
110
ai-model开源项目
chandra
高精度 OCR 模型,擅长处理复杂表格、表单和手写体,支持完整版面还原,文档数字化利器
ocrdocument-aitable-recognition
100
ai-agent开源项目
oh-my-claudecode
Claude Code 多Agent协作编排框架,支持团队级任务分配与并行执行,让多个 Claude Code 实例协同完成复杂项目
claude-codemulti-agentorchestration
130
其他开源项目
test
test
130
其他开源项目
MoneyPrinterTurbo
利用AI大模型一键生成高清短视频的开源工具。支持自动生成视频脚本、配音、字幕和背景音乐,适用于批量内容创作场景。53000+ Star的热门项目,Python开发。
AI视频短视频自动化
110
其他开源项目
OpenDataLoader PDF
AI就绪的PDF解析器,自动化PDF数据提取和可访问性处理。开源Java项目,专注于将PDF转换为结构化的AI训练数据,支持表格、图表和复杂布局的智能解析。本周GitHub热门,9400+ Star。
PDF数据提取AI
120
工具开源项目
Pascal Editor - 3D建筑项目编辑器
创建和分享3D建筑项目的开源编辑器,基于TypeScript构建,支持协作设计
3D建筑编辑器
126432
ai-agent开源项目
Last30Days - AI话题研究技能
AI Agent技能,可跨Reddit、X、YouTube、Hacker News、Polymarket和网络研究任意话题,然后综合生成一份有据可查的摘要
研究Agent技能话题分析
116262
ai-agent开源项目
Ruflo - Claude多Agent编排平台
领先的Claude Agent编排平台,支持部署智能多Agent群体、协调自主工作流,具备企业级架构、分布式群体智能、RAG集成以及原生Claude Code/Codex集成
多Agent编排Claude
2725590
其他开源项目
Claude Plugins Official
Anthropic 官方维护的高质量 Claude Code 插件目录,提供经过审核的插件集合,扩展 Claude Code 的能力边界。
Claude Code插件Anthropic
120
其他开源项目
DeepAgents
LangChain 官方出品的 Agent 框架,内置规划工具、文件系统后端和子Agent生成能力,适合处理复杂的多步骤任务。
AgentLangChainLangGraph
180
其他开源项目
Claude HUD
Claude Code 实时监控插件,可视化展示上下文使用量、活跃工具、子Agent状态和任务进度,开发者必备。
Claude Code开发工具插件
130
其他开源项目
Project NOMAD
离线生存AI计算机,集成关键工具、知识库和AI能力,断网环境下也能提供信息支持和决策辅助。本周GitHub狂涨12000+ star。
AI离线生存工具
130
智能体开源项目
Last30Days Skill — AI多平台调研技能
AI Agent技能:自动调研Reddit、X、YouTube、HN等平台近30天热点并生成摘要报告
Agent技能调研多平台
154862
工具开源项目
Pascal Editor — 在线协作代码编辑器
开源在线代码编辑器,支持多人实时协作编辑
编辑器协作开源
144143
工具开源项目
Supermemory — AI记忆引擎
AI时代的记忆引擎API,超快速、可扩展的记忆存储与检索服务
记忆引擎APIAI
1618187
其他开源项目
dimos
面向物理空间的智能体操作系统(Agentic OS)。支持用自然语言控制人形机器人、四足机器人、无人机等硬件平台,构建与物理传感器(摄像头、激光雷达、执行器)无缝协作的多Agent系统。
roboticsagent-oshardware
120
其他开源项目
next-ai-draw-io
基于 Next.js 的 AI 绘图应用,将 AI 能力与 draw.io 图表深度集成。支持通过自然语言命令创建、修改和增强各类图表,让架构图和流程图的绘制效率倍增。
draw.ioAIdiagram
220
其他开源项目
GitNexus
零服务器代码智能引擎——完全在浏览器客户端运行的知识图谱创建工具。只需拖入 GitHub 仓库或 ZIP 文件,即可生成交互式代码知识图谱,内置 Graph RAG Agent 用于代码探索。
knowledge-graphcode-analysisbrowser
120
其他开源项目
MiroThinker
MiroMindAI 推出的深度研究Agent,专为复杂研究和预测任务优化。最新模型 MiroThinker-H1 在 BrowseComp 基准测试上达到 88.2 分,具备强大的网络浏览和信息综合能力。
deep-researchagentprediction
120
工具开源项目
n8n-mcp - 用AI自动构建n8n工作流
让 Claude Code、Cursor 等AI编辑器通过MCP协议自动构建n8n工作流,自然语言即可生成自动化流程
MCPn8n自动化
1115830
模型开源项目
minimind - 2小时训练你自己的GPT
最佳大模型入门项目,2小时从零训练26M参数的GPT,支持预训练、SFT、RLHF全流程
大模型训练教程
140
智能体开源项目
DeerFlow - 字节跳动超级Agent框架
字节跳动开源的超级Agent框架,集成沙箱、记忆、工具和子Agent,可处理研究、编码和内容创作等复杂任务
智能体多Agent研究
3137318
其他开源项目
Unsloth
统一的开源模型训练和推理 Web UI,支持 Qwen、DeepSeek、Gemma 等主流开源模型的本地微调和运行
模型训练微调开源模型
170
其他开源项目
Learn Claude Code
从零到一构建一个类 Claude Code 的 Agent 编码工具,帮你理解 AI Agent 的核心原理:Bash is all you need
Agent教程Claude Code
150
其他开源项目
Everything Claude Code
AI 编程助手性能优化系统,集成了 Skills、Instincts、Memory、Security 等模块,适用于 Claude Code、Codex、Cursor 等主流 AI 编程工具
Claude CodeAI编程Agent
140
智能体开源项目
TradingAgents - 多Agent金融交易框架
基于多Agent LLM的金融交易框架,模拟真实交易公司的分析师、研究员和交易员协作流程
金融交易多Agent
4435970
工具开源项目
Project NOMAD - 离线生存AI计算机
自包含离线生存计算机,集成关键工具、知识库和本地AI,随时随地保持信息获取能力
离线AI生存工具知识库
167718
工具开源项目
PentaGI - AI自主渗透测试系统
全自主AI Agent渗透测试系统,支持多Agent协作完成复杂安全测试任务,包括漏洞扫描、利用和报告生成
安全渗透测试AI Agent
155200
其他开源项目
Context Hub
Andrew Ng(吴恩达)团队的开源项目,专注于AI Agent的上下文管理和组织,帮助开发者更好地构建和管理Agent的知识与工具。
contextagentandrew-ng
120
其他开源项目
OpenViking
字节跳动开源的AI Agent上下文数据库,通过文件系统范式统一管理Agent所需的记忆、资源和技能,支持层级化上下文传递和自我进化。
contextmemoryagent
150
其他开源项目
DeepAgents
LangChain官方出品的Agent框架,基于LangGraph构建,内置规划工具、文件系统后端和子Agent生成能力,适合处理复杂的多步Agent任务。
langchainagentplanning
120
其他开源项目
Superpowers
一个Agent技能框架和软件开发方法论,帮助构建具有专业能力的AI Agent。已获超10万Star,是目前最火的Agent Skills开源项目之一。
agentskillsframework
130
AI 工具开源项目
MoneyPrinterV2
自动化在线赚钱流程的工具集,集成内容生成、发布和变现的完整工作流
自动化赚钱内容生成
160
AI 工具开源项目
vLLM Omni
vLLM团队推出的全模态模型推理框架,支持文本、图像、音频等多模态输入输出的高效推理
多模态LLM推理vLLM
130
AI 工具开源项目
Project NOMAD
离线生存计算机——集成本地AI、关键知识库和实用工具,断网环境下也能提供信息检索和AI辅助
离线AI生存工具本地LLM
150
其他开源项目
Context Hub
吴恩达团队出品的上下文管理中心,帮助 AI Agent 高效管理和检索上下文信息
contextmemoryagent
150
其他开源项目
DeepAgents
LangChain 推出的深度 Agent 框架,内置规划工具、文件系统后端和子Agent生成能力,处理复杂任务
agentlangchainplanning
150
其他开源项目
Lightpanda Browser
专为 AI 和自动化设计的无头浏览器,用 Zig 编写,性能极高,适合大规模网页抓取和自动化任务
browserautomationheadless
150
其他开源项目
Open-SWE
LangChain 出品的开源异步编程 Agent,支持自主规划和代码修改,可作为 SWE-bench 替代方案
agentcodinglangchain
150
AI开源项目
TradingAgents
多Agent LLM金融交易框架,模拟真实交易公司的多角色协作进行投资决策
tradingmulti-agentfinance
190
AI开源项目
TaxHacker
自托管AI记账应用,使用LLM分析收据、发票和交易,支持自定义提示词和分类
accountingself-hostedllm
200
AI开源项目
Newton Physics
开源GPU加速物理模拟引擎,基于NVIDIA Warp构建,专为机器人研究和仿真研究人员设计
physicssimulationrobotics
160
其他开源项目
context-hub
Andrew Ng 团队出品的上下文管理工具,帮助 AI Agent 高效管理和检索项目上下文信息
contextmemoryagent
190
其他开源项目
open-swe
LangChain 开源异步编程 Agent,可自主完成代码修改、Bug修复等软件工程任务
coding-agentlangchainswe
240
其他开源项目
superpowers
Agent 技能框架与软件开发方法论,为 Claude Code 等 AI 编程工具提供可复用的技能包和最佳实践
agentskillsclaude-code
210
其他开源项目
agency-agents
完整的 AI 代理团队框架 - 涵盖前端开发、社区运营、创意注入等多种专业角色,每个 Agent 都有独立人格、工作流程和可交付成果
agentframeworkmulti-agent
210
其他开源项目
Arnis - 真实世界Minecraft生成器
用Rust编写的工具,可将真实世界任意地理位置高精度还原到Minecraft中。基于OpenStreetMap数据,10k+ Star
Minecraft地图生成Rust
230
AI开源项目
Get Shit Done (GSD)
Claude Code的轻量级元提示和上下文工程框架,规范驱动的开发系统。35k+ Star,AI编程领域现象级项目
Claude Code提示工程上下文工程
190
AI开源项目
OpenDataLoader PDF
AI就绪的PDF解析器,自动化PDF无障碍处理。支持智能表格识别、多语言OCR和结构化数据输出,开源免费,今日GitHub趋势榜第一
PDFAI数据处理
190
其他开源项目
DeepAgents
LangChain 团队打造的 Agent 编码框架,内置规划工具、文件系统后端和子 Agent 生成能力,适合处理复杂的多步骤 Agent 任务。15k+ stars。
agentlangchaincoding
190
其他开源项目
OpenViking
字节跳动开源的 AI Agent 上下文数据库,用文件系统范式统一管理 Agent 所需的记忆、资源和技能,支持分层上下文和自进化。15k+ stars。
agentcontext-managementmemory
170
其他开源项目
Lightpanda Browser
专为 AI 和自动化设计的无头浏览器,用 Zig 编写,极致性能。适合 Agent 网页交互、数据采集和自动化测试。21k+ stars。
headless-browserautomationAI
190
其他开源项目
BitNet
微软官方 1-bit LLM 推理框架,实现超低比特量化模型的高效推理,大幅降低大模型部署成本和硬件要求。35k+ stars。
LLMquantizationinference
200
其他开源项目
MiroFish
简洁通用的群体智能预测引擎,用集群智慧预测万物。基于 Swarm Intelligence 原理,支持多种预测场景,Python 34k+ stars。
swarm-intelligencepredictionpython
200
其他开源项目
Hindsight
Agent 记忆系统,能从交互中自动学习和进化。由 Vectorize 开源,帮助 AI Agent 建立持久化、可检索的记忆能力。
Agent记忆自进化向量存储
180
其他开源项目
MiroFish 微鱼
简洁通用的群体智能引擎,可预测万物。基于群体智能算法,适用于趋势预测和多 Agent 协作决策场景。
群体智能预测多Agent
200
其他开源项目
Promptfoo
Prompt/Agent/RAG 测试框架,支持红队测试和安全扫描,可对比 GPT、Claude、Gemini 等模型表现,支持 CLI 和 CI/CD 集成。
Prompt测试红队测试AI安全
200
其他开源项目
Lightpanda Browser
专为 AI 和自动化设计的无头浏览器,用 Zig 语言编写,比传统无头浏览器更快更轻量,适合 AI Agent 的网页交互场景。
无头浏览器AI自动化Zig
200
其他开源项目
OpenViking
火山引擎开源的 AI Agent 上下文数据库,通过文件系统范式统一管理 Agent 所需的记忆、资源和技能,支持分层上下文交付和自进化。
AI Agent上下文管理记忆系统
210
学习开源项目
Build Your Own X
从零实现你喜爱的技术!精选教程合集,涵盖 3D 渲染器、数据库、编译器、操作系统等数十个方向,费曼式学习法的最佳实践。
learningtutorialprogramming
49350000
工具开源项目
Claude HUD
Claude Code 的实时状态面板插件,显示上下文使用率、工具活动、子 Agent 状态和任务进度,无需额外窗口。
claude-codeplugindeveloper-tools
255135
框架开源项目
Deep Agents
LangChain 出品的 Agent 框架,开箱即用。内置规划、文件系统、Shell 和子 Agent 能力,支持 MCP 协议扩展。
agentlangchainpython
2813521
其他开源项目
promptfoo
LLM应用评测和红队测试CLI工具,支持自动化Prompt评估、模型对比、安全漏洞扫描,可集成CI/CD流水线
评测红队测试Prompt测试
210
其他开源项目
OpenViking
字节跳动火山引擎开源的AI Agent上下文数据库,用文件系统范式统一管理Agent的记忆、资源和技能,支持分层上下文加载和可视化检索
上下文管理Agent记忆火山引擎
190
其他开源项目
PageAgent
阿里巴巴开源的网页内GUI Agent,用自然语言控制网页界面,无需浏览器扩展或截图,纯JS实现,可快速为产品集成AI Copilot
GUI Agent网页自动化阿里巴巴
220
其他开源项目
MiroFish
基于多智能体技术的群体智能预测引擎,通过构建高保真数字世界进行社会模拟和未来推演,支持舆情分析、金融预测等场景
多智能体预测群体智能
210
AI开源项目
OpenViking - AI Agent 上下文数据库
字节跳动开源的 AI Agent 上下文数据库,通过文件系统范式统一管理 Agent 所需的记忆、资源和技能,支持分层上下文传递与自我进化。
agentcontextmemory
240
AI开源项目
claude-mem - Claude Code 跨会话记忆插件
自动捕获 Claude Code 编程会话中的所有操作,用 AI 压缩摘要后注入未来会话,让 Claude 拥有跨会话记忆能力。TypeScript 实现,36k star。
claude-codememoryplugin
230
AI开源项目
MiroFish - 群体智能预测引擎
简洁通用的群体智能引擎,利用 Swarm Intelligence 预测万物。Python 实现,支持多种预测场景,易于扩展。今日 GitHub 3200+ star。
swarm-intelligencepredictionpython
250
其他开源项目
promptfoo
LLM应用评估与红队测试工具,支持自动化Prompt测试、模型对比、安全漏洞扫描和CI/CD集成,兼容OpenAI、Anthropic、Ollama等主流模型提供商。
Prompt测试红队评估
200
其他开源项目
nanochat
Karpathy打造的极简LLM训练框架,单GPU节点即可完成从tokenization到预训练、微调、评估、推理的全流程。仅需$48即可训练出GPT-2级别的模型并通过ChatGPT风格的Web UI与之对话。
LLM训练GPTKarpathy
330
其他开源项目
OpenViking
字节跳动开源的AI Agent上下文数据库,采用文件系统范式统一管理Agent所需的记忆、资源和技能,支持分层上下文加载和自动会话管理,大幅降低Token消耗。
Agent上下文管理RAG
210
其他开源项目
MiroFish
基于多智能体技术的群体智能预测引擎,通过构建高保真平行数字世界,模拟成千上万个具备独立人格和记忆的智能体进行社会演化,实现对未来趋势的精准推演预测。
多智能体预测群体智能
210
框架开源项目
OpenViking 上下文数据库
字节跳动开源的AI Agent上下文数据库,通过文件系统范式统一管理Agent所需的记忆、资源和技能,支持层级上下文分发和自进化。
agentmemorycontext
210
框架开源项目
MiroFish 群体智能引擎
简洁通用的群体智能引擎,可预测万物。基于Swarm Intelligence的预测框架,适用于金融、天气、趋势等多种预测场景。
swarm-intelligencepredictionAI
200
工具开源项目
Lightpanda Browser
专为AI和自动化设计的无头浏览器,用Zig语言编写,性能极高。适合构建AI驱动的网页抓取、测试和自动化工作流。
browserheadlessautomation
260
其他开源项目
OpenViking
字节跳动火山引擎开源的 AI Agent 上下文数据库,通过文件系统范式统一管理 Agent 的记忆、资源和技能
Agent上下文管理字节跳动
200
其他开源项目
promptfoo
Prompt/Agent/RAG 测试与红队评估工具,支持 GPT、Claude、Gemini、Llama 等主流模型的性能对比和安全扫描
Prompt测试红队评估
220
其他开源项目
BitNet
微软官方 1-bit LLM 推理框架,大幅降低大模型部署成本和硬件要求,让 LLM 在边缘设备上高效运行
LLM推理优化微软
210
其他开源项目
MiroFish
简洁通用的群体智能预测引擎,基于 Swarm Intelligence 实现对各类事件的预测分析,本周 GitHub 17k+ star
群体智能预测AI
200
工具开源项目
Lightpanda Browser
专为 AI 和自动化设计的无头浏览器,用 Zig 语言编写,极致轻量高性能,适合爬虫和 Agent 网页交互场景。
无头浏览器自动化爬虫
10416325
框架开源项目
OpenRAG
基于 Langflow、Docling 和 OpenSearch 构建的一站式 RAG 平台,单包部署即可拥有完整的检索增强生成能力。
RAG知识库检索增强
252483
框架开源项目
OpenViking
字节跳动开源的 AI Agent 上下文数据库,通过文件系统范式统一管理 Agent 所需的记忆、资源和技能,支持分层上下文分发与自进化。
AI Agent上下文管理记忆系统
229556
其他开源项目
notebooklm-py
Google NotebookLM非官方Python API,支持批量导入源文件、生成音频播客/视频/思维导图等,提供Web UI未暴露的高级功能。
NotebookLMPython自动化
190
其他开源项目
promptfoo
LLM应用评测与红队测试工具。支持自动化Prompt评估、模型对比、安全漏洞扫描,可集成CI/CD流水线。
Prompt测试红队评测
250
其他开源项目
Hermes Agent
Nous Research出品的自我进化AI Agent,内置学习闭环。支持Telegram/Discord/Slack等多平台,可运行在$5 VPS上,兼容200+模型。
AI Agent自我进化多平台
200
其他开源项目
BettaFish 微舆
从零实现的多Agent舆情分析系统,覆盖国内外30+社媒平台,自动采集分析百万级评论数据。支持AI驱动全域监控、多模态分析、Agent论坛协作机制。
舆情分析多Agent数据分析
210
其他开源项目
MiroFish
基于多智能体的群体智能预测引擎,通过构建高保真数字世界模拟未来走向。上传种子材料,用自然语言描述预测需求,即可获得详尽预测报告和可交互的数字沙盘。
多Agent预测群体智能
220
工具开源项目
Hindsight
Agent 记忆系统,让 AI Agent 具备持续学习和经验积累能力,自动从交互中提取和复用知识
Agent记忆学习
213362
框架开源项目
OpenRAG
基于 Langflow、Docling 和 OpenSearch 构建的一站式 RAG 平台,开箱即用的检索增强生成方案
RAG搜索LangFlow
211925
框架开源项目
BitNet
微软官方 1-bit LLM 推理框架,大幅降低大模型部署成本和硬件要求,支持在 CPU 上高效运行大模型
LLM推理优化微软
4733231
其他开源项目
notebooklm-py
Google NotebookLM的非官方Python SDK,支持CLI和AI Agent集成,可编程访问NotebookLM全部功能。
notebooklmgooglepython
220
其他开源项目
Qwen-Agent
通义千问官方Agent框架,支持Function Calling、MCP协议、代码解释器、RAG及Chrome扩展等。
agentqwenmcp
180
其他开源项目
Hermes Agent
NousResearch 出品的智能Agent框架,能随使用不断成长进化,支持工具调用和多轮对话。
agentnous-researchpython
210
其他开源项目
MiroFish
简洁通用的群体智能引擎,可用于预测万物。基于群体智能算法,支持多种预测场景。
swarm-intelligencepredictionpython
250
AI开源项目
MiroFish
群体智能预测引擎,利用Swarm Intelligence实现万物预测,简洁通用,今日GitHub趋势近3000星
swarm-intelligencepredictionai
200
智能体开源项目
Hindsight
Vectorize推出的Agent记忆系统,能从交互中持续学习和积累经验,让AI Agent拥有可成长的长期记忆
agentmemoryrag
230
智能体开源项目
Page Agent
阿里巴巴开源的网页内GUI Agent,用自然语言控制网页界面,支持页面内智能操作,今日GitHub趋势1200+星
agentbrowser-automationalibaba
330
其他开源项目
Hermes Agent
NousResearch出品的AI Agent,与你一起成长的智能体,支持自适应学习和技能扩展,星标5k+。
AIAgentNousResearch
210
其他开源项目
notebooklm-py
Google NotebookLM非官方Python API,支持编程访问NotebookLM全部功能(包括Web UI未暴露的能力),可与Claude Code、Codex等AI Agent集成。
AINotebookLMAPI
200
其他开源项目
Qwen-Agent
通义千问官方Agent框架,支持Function Calling、MCP、代码解释器、RAG、Chrome扩展等,基于Qwen 3.0+构建。
AIAgentLLM
200
其他开源项目
BettaFish 微舆
人人可用的多Agent舆情分析助手,打破信息茧房,还原舆情原貌,预测未来走向。从零实现,不依赖框架,星标38k+。
AIAgent舆情分析
170
其他开源项目
MiroFish
简洁通用的群体智能引擎,可预测万物。基于群体智能算法,支持多领域预测分析,星标16k+。
AI群体智能预测
170
工具开源项目
promptfoo - Prompt 评测与红队测试
用于评测和红队测试 LLM 应用的 CLI 工具。支持自动化 prompt 评估、模型对比、安全漏洞扫描,可集成 CI/CD。MIT 开源,已为千万级用户的生产应用提供支持。
prompt-testingred-teamevaluation
3912282
框架开源项目
PageAgent - 网页内 GUI Agent
阿里巴巴开源的网页内 GUI Agent,用自然语言控制网页界面。无需浏览器扩展或截图,纯 JavaScript 实现,几行代码即可为产品添加 AI 副驾驶。
gui-agentweb-automationalibaba
204249
工具开源项目
MiroFish - 群体智能预测引擎
基于多智能体技术的 AI 预测引擎,通过构建高保真平行数字世界,让成千上万个智能体自由交互与社会演化,实现对未来走向的精准推演。支持金融信号、舆情事件、小说结局等多种预测场景。
multi-agentpredictionsimulation
3315948
其他开源项目
hermes-agent
Nous Research 打造的自我进化 AI Agent,内置学习闭环——从经验中创建技能、自动改进、跨会话记忆检索、用户建模。支持多平台,可运行在任意环境。
Agent自我进化多平台
190
其他开源项目
Qwen-Agent
基于 Qwen 3.0+ 的 Agent 开发框架,支持 Function Calling、MCP、Code Interpreter、RAG、Chrome 扩展等,已作为通义千问 Qwen Chat 的后端。
Agent框架QwenMCP
220
其他开源项目
notebooklm-py
Google NotebookLM 的非官方 Python API,支持编程方式访问 NotebookLM 全部功能,包括音频播客生成、批量导入、测验导出等 Web UI 未暴露的能力。
NotebookLMPythonAPI
220
其他开源项目
MiroFish
简洁通用的群体智能引擎,通过多智能体模拟预测万物。上传种子材料,用自然语言描述预测需求,即可获得详尽的预测报告和可交互的高保真数字世界。
多智能体预测仿真
200
框架开源项目
Nanochat - Karpathy 的百元 ChatGPT
Andrej Karpathy 最新项目,用 100 美元打造最好的 ChatGPT 替代方案,极简设计,代码精炼。
ChatGPTKarpathy极简
210
工具开源项目
Page Agent - 网页自然语言控制
阿里巴巴开源的浏览器内 GUI Agent,用自然语言控制网页界面,无需编写代码即可自动化网页操作。
AI Agent浏览器自动化阿里巴巴
233048
工具开源项目
MiroFish - 群体智能预测引擎
简洁通用的群体智能引擎,可预测万物。基于 Swarm Intelligence 理论,用 Python 实现,支持多种预测场景。今日 GitHub 4400+ star。
AI预测群体智能
2713064
其他开源项目
MiroFish
简洁通用的群体智能引擎,可预测万物。基于群体智慧方法论,Python开源项目。
群体智能预测Python
180
其他开源项目
notebooklm-py
Google NotebookLM的非官方Python API和Agent技能,支持通过Python、CLI和AI Agent完全编程访问NotebookLM功能。
NotebookLMGooglePython
180
其他开源项目
WorldMonitor
实时全球情报仪表盘——AI驱动的新闻聚合、地缘政治监控和基础设施追踪,统一态势感知界面。
情报分析新闻聚合地缘政治
190
其他开源项目
RuView
WiFi DensePose:利用普通WiFi信号实现实时人体姿态估计、生命体征监测和存在检测,完全不需要摄像头。基于Rust构建,高性能低延迟。
WiFi感知姿态估计隐私保护
360
工具开源项目
notebooklm-py
Google NotebookLM 非官方 Python API,可编程调用 NotebookLM 生成播客、摘要等内容
NotebookLMGoogleAPI
263969
框架开源项目
Impeccable
让 AI 更擅长设计的设计语言框架,由 Google 工程师开发,帮助 AI 代码助手生成更美观的 UI
设计AIUI
222494
AI 与机器学习开源项目
MiroFish
简洁通用的群体智能引擎,可预测万物。基于群体智能算法用 Python 实现,GitHub 今日热榜 2200+ star
群体智能预测Python
278696
AI 工具开源项目
claude-skills
169个生产就绪的 Claude Code / OpenAI Codex / OpenClaw 技能与插件集合,涵盖工程、营销、产品、合规等多个领域。
210
AI 工具开源项目
notebooklm-py
Google NotebookLM 非官方 Python API,可以程序化地创建笔记本、上传源文件并生成音频播客摘要。
210
AI 应用开源项目
WorldMonitor
实时全球情报仪表盘——AI驱动的新闻聚合、地缘政治监控和基础设施追踪,统一态势感知界面。本周GitHub趋势第一梯队,33k+ stars。
190
AI 与机器学习开源项目
notebooklm-py
Google NotebookLM 非官方 Python API,可编程调用 NotebookLM 的摘要、问答和播客音频生成功能,适合批量处理和自动化工作流。
GoogleNotebookLMPython
283514
开发工具开源项目
CyberStrikeAI
AI 原生安全测试平台,集成 100+ 安全工具、智能编排引擎和角色化测试能力,Go 语言构建,支持完整的安全测试生命周期管理。
安全AIGo
222047
AI 与机器学习开源项目
MiroFish
简洁通用的群体智能引擎,可预测万物。基于群体智能算法,支持股市、天气、体育等多种预测场景,Python 实现,今日 GitHub 399 星。
AI群体智能预测
376303
其他开源项目
Hermes Agent
NousResearch 出品的可成长 AI Agent 框架,支持自主学习和持续进化
agentpythonnous-research
230
其他开源项目
Scrapling
自适应 Web 爬虫框架,支持从单个请求到大规模爬取的全场景,内置反检测和智能解析能力
pythonweb-scrapingcrawler
210
框架开源项目
Page Agent
阿里巴巴开源的网页内 GUI Agent,用自然语言控制网页界面。无需浏览器插件、截图或多模态模型,纯 JavaScript 实现,一行代码即可集成到任何 Web 应用,适合构建 AI Copilot 和智能表单填写。
gui-agentweb-automationalibaba
32936
框架开源项目
OpenAI Skills
OpenAI 官方发布的 Codex Agent Skills 目录,定义了一套可复用的指令、脚本和资源包标准,让 AI Agent 能自动发现和执行特定任务。支持自定义 Skill 创建和分发。
openaicodexagent-skills
3512378
AI 工具开源项目
MiroFish
基于多智能体技术的群体智能预测引擎,通过构建高保真平行数字世界,让成千上万个具备独立人格和长期记忆的智能体进行自由交互与社会演化,精准推演未来走向。支持金融预测、舆情分析、小说推演等场景。
multi-agentpredictionsimulation
285185
其他开源项目
Khoj
你的AI第二大脑,可自托管的个人AI助手。支持从网页或文档中获取答案,构建自定义Agent和深度研究
AI-assistantself-hostedRAG
210
其他开源项目
Hello Agents
Datawhale出品的从零开始构建智能体中文教程,从原理到实践手把手教你构建AI Agent
tutorialagentChinese
190
其他开源项目
MobileAgent
阿里X-PLUG开源的移动端GUI Agent系列,支持多模态理解手机屏幕并自动执行操作,是GUI自动化的标杆项目
agentmobileGUI
210
其他开源项目
Hermes Agent
NousResearch 出品的自适应AI Agent框架,支持工具调用、记忆管理和持续学习,号称与你一起成长的Agent
agentNousResearchtool-use
180
其他开源项目
HVE Core
微软出品的企业级 Prompt 工程框架,为 GitHub Copilot 提供约束驱动的 AI 工作流。内置 RPI(Research→Plan→Implement)方法论、专用 Agent 和 JSON Schema 验证,适合个人到大型团队。
微软CopilotPrompt工程
200
其他开源项目
Webnovel Writer
基于 Claude Code 的长篇网文辅助创作系统,用 RAG + 实体图谱解决 AI 写作的遗忘和幻觉问题,支持 200 万字量级连载创作,内置追读力系统和可视化 Dashboard。
AI写作Claude Code网文
230
其他开源项目
SEO Machine
基于 Claude Code 的 SEO 长文写作工作站,内置 /research、/write、/optimize 等专用命令和 26 个营销 Skills,集成 GA4 和 Search Console 数据源,帮你批量产出高排名博客内容。
SEOClaude Code内容创作
210
其他开源项目
test
test
220
其他开源项目
Khoj
自托管的 AI 第二大脑,支持联网搜索、本地文档问答、自定义 Agent、定时自动化和深度研究,兼容主流 LLM。⭐ 33k
ai-assistantself-hostedrag
240
其他开源项目
AReaL
华为 inclusionAI 开源的 LLM 强化学习框架,专注推理和 Agent 能力提升,速度快、灵活易扩展。⭐ 4k
reinforcement-learningllmreasoning
390
其他开源项目
hello-agents
Datawhale 出品的《从零开始构建智能体》教程,系统讲解 Agent 原理与实践,适合入门学习。中文教程,配套代码。⭐ 25.4k
agenttutorialchinese
230
其他开源项目
MobileAgent
阿里 X-PLUG 出品的移动端 GUI Agent 系列,支持多模态视觉感知和自主操作手机界面,可用于自动化测试和手机助手场景。⭐ 7.9k
agentmobilegui
210
安全开源项目
Trivy
一站式安全扫描器:容器、K8s、代码仓库、云环境的漏洞、配置错误和密钥泄露检测,DevSecOps必备工具。
安全扫描容器安全DevSecOps
6032778
AI 与机器学习开源项目
AReaL
蚂蚁集团开源的LLM推理与Agent强化学习框架,极速训练,简洁灵活,让大模型推理能力更上一层楼。
强化学习LLM推理
323930
写作开源项目
SEO Machine
基于 Claude Code 的 SEO 长文内容工作站,自动调研、撰写、分析并优化排名靠前的博客内容,适合任何业务场景。
SEOClaude Code内容生成
241271
工具开源项目
Codex CLI
OpenAI的终端编程Agent,在命令行中通过自然语言编写和运行代码
OpenAI终端Agent
210
工具开源项目
Claude Code
Anthropic的终端AI编程工具,直接在命令行与Claude协作编码
终端AI编程Anthropic
200
工具开源项目
Windsurf
AI-first代码编辑器,深度集成AI进行智能编码和项目理解
代码编辑器AI-first智能编码
180
工具开源项目
Roo Code
VS Code AI编程扩展,支持多种模型和自定义工作模式
VSCodeAI编程多模型
200
工具开源项目
MindSearch
开源的AI搜索引擎框架,模拟人类思维进行多步搜索和推理
AI搜索多步推理思维模拟
200
工具开源项目
STORM
斯坦福开源的AI长文写作系统,自动研究并生成维基百科级别的文章
长文写作自动研究斯坦福
200
框架开源项目
AG2 (AutoGen v2)
微软AutoGen的下一代版本,更灵活的多Agent对话和编排
微软多Agent对话编排
180
框架开源项目
Mastra
TypeScript AI Agent框架,支持工作流、RAG和多Agent编排
TypeScriptAgent工作流
200
框架开源项目
MCP (Model Context Protocol)
Anthropic开源的模型上下文协议,标准化AI与外部工具的连接方式
协议Anthropic工具连接
180
工具开源项目
Stagehand
Browserbase开源的AI网页自动化SDK,用自然语言控制浏览器
网页自动化自然语言浏览器
200
工具开源项目
Browser Use
让AI Agent像人一样浏览网页,执行点击、输入和导航操作
浏览器自动化Agent网页操作
180
框架开源项目
Smolagents
HuggingFace开源的轻量Agent库,简洁API构建工具调用Agent
HuggingFace轻量Agent
200
框架开源项目
Pydantic AI
基于Pydantic的Agent框架,类型安全的AI应用开发
Pydantic类型安全Agent
300
智能体开源项目
OpenHands
AI驱动的软件开发Agent,可以编写代码、修复Bug和管理项目
软件开发AgentBug修复
240
框架开源项目
LangServe
将LangChain链和Agent部署为REST API的一键工具
部署LangChainREST API
220
工具开源项目
Unstructured
从PDF、Word、HTML等非结构化文档中提取干净文本和元数据
文档提取非结构化ETL
200
工具开源项目
Verba
开源的RAG聊天机器人,由Weaviate驱动,支持多种嵌入和LLM
RAG聊天机器人Weaviate
190
工具开源项目
Khoj
开源的个人AI助手,可搜索笔记、文档和互联网,支持自托管
个人AI笔记搜索自托管
200
工具开源项目
Perplexica
开源的AI搜索引擎,Perplexity替代品,支持多种搜索模式
AI搜索Perplexity替代开源
180
工具开源项目
Danswer
企业级AI搜索和问答助手,连接公司内部文档和工具
企业搜索问答内部文档
230
框架开源项目
E2B
为AI Agent提供安全沙箱环境的云基础设施,安全执行AI生成的代码
沙箱安全执行云基础设施
200
框架开源项目
Composio
为AI Agent提供200+工具集成的平台,连接GitHub、Slack、数据库等
工具集成Agent200+工具
230
智能体开源项目
OpenDevin
开源的AI软件工程Agent平台,可以像人类开发者一样编写和调试代码
AI开发者Agent代码编写
250
框架开源项目
Gradio
快速为机器学习模型构建Web演示界面,支持多种输入输出类型
Web演示ML模型界面构建
240
框架开源项目
Streamlit
用Python快速构建数据和AI应用的Web框架,几行代码即可部署
Web框架Python数据应用
230
框架开源项目
Chainlit
快速构建AI聊天应用的Python框架,支持流式、多模态和人在回路
聊天应用Python流式
590
工具开源项目
Promptfoo
LLM评测和红队测试工具,系统化评估prompt质量和模型安全
评测红队测试Prompt优化
230
框架开源项目
Guardrails
为LLM输出添加结构化验证和安全护栏,防止幻觉和格式错误
安全护栏验证防幻觉
180
框架开源项目
Instructor
结构化数据提取库,让LLM可靠地输出符合Pydantic模型的JSON
结构化输出PydanticJSON
190
智能体开源项目
Sweep
AI驱动的GitHub Bot,自动将issue转为PR,处理bug修复和小功能
GitHub Bot自动PRBug修复
200
工具开源项目
GPT4All
在任何设备上运行开源LLM的桌面聊天应用,完全离线隐私
离线桌面应用隐私
180
工具开源项目
LM Studio
在笔记本电脑上发现、下载和运行本地LLM的桌面应用
桌面应用本地LLM易用
180
工具开源项目
Stirling PDF
功能强大的自托管PDF工具,支持AI辅助的PDF编辑和转换
PDF工具自托管编辑转换
210
工具开源项目
Immich
自托管的Google Photos替代品,支持AI人脸识别和物体搜索
照片管理AI识别自托管
180
工具开源项目
Screenshot to Code
上传截图自动生成前端代码,支持HTML/Tailwind/React/Vue等
截图转代码前端自动生成
180
工具开源项目
Manim
3Blue1Brown制作数学动画的Python引擎,可用AI辅助生成教学动画
数学动画教学Python
240
模型开源项目
Style-TTS 2
人类水平的文本转语音模型,自然度评分接近真人
TTS自然语音人类水平
200
模型开源项目
Xtts
Coqui开源的多语言TTS模型,支持语音克隆,仅需6秒参考音频
TTS语音克隆多语言
200
模型开源项目
CogVideo
智谱开源的文生视频模型CogVideoX,支持多种分辨率和时长
智谱文生视频多分辨率
200
模型开源项目
Open Sora
复现Sora视频生成的开源项目,支持文字和图片生成视频
Sora视频生成开源
210
工具开源项目
LobeHub TTS
开源的高质量TTS工具包,支持多种TTS引擎和语音
TTS语音合成多引擎
190
模型开源项目
Stable Diffusion 3
Stability AI最新的文生图模型,基于MMDiT架构,质量大幅提升
Stability AI文生图MMDiT
190
模型开源项目
Llama 3
Meta开源的第三代Llama模型,8B和70B版本,多语言支持
MetaLlama开源
250
模型开源项目
Phi-3
微软开源的小型语言模型,3.8B参数性能超越同级别所有模型
微软小型模型高效
190
模型开源项目
Gemma 2
Google开源的轻量大模型,2B和9B版本,适合本地部署
Google轻量本地部署
200
模型开源项目
DeepSeek-V3
深度求索开源的MoE大模型,671B参数37B激活,性能媲美GPT-4
DeepSeekMoE开源
180
模型开源项目
Mistral
Mistral AI开源的高效大语言模型系列,以小参数实现强大性能
Mistral高效小参数
250
模型开源项目
Qwen2.5
阿里通义千问开源模型,多种规格可选,中英文能力领先
阿里通义千问中英文
190
模型开源项目
Yi
零一万物开源的大语言模型系列,支持多种规格和多模态
零一万物大模型多模态
180
模型开源项目
GLM-4
智谱AI开源的双语对话模型,支持128K上下文,多模态理解
智谱双语128K
180
模型开源项目
Kling AI
快手开源的视频生成模型,支持文生视频和图生视频
视频生成快手文生视频
180
模型开源项目
MuseV
基于扩散模型的虚拟人视频生成框架,支持无限长度视频
虚拟人视频生成扩散模型
180
工具开源项目
Pika
AI视频生成工具,将文字和图片转为高质量短视频
视频生成文生视频图生视频
210
模型开源项目
FLUX
Black Forest Labs的开源文生图模型,质量媲美Midjourney
文生图图像生成开源
180
模型开源项目
Segment Anything 2
Meta的通用图像和视频分割模型,零样本分割任何物体
Meta图像分割视频分割
180
框架开源项目
Supervision
计算机视觉工具库,简化目标检测、分割和跟踪的可视化与分析
计算机视觉目标检测跟踪
180
工具开源项目
Surya
多语言OCR和文档分析工具,支持90+种语言,准确率极高
OCR多语言文档分析
220
工具开源项目
Marker
快速准确的PDF转Markdown工具,支持表格、公式和代码块
PDFMarkdown转换
360
工具开源项目
MinerU
一站式开源数据提取工具,将PDF转为Markdown和JSON,支持OCR
数据提取PDFOCR
340
工具开源项目
Docling
IBM开源的文档解析工具,将PDF、DOCX等转为Markdown,支持表格和公式
文档解析PDFMarkdown
310
工具开源项目
Activepieces
开源的Zapier替代品,支持AI驱动的自动化工作流构建
自动化Zapier替代工作流
180
工具开源项目
n8n
工作流自动化平台,支持AI节点,将LLM集成到自动化流程中
工作流自动化集成
240
工具开源项目
Bolt.new
StackBlitz出品的AI全栈开发工具,在浏览器中通过对话构建完整应用
全栈浏览器开发StackBlitz
230
工具开源项目
Cline
VS Code中的自主编程Agent,可以创建文件、执行命令、使用浏览器
VSCode编程Agent自主
220
智能体开源项目
Replit Agent
AI驱动的全栈应用生成器,通过对话生成完整的可部署web应用
全栈应用生成Web
310
智能体开源项目
SWE-agent
普林斯顿开源的自动修Bug Agent,可在GitHub上自动定位和修复代码问题
自动修BugGitHub普林斯顿
200
智能体开源项目
Devika
开源的AI软件工程师,类似Devin,可以理解需求并独立编写代码
AI工程师Devin替代代码生成
180
智能体开源项目
TaskWeaver
微软开源的代码优先Agent框架,擅长处理数据分析和自动化任务
微软Agent数据分析
190
工具开源项目
Quivr
你的第二大脑,使用RAG将文档、网页和笔记变成可对话的知识库
第二大脑知识库RAG
210
框架开源项目
DB-GPT
AI原生数据应用开发框架,支持AWEL和Agent的多模型数据驱动应用
数据应用数据库Agent
200
工具开源项目
MaxKB
基于大模型的企业级知识库问答系统,开箱即用,支持多种文档格式
知识库企业级问答
190
工具开源项目
LibreChat
增强版ChatGPT克隆,支持多种AI服务商、插件和多模态交互
ChatGPT克隆多服务商插件
190
工具开源项目
Lobe Chat
开源的高性能AI聊天框架,支持多模型、插件系统和知识库
聊天框架多模型插件
210
工具开源项目
InvokeAI
专业级AI图像生成工作站,提供画布编辑、ControlNet和工作流管理
图像生成画布编辑专业级
200
工具开源项目
Fooocus
Stable Diffusion的极简界面,无需调参即可生成高质量图像
图像生成Stable Diffusion极简
180
模型开源项目
Bark
Suno开源的文本转音频模型,支持语音、音乐、背景音效和非语言声音
音频生成TTS音乐
230
模型开源项目
Fish Speech
开源TTS模型,支持多语言零样本语音克隆,延迟低至150ms
TTS语音克隆多语言
190
模型开源项目
ChatTTS
专为对话场景优化的文本转语音模型,支持中英文,韵律自然
TTS语音合成对话
190
模型开源项目
MiniCPM
面壁智能开源的端侧大模型系列,2B参数媲美7B效果,支持手机部署
端侧模型轻量手机部署
240
工具开源项目
Crawl4AI
为AI和LLM优化的异步网页爬虫,自动提取结构化数据
爬虫异步结构化数据
190
工具开源项目
Firecrawl
将网页转为LLM可用的干净Markdown数据,支持爬取整个网站
网页爬取Markdown数据清洗
190
智能体开源项目
ExUI (Open Interpreter)
让LLM在本地运行代码,通过自然语言控制电脑,执行Python、Shell等
代码执行自然语言本地运行
190
工具开源项目
llama.cpp
纯C/C++实现的LLM推理引擎,支持CPU和多种硬件,轻量高效
C++CPU推理轻量
200
工具开源项目
TensorRT-LLM
NVIDIA的LLM推理优化库,在GPU上实现极致推理性能
NVIDIA推理优化GPU
180
框架开源项目
Semantic Kernel
微软开源的AI编排SDK,将LLM与传统编程语言集成,支持插件和计划
微软SDK编排
190
框架开源项目
LlamaIndex
LLM数据连接框架,将私有数据与大模型连接,构建知识增强的AI应用
数据连接RAG知识增强
190
工具开源项目
Aider
终端中的AI编程助手,通过对话直接编辑代码文件,支持Git集成
终端AI编程Git
200
工具开源项目
Continue
开源AI代码助手IDE插件,支持VS Code和JetBrains,可连接任何LLM
IDE插件代码助手VSCode
210
工具开源项目
SillyTavern
面向高级用户的AI角色扮演聊天前端,支持多种LLM后端和丰富的自定义选项
角色扮演聊天前端
470
框架开源项目
Mem0
智能记忆层,为AI应用添加持久化个性化记忆,支持用户级和会话级记忆
记忆个性化上下文
210
框架开源项目
Haystack
端到端的NLP/LLM应用构建框架,支持RAG、问答、语义搜索等
NLPRAG搜索
210
工具开源项目
OpenRouter
AI模型路由平台,一个API访问数百种AI模型,自动选择最优模型
模型路由API多模型
190
工具开源项目
LiteLLM
统一的LLM API代理,用OpenAI格式调用100+种LLM,包括Azure、Anthropic、Ollama等
API代理多模型统一接口
200
框架开源项目
Phidata
构建具有记忆、知识和工具的AI助手框架,支持多模态和多Agent
AI助手记忆知识库
220
智能体开源项目
AutoGen
微软开源的多Agent对话框架,支持Agent之间自动对话协作解决问题
微软多Agent对话
200
智能体开源项目
CrewAI
多智能体协作框架,让AI代理像团队一样分工协作完成复杂任务
多智能体协作Agent
210
工具开源项目
Tabby
自托管的AI代码助手,GitHub Copilot的开源替代品,支持本地部署
代码补全Copilot替代自托管
190
智能体开源项目
GPT Engineer
一句话描述需求,AI自动生成完整代码项目,支持迭代改进
代码生成自动化全栈
200
工具开源项目
Cursor
AI驱动的代码编辑器,基于VSCode,集成GPT-4和Claude进行智能代码补全和对话
代码编辑器AI编程VSCode
210
工具开源项目
AnythingLLM
全能AI文档助手,支持多种LLM和向量数据库,提供完整的RAG管道
文档助手RAG多模型
190
框架开源项目
Langflow
用于RAG和多Agent AI应用的可视化框架,支持拖拽构建和Python自定义
可视化RAGAgent
190
工具开源项目
Flowise
拖拽式LLM应用构建工具,可视化编排LangChain流程,零代码构建AI工作流
低代码可视化LangChain
220
工具开源项目
Jan
开源的ChatGPT桌面替代品,100%离线运行,支持Llama、Mistral等多种模型
桌面应用离线ChatGPT替代
210
工具开源项目
LocalAI
开源的OpenAI API替代品,支持本地运行LLM、图像生成和音频转录,完全离线
本地部署API离线
190
工具开源项目
PrivateGPT
100%私有化的文档问答系统,无需互联网,支持本地运行LLM进行文档交互
隐私RAG本地部署
180
智能体开源项目
AutoGPT
自主AI代理框架,让GPT-4可以自主完成复杂任务,自动设定目标、分解步骤并执行
AI Agent自主GPT-4
200
工具开源项目
英伟达的一个3D生成项目:Edify 3D,可在2分钟内生成高质量、可用于生产的3D模型,还可以生成复杂的3D场景
英伟达的Edify 3D项目能够在2分钟内生成高质量的3D模型和复杂场景,提供精细的几何网格、整洁的拓扑、规范的UV贴图、4K纹理和完整的PBR材质系统。相较于其他文本到3D工具,Edify 3D在形状和纹理质量、效率和可扩展性方面表现优异,支持文本或图片生成3D
3D生成模型
190
工具开源项目
酷,一个快速生成3D内容的AI工具:DiffSplat,可以根据文本或图像1-2秒即可生成对应的3D内容
DiffSplat是一个快速生成3D内容的AI工具,能够在1-2秒内根据文本或图像生成高质量的3D内容,支持ControlNet进行精细控制,非常适合快速迭代或实时生成的场景。
3D生成AI
190
工具开源项目
一款高保真单张图像到3D生成模型:TripoSG,15亿参数,能处理复杂的图像特征
TripoSG是一个高保真的单张图像到3D生成模型,拥有15亿参数,结合了修正流的线性轨迹建模与Transformer架构,能够稳定建模3D物体形状,处理照片、卡通和草图
3D生成模型
200
工具开源项目
腾讯混元3D生成模型刚刚放出了最新版:v2.5,总参数量从1B提升到了10B,有效面片数增加了超过10倍
腾讯混元3D生成模型v2.5发布,参数量从1B提升至10B,有效面片数增加10倍,支持多视图PBR贴面、4K高清纹理和细粒度bump贴图,优化骨骼蒙皮系统,提升3D动画生成效率
3D生成模型
190
工具开源项目
腾讯又最新开源了通用3D重建模型:HunyuanWorld-Mirror,加了多样化输入,视频/多视角图也可一键生成3D世界
腾讯开源了HunyuanWorld-Mirror模型,支持视频和多视角图生成高质量3D世界,使用前馈式架构可同时生成多种三维表示,适用于电商、博物馆文物数字化等场景
3D生成开源模型
200
工具开源项目
酷啊,阿里放出了一个能从单张图像几秒钟重建出可动画化的3D数字人模型:LHM,支持实时渲染、姿态控制
阿里推出了LHM,一个可以从单张图像几秒钟重建可动画化的3D数字人模型,支持实时渲染和姿态控制,效果逼真,细节处理优秀。
3D数字人生成模型
190
工具开源项目
一款快速生成超大规模的3D城市模型:GaussianCity,比现有CityDreamer方案快60倍
GaussianCity是一款快速生成超大规模3D城市模型的工具,速度达到10.72 FPS,比现有方案快60倍,支持无边界城市生成,采用BEV-Point作为中间表示,结合空间感知解码器实现高质量渲染。
3D城市生成模型模型
210
工具开源项目
一个3D人体模型生成项目:StructLDM,它可以生成完整的3D人体,还支持部分编辑修改,比如更换服装、改变姿势等
StructLDM是一个开源项目,能够生成完整的3D人体模型,支持不同姿势和视角的生成,以及服装和体型的编辑修改,允许局部试穿和身份交换等功能。
3D人体生成模型
220
工具开源项目
一款从单张图像重建人体3D骨骼和网格模型的系统:HSMR,可以把一张普通人物照片转换成具有生物力学准确骨骼结构的3D人体模型
HSMR系统能够从单张图像重建生物力学准确的3D人体骨骼和网格模型,适用于复杂姿势和不佳拍摄角度,并提供了创建伪真实数据集的方法以训练其他模型。
3D人体模型生成模型
200
工具开源项目
腾讯开源了其3D世界生成模型:HunyuanWorld 1.0,能生成沉浸式、可探索、可交互的3D世界
从效果看,生成的画面质量较高,细节表现上比较丰富,有一定的物理仿真能力。同时支持文生、图生,风格多样化,生成场景可360°沉浸式漫游。支持网格导出,可与现有计算机图形管线无缝兼容
3D世界生成开源模型
220
工具开源项目
李飞飞World Labs的生成式多模态世界模型:Marble 刚刚已发布,一张图片/视频/文本提示/3D布局,即生成高保真3D世界
Marble是李飞飞World Labs发布的生成式多模态世界模型,支持通过图片、视频、文本提示和3D布局生成高保真3D世界。用户可以进行二次创作,修改材质和风格,并导出高斯溅射和三角网格,适用于游戏和影视制作
3D世界生成模型
190
工具开源项目
微软和新加坡国立大学出的一个3D/4D场景生成项目:GenXD,能同时处理3D和4D场景生成
GenXD是微软与新加坡国立大学合作开发的3D/4D场景生成项目,能够同时处理3D和4D场景生成,生成的视频遵循相机轨迹,保持物体形态一致,支持3D格式转换,适用于虚拟现实、游戏和建筑可视化。该模型支持现实世界和合成数据集的处理,提供单/多视图的3D和4D生成。
3D/4D生成模型
270
工具开源项目
从单张图像即可生成可控的3D4D场景的框架:DimensionX,它能精确控制生成过程,,可以生成360度全方位视角
DimensionX是一个框架,可以从单张图像生成可控的3D4D场景,支持360度全方位视角和多种相机控制模式。通过ST-Director实现对视频生成的空间和时间维度的精确控制,能够生成连贯的多视角视频序列,同时保持场景一致性并支持时空变化
3D/4D生成模型
200
工具开源项目
谷歌的一个从单目视频生成4D场景(动态3D)的项目:CAT4D
谷歌的CAT4D项目能够从单目视频生成动态3D场景,支持分离控制相机视角和时间,并提供三种输出模式。该项目在重建效果上优于其他模型,适用于真实或生成的视频,主要用于电影特效。目前仅支持Chrome 130+浏览器。
3D/4D生成模型
210
工具开源项目
非常酷,腾讯刚刚开源了其最新3D生成模型:混元3D的2.0版,生成的几何结构更细致,纹理颜色更丰富,性能超过了现有开源和商业模型
腾讯开源了混元3D的2.0版,具备更细致的几何结构和丰富的纹理颜色,支持高分辨率3D资产生成,并包含几何生成和纹理合成模型,提供便捷的生产平台Hunyuan3D-Studio。
3D/4D生成模型开源模型
200
工具开源项目
一款AI网页浏览自动化工具:Stagehand,它可以帮你在网页上执行点击、输入、搜索等操作,自然语言交互
Stagehand是一款AI网页浏览自动化工具,支持点击、输入、搜索等操作,并能通过自然语言交互。它具备视觉识别功能,能够分析网页结构,提取结构化数据,进行自动化测试和记录操作日志,且具有轻量级和可配置的特点
开源AI
190
工具开源项目
一款给Claude Code用的"Visio"插件:cc-wf-studio,零代码拖拖拽拽拼出Claude Code自动化工作流
cc-wf-studio是一个为Claude Code设计的无代码插件,支持复杂的工作流创建,包括分支、循环和用户交互。用户可以通过图形界面设计工作流,并导出为.claude格式文件,内置AI优化功能可自动调整节点和线路
无代码平台
230
工具开源项目
给定一条视频链接可自动生成手绘故事板的AI工具:clipsketch-ai,并自动适配自媒体平台文案,一键推文
clipsketch-ai是一款AI工具,可以根据视频链接自动生成手绘故事板,并适配自媒体平台的文案,支持批量生成和优化分镜,用户可上传自定义角色融入场景,支持解析Bilibili和小红书的视频链接
自媒体工具AI
370
工具开源项目
阿里数字人框架:HRM2Avatar,一部手机单目自拍即能跑出90–120FPS、2K分辨率高保真数字人
HRM2Avatar框架支持在iPhone 15 Pro Max上以120 FPS和Apple Vision Pro上以90 FPS的速度生成高保真的数字人,具有2K分辨率,能够实时还原人物的几何形态、面部特征及衣服褶皱和光影变化
数字人
180
工具开源项目
一款AI编程智能体任务看板工具:Vibe Kanban,帮你把AI编程效率再放大10倍
Vibe Kanban是一款AI编程智能体任务看板工具,能显著提高编程效率。它支持多个Agent的任务管理,实时监控状态和结果,自动创建git分支并提交变更,方便开发者进行代码审查和Pull Request。用户可通过集中管理的MCP配置和详细日志跟踪任务执行情况
AI编程AI
200
工具开源项目
一套Claude的科学技能包库:claude-scientific-skills,138个即插即用的科学技能,20+领域
提供138个即插即用的科学技能,涵盖生物信息学、药物发现、材料科学和临床研究等20多个领域,帮助科研人员加速研究、处理数据和进行科学教育
claude skills
190
模型开源项目
蚂蚁健康等刚刚开源了一款医疗语言模型:AntAngelMed
蚂蚁健康开源的医疗语言模型AntAngelMed基于Ling-flash-2.0的MoE架构,具有100B总参数和6.1B激活参数,推理速度超过200 tokens/s,支持128K上下文。在HealthBench基准测试中排名第一,经过三阶段训练,具备强大的医学知识和复杂诊疗推理能力,适用于复杂病例解析和日常健康问答
医疗大模型开源模型
250
模型开源项目
上海人工智能实验室把【InternVLA-A1】开源了,一款视觉-语言-动作端到端的统一模型
上海人工智能实验室开源了InternVLA-A1,一个视觉-语言-动作的统一模型,能够在自然语言提示下执行任务,如"把桌上的笔放进笔筒",无需预设坐标,解决了传统感知与行动间的信息丢失问题,支持多模态感知和理解
VLA开源模型
200
工具开源项目
集全球数据、CFA级算法和AI策略的金融应用:FinceptTerminal,可以用它辅助选股、估值、做组合等
FinceptTerminal是一款金融应用,结合全球数据、CFA级算法和AI策略,支持选股、估值和组合管理。它能够连接多种数据源,内置多种投资策略,用户可通过拖拽现成模块进行分析,简化投资决策过程
AI金融AI
270
工具开源项目
英伟达最新开源的一款ASR:Nemotron Speech ASR,专攻低延迟实时语音智能体场景,多人同时对话不爆延迟
英伟达推出的Nemotron Speech ASR专注于低延迟实时语音处理,支持多人对话,单句转录时间仅需24毫秒,整体延迟低于500毫秒。通过FastConformer架构和缓存感知机制,语音特征实现增量计算,动态配置延迟模式以满足不同应用需求
ASR开源
260
模型开源项目
基于DiT的音视频基础模型:LTX-2 已开源,19B,直接输出画面+旁白+现场音效视频
LTX-2是基于DiT的音视频生成模型,已开源,支持直接输出画面、旁白和现场音效。该模型在NVIDIA H100上比Wan 2.2-14B快约18倍,适合快速生成短视频和广告,但在多人对白时可能会出现混乱
视频生成模型开源模型
210
模型开源项目
阿里高德地图也搞了一款世界模型:FantasyWorld,目前在WorldScore世界模型排行榜几个关键指标上排名第一
阿里高德地图推出的世界模型FantasyWorld在WorldScore排行榜上排名第一,旨在通过统一视频生成和3D预测解决现有视频模型在3D理解上的不足,提升空间一致性和3D推理能力。该模型支持AR/VR内容生成和机器人导航,适用于导航、快速装修和电商展示等多种3D任务场景
世界模型模型
200
模型开源项目
英伟达放出了:Cosmos Reason 2,最新推理视觉语言模型,专攻物理AI,上下文长度256K
英伟达推出了Cosmos Reason 2,这是一个专注于物理AI的最新推理视觉语言模型,支持上下文长度达到256K。该模型提升了时空理解和时间戳精度,能够进行2D/3D点定位、边界框坐标、轨迹数据和OCR,输出机器人动作和运动轨迹,适用于视频分析、数据标注和安全检测等应用。提供2B和8B两种型号
VLMAI模型
260
模型开源项目
阿里刚刚放出了最新模型:Qwen3-VL-Embedding和 Qwen3-VL-Reranker,核心是多模态信息搜索
阿里推出了Qwen3-VL-Embedding和Qwen3-VL-Reranker模型,支持多模态信息搜索,包括文字搜图和图搜视频。该组合通过Embedding和Reranking的两阶段检索流程,提高了搜索效率,支持30多种语言,Embedding-8B在MMEB-V2上表现优异
大模型模型
370
工具开源项目
香港大学HKUDS出的一款爆火工具,AI个性化学习工具:DeepTutor,它解决了资料太多找不到答案、没人讲/复杂知识不理解、没人出题三件事
DeepTutor是一款AI个性化学习工具,能够解决资料查找困难、复杂知识理解不足和缺乏练习题的问题。它通过交互式可视化学习,将复杂概念拆解为直观的图解,并根据用户的知识水平和学习目标生成练习题或模拟卷,极大提高学习效率
AI学习AI
230
工具开源项目
一款Claude Code插件:CallMe,在Claude完成任务、卡住或需要决策时,它可以主动电话呼叫
CallMe是一款Claude Code插件,可以在Claude完成任务或遇到决策时主动拨打电话,用户无需盯着电脑屏幕。它支持多轮语音对话,通话中可以调用搜索、运行代码和读写文件,兼容智能手机、智能手表和座机
AI电话助手
210
工具开源项目
Superpowers:可以用到Claude Code的一款完整开发工作流,让AI动手写代码前按流程"想清楚",来降低写出的代码跑偏、返工、烂尾概率
Superpowers是一个完整的开发工作流,旨在帮助AI在编写代码前进行系统性思考,降低代码出错和返工的概率。通过将每一步拆分为可验证的小任务,AI可以自主完成并交叉检查,人工仅在关键节点做决策,从而提升AI的编程能力
claude skillsAI
180
工具开源项目
最近超火🔥,Vercel Labs开源的一个"AI-JSON-UI"的项目:json-render,解决AI输出UI不统一、难管控的问题
Vercel Labs开源的json-render项目通过定义组件和属性的Schema,解决了AI生成UI不统一的问题,实现了快速渲染和可审计的生成式UI,用户可以一键生成完整的React源码,适用于数据看板和动态表单等场景
生成式UIAI开源
190
工具开源项目
一款长视频会议纪要、访谈节目精剪、课程速览的AI神器:whisperVideo
whisperVideo是一款AI工具,能够将长视频中的语音转为文字,并自动识别说话人,将内容与画面中的人脸对应,生成带有说话人ID的字幕和可视化面板。它支持小时级素材,自动分场景和段落,适用于访谈、电影剪辑和会议纪要回顾。使用WhisperX进行文本转录,Pyannote进行说话人分离,结合SAM3进行人脸检测,最终整合所有信息生成字幕和面板视图
视频转录AI
210
工具开源项目
最新出的1B端到端OCR:LightOnOCR-2-1B,单卡H100每秒5.7 页,每千页成本不到0.01美元
最新的LightOnOCR-2-1B模型在OlmOCR-Bench上表现优异,速度比OlmOCR快1.7倍,能处理复杂文档和多语言内容,单卡H100每秒处理5.7页,每千页成本低于0.01美元
OCR
190
工具开源项目
实时多AI协作的一款工具:Claude Code Bridge,让 Claude、Codex、Gemini、OpenCode在同一界面并排干活,全程可见可控可续
Claude Code Bridge是一款实时多AI协作工具,支持Claude、Codex、Gemini和OpenCode在同一界面并行工作。每个模型可本地持久化对话历史,支持一键恢复。该工具采用纯CLI工作流,自动布局,适合代码评审、架构设计和故障排查等任务
CLIAI开源
240
工具开源项目
这两天超火的一款AI短剧自动生成工具:Huobao Drama,剧本、角色、分镜、视频合成全流程自动化
Huobao Drama是一款热门的AI短剧自动生成工具,能够从创意构思到最终视频产出全流程自动化。它使短剧制作变得高效,1人1电脑1小时即可完成,适合快速验证概念和制作定制短剧,尤其是在追热点方面表现突出
视频生成AI
240
工具开源项目
溜,覆盖30+常用场景的clawdbot-skills库:awesome-clawdbot-skills
clawdbot-skills库提供了30多个常用场景的技能,涵盖前端开发、DevOps、自动化、理财、健康、智能家居等多个领域,用户可以在此找到现成的解决方案
skills
250
框架开源项目
来一条硬核【Claude Code全家桶配置】,10个月实战踩坑沉淀成1个插件,让Claude Code直接升级"职业"水平
这是一套系统化的Claude Code配置插件,经过10个月的实战经验总结,旨在提升编程效率。配置涵盖agent、skill、hooks等多个方面,支持高产和多实例并行使用。用户可以根据需要进行二次修改,避免工具过多导致内存问题,并提供动态平衡的使用建议
学习与教程
210
工具开源项目
溜,DeepSeek刚刚把DeepSeek-OCR-2放出来了,最新OCR,主打一个更像人类的视觉编码方式
DeepSeek-OCR-2是最新的OCR工具,采用更像人类的视觉编码方式,能够将整页作为"视觉因果流"处理,支持复杂排版、手写、公式和表格的转换为Markdown。其在OmniDocBench v1.5上得分91.09%,比前一代提升3.73%。该模型支持动态分辨率,能够自适应不同尺寸和布局的文档图像,提升了实用性
OCR
190
工具开源项目
GitHub超火项目,可以把Mermaid文本图表秒变高颜值图表的一个轻量级渲染工具:beautiful-mermaid
beautiful-mermaid是一个轻量级渲染工具,可以将Mermaid文本图表快速转换为高颜值图表,支持输出SVG和ASCII/Unicode框线图,具有清晰度和美观性。它内置15种主题,零DOM依赖,适用于文档、CLI和AI使用,加载VS Code主题后可一键套用
AI图表生成
200
工具开源项目
智谱刚刚又炸出来款OCR:GLM-OCR,PDF每秒1.86页,1元能跑2000张A4扫描图片,0.9B,可边缘部署
GLM-OCR是一款高效的OCR工具,处理PDF文档的速度为每秒1.86页,能够以1元处理约2000张A4扫描图片,成本仅为传统OCR的十分之一。它支持手写体、复杂表格和多语言混排,适合高并发和边缘部署,且在OmniDocBench V1.5上获得94.6分的高分。可通过vLLM、SGLang和Ollama进行部署,降低推理延迟与算力开销
OCR
210
框架开源项目
手把手教你手搓一个AI编程Agent的教程:learn-claude-code,从零搭建
提供了一个从零开始搭建AI编程Agent的教程,涵盖模型与工具的循环使用,逐步增加工具数量和功能,适合不同需求的学习路径,代码行数从50到550不等,适合教学和实际应用
学习与教程AI
230
模型开源项目
阿里刚刚把最新80B激活3B的MoE编程模型:Qwen3-Coder-Next开源了
阿里开源了最新的80B激活3B的MoE编程模型Qwen3-Coder-Next,擅长长时程和多工具的编程任务,解决率超过70%。该模型能够理解需求、编写代码、与环境交互并完成任务,支持本地IDE插件、CLI Agent和企业内网部署
LLM开源模型
350
工具开源项目
Mistral刚刚放出了最新款语音转文本模型:Voxtral Transcribe 2,实时延迟低于200ms,支持说话人分离
Mistral推出了Voxtral Transcribe 2语音转文本模型,实时延迟低于200ms,支持说话人分离。该模型有两个版本:Voxtral Realtime适用于实时应用,延迟可配置到200ms以内,且词错误率接近离线版;Voxtral Mini Transcribe 2适用于批量处理,支持13种语言和词级时间戳
STT模型
210
工具开源项目
Claude Code【智能回顾优化】新功能,一个 /insights,它会把过去30天的对话翻一遍,给出一份优化工作流的建议
Claude Code的新功能"/insights"可以回顾过去30天的对话,提供优化工作流的建议,帮助用户更高效地完成编程工作,包括节省时间和改进流程。此功能将AI从工具辅助升级为个性化效率引擎
更新
200
工具开源项目
一款比较实用的代码审查技能包:code-review-expert,让AI像资深工程师一样对代码进行全面结构化审查
code-review-expert是一个开源的代码审查技能包,模拟资深工程师的审查视角,涵盖架构、安全性、性能等多个关键维度。它提供SOLID原则检查、安全扫描、性能优化、错误处理和代码清理等功能,并设有七步审查流程和P0-P3分级制度
skillsAI
190
其他开源项目
MobileAgent
阿里X-PLUG出品的移动端GUI Agent系列,让AI自主操作手机界面完成复杂任务。支持多种大模型驱动,7.9k+ stars。
GUI Agent移动端自动化
200
其他开源项目
CC-Switch
跨平台桌面All-in-One助手,统一管理Claude Code、Codex、OpenCode、Gemini CLI等多个AI编程工具。23k+ stars,一个界面切换所有编程Agent。
桌面工具AI编程多Agent
210
其他开源项目
PageIndex
VectifyAI推出的无向量RAG文档索引方案,通过推理而非向量检索实现文档问答,20k+ stars。颠覆传统RAG流程,无需embedding即可精准定位文档内容。
RAG文档索引AI搜索
210
其他开源项目
Claude Code
Anthropic官方出品的终端AI编程助手,理解你的代码库,通过自然语言命令执行日常任务、解释复杂代码、处理git工作流。73k+ stars的现象级工具。
AI编程终端工具代码助手
210
工具开源项目
vLLM
高吞吐量 LLM 推理和服务引擎,使用 PagedAttention 技术,比 HuggingFace 快 24 倍
模型推理高性能服务部署
22760
框架开源项目
RAGFlow
基于深度文档理解的 RAG 引擎,支持复杂格式文档的精准解析和高质量问答
RAG文档解析知识库
24480
模型开源项目
Whisper
OpenAI 开源的通用语音识别模型,支持多语言语音转文字、翻译,准确率极高
语音识别ASR多语言
281100
智能体开源项目
MetaGPT
多智能体框架,模拟软件公司的协作流程,一句话需求自动生成 PRD、设计、代码和测试
多智能体软件开发自动化
22650
工具开源项目
ChatGPT-Next-Web
一键部署你自己的 ChatGPT 网页应用,支持 GPT-4、Gemini Pro 等多种模型
ChatGPT一键部署多模型
22720
工具开源项目
ComfyUI
基于节点工作流的 Stable Diffusion 界面,灵活强大的图像生成管线编排工具
AI绘画工作流Stable Diffusion
24890
框架开源项目
FastGPT
基于 LLM 的知识库问答系统,开箱即用,支持数据导入、自动分割、向量化、工作流编排
知识库RAG问答系统
23560
工具开源项目
Stable Diffusion WebUI
Stable Diffusion 的浏览器界面,支持 txt2img、img2img、ControlNet 等全部功能
AI绘画Stable Diffusion图像生成
401350
工具开源项目
Ollama
在本地运行 Llama 3、Mistral、Gemma 等大语言模型,简单易用的命令行工具
本地部署Llama模型推理
281200
框架开源项目
Dify
开源的 LLM 应用开发平台,提供可视化的 Prompt 编排、RAG 管道、Agent 框架和模型管理
LLM平台RAG低代码
24870
工具开源项目
Open WebUI
功能丰富的自托管 AI 聊天界面,支持 Ollama 和 OpenAI 兼容 API,一键部署自己的 ChatGPT
ChatGPT自部署Ollama
26980
框架开源项目
LangChain
构建 LLM 应用的强大框架,提供链式调用、Agent、RAG 等核心能力,是 AI 应用开发的首选工具
LLMRAGAgent
331520