Fish Speech Fish Speech 是一个由 Fish Audio 团队开发的文本转语音(TTS)技术,旨在利用先进的机器学习和深度学习技术将文字转换为自然流畅的语音输出。 0820 项目框架# Fish Speech# 项目框架
LeRobot LeRobot 是由 Hugging Face 推出的一个开源机器人项目,旨在通过提供模型、数据集和工具,降低机器人开发的门槛,使更多人能够参与和受益于机器人技术的发展。 0730 项目框架# LeRobot# 项目框架
Bytebot 一个开源的 AI 桌面代理,旨在通过自然语言指令自动化计算机任务,允许用户通过简单的自然语言命令执行复杂的任务,如网页浏览、数据处理、文件管理等,无需编写复杂代码 。 0720 项目框架# Bytebot# 项目框架
browser-use Browser Use 是一款专为大语言模型设计的智能浏览器工具。它是将 AI 智能体与浏览器连接起来的最简单方式,通过提供强大且简单的浏览器自动化接口,让 AI 智能体能够访问各类网站。 0620 项目框架# ai浏览器自动化# browser-use# 浏览器自动化
LlamaIndex 一个用于构建 LLM(大型语言模型)应用的数据框架,提供了一套工具和框架,帮助开发者将私有数据与 LLM 结合使用,以增强知识生成和推理能力。 0560 项目框架# LlamaIndex# 项目框架
TradingAgents 一个开源的多智能体交易框架,旨在模拟真实世界交易公司的动态,通过多个专业智能体(如基本面分析师、情绪分析师、技术分析师等)协同工作,评估市场条件并做出交易决策。 0550 项目框架# TradingAgents# 项目框架
LangGPT LangGPT 项目旨在以结构化、模板化的方式编写高质量 ChatGPT prompt,你可以将其视为一种面向大模型的 prompt 编程语言。 0530 项目框架# LangGPT# 提示词# 项目框架
FireRedTTS FireRedTTS是一款由小红书技术团队开发的基于大语言模型(LLM)的语音合成系统,旨在为用户提供高效、多样化的语音生成服务。 0520 项目框架# FireRedTTS# 项目框架
OmniHuman OmniHuman 是字节跳动研发的多模态数字人生成模型,能够同时接受文本、图像、音频和姿态等多种条件,实现从单张照片生成全身动态视频的功能。 0520 项目框架# OmniHuman# 项目框架
AniPortrait AniPortrait 是腾讯游戏智迹团队开发的一款创新的音频驱动肖像动画生成框架,能够通过音频和参考肖像图像生成高质量的动态视频。 0510 项目框架# AniPortrait# 项目框架
EmotiVoice易魔声 EmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。 0510 项目框架# EmotiVoice# 易魔声# 项目框架
PPTist PPTist 是一个基于 Web 的演示文稿(幻灯片)应用,旨在为用户提供类似于 Microsoft Office PowerPoint 的功能。 0510 项目框架# AI PPT# AiPPT# PPT
WrenAI WrenAI 是一个开源的生成式商业智能(GenBI)AI 代理,旨在帮助数据驱动的团队与他们的数据进行对话,并生成文本到 SQL、图表、电子表格、报告和可操作的见解 。 0510 项目框架# WrenAI# 项目框架
TradingAgents-CN TradingAgents-CN 是一个基于多智能体大语言模型的中文金融交易决策框架,专为中文用户优化,提供完整的A股、港股、美股分析能力。 0510 项目框架# TradingAgents# TradingAgents-CN# 项目框架
Windows‑Use Windows-Use 是一个开源工具,旨在桥接AI智能体(如大型语言模型)与Windows操作系统,实现无需人工干预的自动化操作。 0510 项目框架# Windows‑Use# 自动化# 项目框架
Shimmy Shimmy 是一款轻量级开源工具,专为本地 AI 推理设计,提供了与 OpenAI API 完全兼容的接口,使开发者能够在本地环境中运行大模型,而无需依赖云端服务。 0500 项目框架# Shimmy# 项目框架
Xinference Xinference 是一个功能强大且功能全面的分布式推理框架,旨在简化大语言模型(LLM)、语音识别、多模态模型等多种AI模型的推理任务。 0480 项目框架# Xinference# 项目框架
PaddleSpeech 百度飞桨(PaddlePaddle)平台上的一个开源语音处理工具包,旨在为语音识别、语音合成、语音翻译、语音识别、语音分类、语音标点恢复、语音情感分析等任务提供全面的解决方案。 0480 项目框架# PaddleSpeech# 百度# 百度飞桨
Parlant Parlant 是由 emcie-co 团队开发的一款开源的 LLM(大型语言模型)智能体框架,旨在解决传统 AI 代理在实际应用中行为不可预测、难以控制的核心问题。 0480 项目框架# Parlant# 项目框架
Stagehand Stagehand 是一个专注于网页自动化和 AI 浏览器控制的框架。它基于 Playwright 构建,提供自然语言控制的 API,用于实现网页自动化任务,如网页浏览、数据提取和操作等。 0480 项目框架# ai浏览器自动化# Stagehand# 浏览器自动化
AI-Infra-Guard A.I.G (AI-Infra-Guard) 集成AI基础设施漏洞扫描、MCP Server风险检测与大模型安全体检等能力,旨在为用户提供最全面、智能与易用的AI安全风险自查解决方案。 0470 项目框架# AI-Infra-Guard# 项目框架
Unstract Unstract 是一款基于大语言模型(LLM)打造的无代码平台,专注于非结构化数据提取,旨在通过 LLM 能力消除非结构化数据相关的人工流程 0470 项目框架# Unstract# 项目框架
Farfalle 开源AI搜索引擎项目,主要功能包括支持本地和云端模型运行,可选择使用本地大型语言模型(如Llama3,Mistral,Gemma和Phi3)或云端模型(如OpenAI的GPT-4和Groq的Llama 0470 项目框架# Farfalle# 项目框架
PocketFlow PocketFlow 是一个极简主义的 LLM(大型语言模型)框架,其核心代码仅包含 100 行代码,旨在简化 LLM 应用的开发。 0470 项目框架# PocketFlow# 项目框架
DeepTutor 由香港大学数据科学实验室(HKUDS)开发的开源 AI 学习助手项目,旨在通过大语言模型(LLM)和检索增强生成(RAG)技术构建一个“因材施教”的智能导学 Agent。 0460 项目框架# DeepTutor# 项目框架
Diffutoon Diffutoon 是一种基于扩散模型的高分辨率可编辑卡通着色技术,其核心功能是将真实视频转换为动漫风格,同时保持内容的一致性和高质量。 0460 项目框架# Diffutoon# 项目框架