MiniMind 是一个开源的大语言模型(LLM)项目,旨在从零开始,以极低的成本(仅需3块钱)和极短的时间(2小时)训练出一个轻量级的语言模型。该项目由开发者 Jingyao Gong 发起,旨在降低大模型的学习门槛,让更多人能够从零开始训练和理解大模型的原理。
- MiniMind官网入口网址:https://jingyaogong.github.io/minimind/
- MiniMind开源项目地址:https://github.com/jingyaogong/minimind
MiniMind 的核心特点是其极小的模型体积,最小模型体积仅为 GPT-3 的 1/7000,适合个人 GPU 快速训练。项目提供了完整的训练流程,包括预训练、监督微调(SFT)、LoRA 微调、强化学习(RLHF)等全过程代码,并且所有代码均从零开始用 PyTorch 重构,不依赖第三方库。
MiniMind 提供了多种模型版本,包括 MiniMind2 系列和 MiniMind-V(多模态扩展),支持多种训练和推理框架,如 llama.cpp、vllm、ollama 等。项目还提供了丰富的数据集和训练脚本,支持从零开始训练模型,并提供了详细的训练和评估工具。
MiniMind 的目标是推动 AI 社区的进步,让更多人能够理解和参与大模型的开发与训练。通过 MiniMind,用户可以体验从零开始训练一个语言模型的全过程,感受创造的乐趣。
数据统计
数据评估
关于MiniMind特别声明
本站飞侠导航提供的MiniMind都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由飞侠导航实际控制,在2026年1月6日 上午9:19收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,飞侠导航不承担任何责任。
相关导航
一个与人工智能(AI)模型评估和比较相关的平台,其核心功能是通过用户投票和社区参与的方式,对大型语言模型(LLM)进行评测和排名。
炉米lumi
字节跳动推出的一款AI模型分享社区平台,旨在促进AI技术的交流与应用,为研究人员、开发者和爱好者提供一个开放、高效的合作环境
Vimi
Vimi 是商汤科技推出的一款基于可控人物视频生成大模型的 AIGC 产品,是全球首个可控人物视频生成大模型。
可灵大模型
由快手AI团队自研打造的视频生成大模型
EvoLink.ai
一个面向企业与内容团队的多模型服务平台,核心价值在于通过一个统一的API接口,为用户提供整合全球顶尖AI模型的能力,旨在显著降低AI应用的成本并提升生产级应用的可靠性。
BuboGPT
BuboGPT是字节跳动推出的一款多模态大语言模型(LLM),能够处理文本、图像和音频等多种输入模态,并具备对齐和非对齐理解的能力。
商汤商量拟人大模型
一款基于先进人工智能技术开发的对话型AI工具,旨在通过高度拟人化的交互体验,为用户提供丰富的情感陪伴、角色互动和多场景应用能力
sql-llm-benchmark
专注于语言模型(LLM)SQL 能力评测的专业平台,构建了全面且具实践价值的 SQL 能力排行榜(SCALE),为开发者、数据库管理员及企业技术决策者提供关键参考
暂无评论...

