MY Blog
友情链接
往期整理
  •   历史归档
  •   文章分类
  •   文章标签
关于我
ZZB
Article
454
Category
4
Tags
798
友情链接
往期整理
历史归档
文章分类
文章标签
关于我
extract
🚀SmolLM: 超快速、高性能的小模型集合
Post on: 2024-11-4
Last edited: 2024-11-4
Views
人工智能
自然语言处理
小模型
SmolLM
数据集
type
status
date
slug
summary
tags
category
icon
password
🔖标签✨概述📄摘要🔗原文链接

🔖标签

人工智能、自然语言处理、小模型、SmolLM、数据集

✨概述

本文介绍了SmolLM,一个包含135M、360M和1.7B参数量的高性能小模型集合,这些模型基于高质量数据集SmolLM-Corpus训练,展示了小模型在本地设备上的潜力。

📄摘要

SmolLM是一个集合了135M、360M和1.7B参数量的小语言模型,这些模型在一个全新的高质量数据集SmolLM-Corpus上训练。文章详细介绍了数据整理、模型评测和使用方法。SmolLM-Corpus包含Cosmopedia v2、Python-Edu和FineWeb-Edu三个子集,这些数据集经过精心整理和优化,以提高数据质量和多样性。实验结果显示,SmolLM模型在常识推理和世界知识评测标准上超越了现有模型。文章还讨论了模型的训练过程、超参数选择和评测结果,展示了小模型在本地设备上的高性能和快速运行能力。SmolLM模型可以在各种本地硬件上运行,包括智能手机和笔记本电脑,为本地化应用提供了可能。

🔗原文链接

https://mp.weixin.qq.com/s/M-rpJnb4hDKWwE_jLDbtcw
  • Author:ZZB
  • URL:https://project-servers.com/article/134e5c82-ebbd-8116-835b-c65e34a01a6a
  • Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!
Relate Posts
🚀OpenManus:开源AI Agent的本地部署与定制指南
🚀如何在DeepSeek中实现文生图功能
🚀开源项目Browser Use:AI助手操控网页的自动化神器
🚀Model2Vec:嵌入技术的革命性突破
🚀AI骗人技术的新阶段:世界已能以假乱真
🚀Khoj - 个人AI应用程序概述
🚀PairDrop: 跨平台文件共享工具🚀HuggingFace开源机器人教程:Mac上训练机器人叠衣服
Loading...
ZZB
ZZB
A Coder 🤖
Article
454
Category
4
Tags
798
Latest posts
✨Github热门榜: 2025-05-01
✨Github热门榜: 2025-05-01
2025-5-1
✨Github热门榜: 2025-04-30
✨Github热门榜: 2025-04-30
2025-4-30
✨Github热门榜: 2025-04-29
✨Github热门榜: 2025-04-29
2025-4-29
✨Github热门榜: 2025-04-28
✨Github热门榜: 2025-04-28
2025-4-28
✨Github热门榜: 2025-04-27
✨Github热门榜: 2025-04-27
2025-4-27
✨Github热门榜: 2025-04-26
✨Github热门榜: 2025-04-26
2025-4-26
Announcement
🎉欢迎来到我的博客🎉
-- 感谢您的支持 ---
👏Welcome to my blog👏
联系我们
 
2024-2025 ZZB.
赣ICP备2024046115号

MY Blog | A Coder 🤖