MY Blog
友情链接
往期整理
  •   历史归档
  •   文章分类
  •   文章标签
关于我
ZZB
Article
213
Category
4
Tags
580
友情链接
往期整理
历史归档
文章分类
文章标签
关于我
extract
🚀SmolLM: 超快速、高性能的小模型集合
Post on: 2024-11-4
Last edited: 2024-11-4
Views
人工智能
自然语言处理
小模型
SmolLM
数据集
type
status
date
slug
summary
tags
category
icon
password
🔖标签✨概述📄摘要🔗原文链接

🔖标签

人工智能、自然语言处理、小模型、SmolLM、数据集

✨概述

本文介绍了SmolLM,一个包含135M、360M和1.7B参数量的高性能小模型集合,这些模型基于高质量数据集SmolLM-Corpus训练,展示了小模型在本地设备上的潜力。

📄摘要

SmolLM是一个集合了135M、360M和1.7B参数量的小语言模型,这些模型在一个全新的高质量数据集SmolLM-Corpus上训练。文章详细介绍了数据整理、模型评测和使用方法。SmolLM-Corpus包含Cosmopedia v2、Python-Edu和FineWeb-Edu三个子集,这些数据集经过精心整理和优化,以提高数据质量和多样性。实验结果显示,SmolLM模型在常识推理和世界知识评测标准上超越了现有模型。文章还讨论了模型的训练过程、超参数选择和评测结果,展示了小模型在本地设备上的高性能和快速运行能力。SmolLM模型可以在各种本地硬件上运行,包括智能手机和笔记本电脑,为本地化应用提供了可能。

🔗原文链接

https://mp.weixin.qq.com/s/M-rpJnb4hDKWwE_jLDbtcw
  • Author:ZZB
  • URL:https://project-servers.com/article/134e5c82-ebbd-8116-835b-c65e34a01a6a
  • Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!
Relate Posts
🚀FlowiseAI:快速构建自定义LLM应用的低代码工具
🚀OmniParse - 非结构化数据解析与转换平台
🚀ESP-SparkBot: 基于ESP32-S3的AI桌面机器人
🚀LobeChat:开源AI工具的多功能集成平台
🚀GitHub开源项目介绍:机器人运动规划库OMPL
🚀GitHub 探索:LocalAI、Sink、eShopSupport 和 stdlib 项目介绍
🚀PairDrop: 跨平台文件共享工具🚀实现低延迟语音AI界面的技术优化
Loading...
ZZB
ZZB
A Coder 🤖
Article
213
Category
4
Tags
580
Latest posts
✨Github热门榜: 2025-12-12
✨Github热门榜: 2025-12-12
2025-12-12
✨Github热门榜: 2025-12-11
✨Github热门榜: 2025-12-11
2025-12-11
✨Github热门榜: 2025-12-10
✨Github热门榜: 2025-12-10
2025-12-10
✨Github热门榜: 2025-12-09
✨Github热门榜: 2025-12-09
2025-12-9
✨Github热门榜: 2025-12-08
✨Github热门榜: 2025-12-08
2025-12-8
✨Github热门榜: 2025-12-07
✨Github热门榜: 2025-12-07
2025-12-7
Announcement
🎉欢迎来到我的博客🎉
-- 感谢您的支持 ---
👏Welcome to my blog👏
联系我们
 
2024-2025 ZZB.
赣ICP备2024046115号

MY Blog | A Coder 🤖