MOSS

4个月前更新 4,296 0 0

MOSS,复旦大学开发的对话式大语言模型

所在地：

中国

语言：

收录时间：

2024-04-08

打开网站手机查看

MOSS

打开网站

MOSS,复旦大学开发的对话式大语言模型

目前，MOSS 模型已上线开源，相关代码、数据、模型参数已在 Github 和 Hugging Face 等平台开放，供科研人员下载。

据介绍，MOSS 是一个支持中英双语和多种插件的开源对话语言模型，moss-moon 系列模型具有 160 亿参数，在 FP16 精度下可在单张 A100 / A800 或两张 3090 显卡运行，在 INT4/8 精度下可在单张 3090 显卡运行。MOSS 基座语言模型在约七千亿中英文以及代码单词上预训练得到，后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。

MOSS 来自复旦大学自然语言处理实验室的邱锡鹏教授团队，名字与《流浪地球》电影中的 AI 同名，已发布至公开平台（https://moss.fastnlp.top/），邀请公众参与内测。

IT之家查看 MOSS 的 GitHub 页面发现，该项目所含代码采用 Apache 2.0 协议，数据采用 CC BY-NC 4.0 协议，模型权重采用 GNU AGPL 3.0 协议。如需将该项目所含模型用于商业用途或公开部署，需要签署文件并发送至 robot@fudan.edu.cn 取得授权，商用情况仅用于记录，不会收取任何费用。

模型

moss-moon-003-base: MOSS-003 基座模型，在高质量中英文语料上自监督预训练得到，预训练语料包含约 700B 单词，计算量约 6.67×1022 次浮点数运算。
moss-moon-003-sft: 基座模型在约 110 万多轮对话数据上微调得到，具有指令遵循能力、多轮对话能力、规避有害请求能力。
moss-moon-003-sft-plugin: 基座模型在约 110 万多轮对话数据和约 30 万插件增强的多轮对话数据上微调得到，在 moss-moon-003-sft 基础上还具备使用搜索引擎、文生图、计算器、解方程等四种插件的能力。
moss-moon-003-pm: 在基于 moss-moon-003-sft 收集到的偏好反馈数据上训练得到的偏好模型，将在近期开源。
moss-moon-003: 在 moss-moon-003-sft 基础上经过偏好模型 moss-moon-003-pm 训练得到的最终模型，具备更好的事实性和安全性以及更稳定的回复质量，将在近期开源。
moss-moon-003-plugin: 在 moss-moon-003-sft-plugin 基础上经过偏好模型 moss-moon-003-pm 训练得到的最终模型，具备更强的意图理解能力和插件使用能力，将在近期开源。

数据

moss-002-sft-data: MOSS-002 所使用的多轮对话数据，覆盖有用性、忠实性、无害性三个层面，包含由 text-davinci-003 生成的约 57 万条英文对话和 59 万条中文对话。
moss-003-sft-data: moss-moon-003-sft 所使用的多轮对话数据，基于 MOSS-002 内测阶段采集的约 10 万用户输入数据和 gpt-3.5-turbo 构造而成，相比 moss-002-sft-data，moss-003-sft-data 更加符合真实用户意图分布，包含更细粒度的有用性类别标记、更广泛的无害性数据和更长对话轮数，约含 110 万条对话数据。目前仅开源少量示例数据，完整数据将在近期开源。
moss-003-sft-plugin-data: moss-moon-003-sft-plugin 所使用的插件增强的多轮对话数据，包含支持搜索引擎、文生图、计算器、解方程等四个插件在内的约 30 万条多轮对话数据。目前仅开源少量示例数据，完整数据将在近期开源。
moss-003-pm-data: moss-moon-003-pm 所使用的偏好数据，包含在约 18 万额外对话上下文数据及使用 moss-moon-003-sft 所产生的回复数据上构造得到的偏好对比数据，将在近期开源。

数据统计

数据评估

MOSS浏览人数已经达到4,296，如你需要查询该站的相关权重信息，可以点击"5118数据""爱站数据""Chinaz数据"进入；以目前的网站数据参考，建议大家请以爱站数据为准，更多网站价值评估因素如：MOSS的访问速度、搜索引擎收录以及索引量、用户体验等；当然要评估一个站的价值，最主要还是需要根据您自身的需求以及需要，一些确切的数据则需要找MOSS的站长进行洽谈提供。如该站的IP、PV、跳出率等！

特别声明

本站默惠工业品提供的MOSS都来源于网络，不保证外部链接的准确性和完整性，同时，对于该外部链接的指向，不由默惠工业品实际控制，在2024-04-08 下午3:10收录时，该网页上的内容，都属于合规合法，后期网页的内容如出现违规，可以直接联系网站管理员进行删除，默惠工业品不承担任何责任。

默惠工业品致力于优质、实用的网络站点资源收集与分享！本文地址https://nav.mrohui.cn/sites/1494.html转载请注明

Gemini

MuseV

MuseV是一个由腾讯音乐娱乐的天琴实验室开源的虚拟人视频生成框架，专注于生成高质量的虚拟人视频和口型同步。它利用先进的算法，能够制作出具有高度一致性和自然表情的长视频内容。MuseV支持自定义动作和风格，视频时长理论上无限，且生成速度快。这一技术在AI创作领域中表现出色，为虚拟人视频制作提供了新的可能性。

Lamini LLM

Lamini是现有软件团队快速开发和控制自己的LLM的企业LLM平台。Lamini有内置的最佳实践，可以将LLM专门用于数十亿专有文档，以提高性能、减少幻觉、提供引用并确保安全。Lamini可以安全地安装在室内或云端。得益于与AMD的合作，Lamini是唯一一个在AMD GPU上运行LLM并自信地扩展到数千个的平台。Lamini现在被财富500强企业和顶级人工智能初创公司使用。

M6：阿里巴巴

M6是中文社区最大的跨模态预训练模型，模型参数达到十万亿以上，具有强大的多模态表征能力。

Mistral AI

我们发布了开放权重模型，供每个人在他们想要的地方进行定制和部署。我们的超高效模型 Mistral Nemo 可在 Apache 2.0 下使用，而 Mistral Large 2 可通过免费的非商业许可证和商业许可证获得。

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

MOSS

模型

数据

数据统计

数据评估

相关导航

Mxnet

文心一言