RWKV7-G0b 13.3B 发布:RNN 的新一步


                                                                                                                                                <p>2025 年 11 月 30 日, <strong>RWKV7-G0b 13.3B</strong> 推理模型开源发布。它基于 RWKV7-G0a4 13.3B 继续训练高质量数据,显著提升各项能力。</p> 

RWKV 模型名称的 G1/G1a/G1a2/G0a3 等字段是训练数据的版本 ,数据质量 G#b > G#a4 > G#a3 > G#a2 > G#a > G#,数据数量 G1 > G0。简单规则:同一参数选择最新的模型,效果最好

模型性能评估

Uncheatable Eval 评测

Uncheatable使用最新的论文/新闻/代码/小说等实时数据,测试压缩率(”压缩即智能”),评估基底语言模型的真实语言建模能力和泛化能力。

RWKV7-G0b 13.3B 在 Uncheatable Eval 评测中超越 Qwen3-14B-Base 模型。

此外,最新的 G1b 1.5B 模型在 Uncheatable Eval 评测中也力压其他同尺寸开源模型。

MMLU & MMLU PRO

评估模型在多学科知识的综合能力(MMLU PRO 难度比 MMLU 更高)

GSM8K

GSM8K:评估模型在中学难度数学应用题的推理能力。

MATH500

MATH500:测试模型在代数、几何、数论等更难数学问题的解题能力。

HumanEval(pass@1)

HumanEval 评估模型根据自然语言描述自动生成正确且功能完整的 Python 代码的能力

MBPP(pass@1)

MBBP 评估模型在贴近现实世界场景的编程任务中,生成可执行 Python 代码的能力。

模型实战

RWKV 作为纯 RNN 模型,尤其适合大规模并行生成:RWKV-7 7B单5090解码10000+ tok/s演示

得益于 RWKV 新推理工具 Albatross 的并发推理能力,最新的 RWKV7-G0b 13.3B 模型可以在单张 5090 显卡上进行高速超高并发推理。

我们提供了一套 RWKV 模型并发 vibe coding 的组件:

启动前后端,并尝试这个 prompt: 创建一个温馨的本地咖啡馆官网,采用暖色调配色方案,包括浅米色、奶油白和柔和的木质色系,搭配优雅的排版风格,使用衬线字体和适度的间距。首页包含品牌介绍、菜单展示、活动信息和联系方式等模块,页面内容简洁明了,突出咖啡馆的特色和氛围

为了美观和可视化考虑,前端工具 RWKV-vibe-code 限制了仅同时生成 24 个网页代码。

coffee

点击其中一个生成项目,可以查看详情(生成 html 代码时,模型会使用同一个图片 URL 作为占位符):

coffee-narrow

写代码,推荐的解码参数:Temperature=1,Top_P=0.3,Presence Penalty=1,Frequency Penalty=0.1,decay=0.99

可以将模型生成的 HTML 内容放到 https://html.onlineviewer.net/ 进行预览。

再尝试 prompt: 创建一个名为「电子博物馆」的90年代复古风格的商店网页,采用赛博朋克配色方案,包括饱和度极高的霓虹粉、青色和炭黑背景,有六个复古商品的卡片,底部有六个回忆历史的信息新闻,营造怀旧、赛博朋克的视觉体验,批量生成的效果:

cyber-landscape

查看其中一个项目的细节:

cyber

欢迎大家本地部署 RWKV 网页推理工具,有任何使用问题,欢迎加入文末的 QQ 交流群提问!

Python 代码

在 RWKV Runner 中尝试 prompt:

实现一个游乐场儿童行为模拟器,必须遵守以下要求:
1: 模拟10个儿童在3个设施间的活动
2: 每10分钟更新一次状态,模拟4小时
3: 输出格式清晰的日志,包含时间、儿童ID、活动、能量值
4: 实现简单的排队逻辑(先进先出)
5: 结束时统计:最受欢迎设施、平均游玩次数、最高能量消耗儿童

RWKV7-G0b 13.3B 模型遵循了所有指令:

playground

模型下载

下载 RWKV7-G0b 13.3B 模型(.pth 格式):

下载 Ollama 格式:https://ollama.com/mollysama

如何使用 RWKV 模型

本地部署

可以使用 RWKV Runner、Ai00、RWKV pip 等推理工具本地部署 RWKV 模型。

以及目前最快的推理方式 Albatrosshttps://github.com/BlinkDL/Albatross

此外,RWKV 模型也适配了 llama.cpp、ollama 等热门的模型推理工具。

由于 RWKV7-G0b 13.3B 是新模型,目前建议使用 RWKV Runner 以保证得到正确结果。

可以在 RWKV 官网 – 模型推理教程中查看上述推理工具的使用教程。

加入 RWKV 社区

欢迎大家加入 RWKV 社区,可以从 RWKV 中文官网了解 RWKV 模型,也可以加入 RWKV 论坛、QQ 频道和 QQ 群聊,一起探讨 RWKV 模型。

欢迎大家基于 RWKV-7 进行创业、科研,我们也会为基于 RWKV 的项目提供技术支持。

如果您的团队正在基于 RWKV 创业或开展研究,请联系我们!(在”RWKV元始智能”微信公众号留言您的联系方式,或发送邮件到”contact@rwkvos.com“。)

                                                                                </div>



Source link

未经允许不得转载:紫竹林-程序员中文网 » RWKV7-G0b 13.3B 发布:RNN 的新一步

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
关于我们 免责申明 意见反馈 隐私政策
程序员中文网:公益在线网站,帮助学习者快速成长!
关注微信 技术交流
推荐文章
每天精选资源文章推送
推荐文章
随时随地碎片化学习
推荐文章
发现有趣的