RWKV7-G0b 13.3B 发布：RNN 的新一步

推广 | LFOSSA 2025 Cyber Monday 来了！LF官方认证 & 课程 37 折起，12.1-12.9 限时抢～

                                                                                                                                                <p>2025 年 11 月 30 日， <strong>RWKV7-G0b 13.3B</strong> 推理模型开源发布。它基于 RWKV7-G0a4 13.3B 继续训练高质量数据，显著提升各项能力。</p>

RWKV 模型名称的 G1/G1a/G1a2/G0a3 等字段是训练数据的版本 ，数据质量 G#b > G#a4 > G#a3 > G#a2 > G#a > G#，数据数量 G1 > G0。简单规则：同一参数选择最新的模型，效果最好。

模型性能评估

Uncheatable Eval 评测

Uncheatable使用最新的论文/新闻/代码/小说等实时数据，测试压缩率（”压缩即智能”），评估基底语言模型的真实语言建模能力和泛化能力。

RWKV7-G0b 13.3B 在 Uncheatable Eval 评测中超越 Qwen3-14B-Base 模型。

此外，最新的 G1b 1.5B 模型在 Uncheatable Eval 评测中也力压其他同尺寸开源模型。

MMLU & MMLU PRO

评估模型在多学科知识的综合能力（MMLU PRO 难度比 MMLU 更高）

GSM8K

GSM8K：评估模型在中学难度数学应用题的推理能力。

MATH500

MATH500：测试模型在代数、几何、数论等更难数学问题的解题能力。

HumanEval(pass@1)

HumanEval 评估模型根据自然语言描述自动生成正确且功能完整的 Python 代码的能力

MBPP(pass@1)

MBBP 评估模型在贴近现实世界场景的编程任务中，生成可执行 Python 代码的能力。

模型实战

RWKV 作为纯 RNN 模型，尤其适合大规模并行生成：RWKV-7 7B单5090解码10000+ tok/s演示。

得益于 RWKV 新推理工具 Albatross 的并发推理能力，最新的 RWKV7-G0b 13.3B 模型可以在单张 5090 显卡上进行高速超高并发推理。

我们提供了一套 RWKV 模型并发 vibe coding 的组件：

RWKV 批量推理后端（提供 OAI 兼容的并发推理接口）：https://github.com/RWKV-Vibe/rwkv_lightning
RWKV-vibe-code 前端（批量渲染代码的前端项目）：https://github.com/RWKV-Vibe/rwkv-vibe-code

启动前后端，并尝试这个 prompt： 创建一个温馨的本地咖啡馆官网，采用暖色调配色方案，包括浅米色、奶油白和柔和的木质色系，搭配优雅的排版风格，使用衬线字体和适度的间距。首页包含品牌介绍、菜单展示、活动信息和联系方式等模块，页面内容简洁明了，突出咖啡馆的特色和氛围。

（为了美观和可视化考虑，前端工具 RWKV-vibe-code 限制了仅同时生成 24 个网页代码。）

coffee

点击其中一个生成项目，可以查看详情（生成 html 代码时，模型会使用同一个图片 URL 作为占位符）：

coffee-narrow

写代码，推荐的解码参数：Temperature=1，Top_P=0.3，Presence Penalty=1，Frequency Penalty=0.1，decay=0.99

可以将模型生成的 HTML 内容放到 https://html.onlineviewer.net/ 进行预览。

再尝试 prompt： 创建一个名为「电子博物馆」的90年代复古风格的商店网页，采用赛博朋克配色方案，包括饱和度极高的霓虹粉、青色和炭黑背景，有六个复古商品的卡片，底部有六个回忆历史的信息新闻，营造怀旧、赛博朋克的视觉体验，批量生成的效果：

cyber-landscape

查看其中一个项目的细节：

cyber

欢迎大家本地部署 RWKV 网页推理工具，有任何使用问题，欢迎加入文末的 QQ 交流群提问！

Python 代码

在 RWKV Runner 中尝试 prompt：

实现一个游乐场儿童行为模拟器，必须遵守以下要求：
1: 模拟10个儿童在3个设施间的活动
2: 每10分钟更新一次状态，模拟4小时
3: 输出格式清晰的日志，包含时间、儿童ID、活动、能量值
4: 实现简单的排队逻辑（先进先出）
5: 结束时统计：最受欢迎设施、平均游玩次数、最高能量消耗儿童

RWKV7-G0b 13.3B 模型遵循了所有指令：

playground

模型下载

下载 RWKV7-G0b 13.3B 模型（.pth 格式）：

下载 Ollama 格式：https://ollama.com/mollysama

如何使用 RWKV 模型

本地部署

可以使用 RWKV Runner、Ai00、RWKV pip 等推理工具本地部署 RWKV 模型。

以及目前最快的推理方式 Albatross：https://github.com/BlinkDL/Albatross

此外，RWKV 模型也适配了 llama.cpp、ollama 等热门的模型推理工具。

由于 RWKV7-G0b 13.3B 是新模型，目前建议使用 RWKV Runner 以保证得到正确结果。

可以在 RWKV 官网 – 模型推理教程中查看上述推理工具的使用教程。

加入 RWKV 社区

欢迎大家加入 RWKV 社区，可以从 RWKV 中文官网了解 RWKV 模型，也可以加入 RWKV 论坛、QQ 频道和 QQ 群聊，一起探讨 RWKV 模型。

📖 RWKV 中文文档：https://www.rwkv.cn
💬 RWKV 论坛：https://community.rwkv.cn/
🐧 QQ 频道：https://pd.qq.com/s/9n21eravc | QQ 交流群：224287095
📺 BiliBili 视频教程：https://space.bilibili.com/3546689096910933

欢迎大家基于 RWKV-7 进行创业、科研，我们也会为基于 RWKV 的项目提供技术支持。

如果您的团队正在基于 RWKV 创业或开展研究，请联系我们！（在”RWKV元始智能”微信公众号留言您的联系方式，或发送邮件到”contact@rwkvos.com“。）

                                                                                </div>

Source link