BIC-QA:国产数据库的“咖啡伴侣”


                                                                                                                                                <p>最近欣喜看到各家国产数据库都在积极推进 智能知识问答系统 AI 小助手,比如:</p> 
  • TiDB: https://asktug.com/
  • YashanDB: https://chat.yashandb.com/
  • OceanBase: https://www.oceanbase.com/obi

其中, TiDB 的 AI 小助手已经融合到 AskTUG 论坛搜索框, YashanDB 启用 chat 二级域名, OceanBase 是主站的二级页面。

我们当然也可以直接使用 豆包、KIMI、DeepSeek、腾讯元宝 等大模型来寻找对国产数据库的疑问,但是,这类通用大模型对国产数据库了解不多,经常发生“一本正经的胡说八道”的情况。因此,仅面向国产数据库纵深内容的“小模型”就显得尤为重要。如果有这样一款可以解决多家数据库问题的专用 AI 小助手,那将是极好的。

上个月,一款工作提效神器正式发布,接下来我们一起来浅尝一下。

BIC-QA

由白鳝老师领衔的团队,于 2025 年 8 月正式发布了“ BIC-QA 国产数据库智能问答系统”。目前团队正在整理高价值运维经验和故障模型,未来也会发布在这个知识库中,利用这些高价值运维经验,可以帮助用户在 BIC-QA 中定位所遇到的数据库问题。

BIC-QA 全称 “Business Intelligence & Knowledge Query Assistant”,是一个面向数据库知识管理的智能问答平台。它定位为企业级数据库知识检索、问答系统,旨在为数据库管理员(DBA)、开发者、运维工程师等提供即时专业的数据库相关技术支持。

它支持各种主流数据库系统,包括国际常见的如 Oracle、MySQL、PostgreSQL、SQL Server、MongoDB、Redis,也特别支持国内常见数据库,比如 达梦 DM金仓数据库 KingBase 、海扬数据库 OceanBase、 虚谷数据库腾讯云数据库 TDSQL 、平凯数据库(TiDB 企业版)、GBase 等。

目前 BIC-QA 的知识库总计有 210 多万条数据,主要来自于各个数据库的官方文档以及数据库厂商提供的一些最佳实践的资料,再加上一些来自于 DBAIOps 多年积累的运维知识图谱的数据。

图片来源: BIC-QA正式发布

下图展示了知识库数据分布情况。其中,Oracle 部分只加入了 Reference、管理员手册和 Oracle Concepts 这三本书,以及 7 万多篇 MOS 的文档。 上个月 DTCC 之后又补充虚谷数据库的知识库共计有 问答12500+,文本片段4700+

图片来源: 国产数据库的知识库丰富吗?

再说文档

从上面的数据也能看出,国产数据库在文档、最佳实践、优质问答等方面都有很多功课要补。

比如现有很多文档以 PDF 或者 Word 格式呈现,这种类型文件导入知识库做向量化需要做非常多的预处理工作,如果文档以统一排版格式的 Markdown 甚至于 JSON 格式保存,那导入向量数据库就是分分钟的事情。这就是我常说的 “文档即代码” ,昨天从白鳝老师那里听到即便某厂商的文档虽已统一代码化,但是仍存在 Markdown 格式处理不统一的情况,历史“债务”有待修正。你可以使用代码化的文档来生成 Word、PDF 等格式的文件,反之则很难处理。代码化的文档,引入 CI/CD,可以让文档网站以更低成本、更快更新。金仓数据库最近上线了新文档网站,PC 端、移动端均做好了适配,每一页提供了二维码,用户可以用微信扫一扫,随手分享当前文档。

再如某厂商知道自己的文档是短板,又想极速改善现状,于是找到了某知识产品团队做技术支持,借助他们的产品,将原有的不同格式文档导入文档平台,形成风格统一、格式统一的文档网站。如此,客户、用户、甚至自家团队成员都对新网站抱之欢喜。

为何一再强调文档,而且是在线文档?完善的文档,尤其是统一格式代码化的文档,是 AI Ready 知识库的重要基础。文档是对产品的准确阐释,书籍和问答网站中的内容难免会出现水文、水贴,甚至错误。但是文档都应该是经过研发、测试、文档多团队审校过的准确信息。代码化的文档有利于拉取基线版本,在此基础之上再进行迭代更新,小伙伴们可以快速定位某个新特性是从哪个版本引入,又在哪个版本发生变更,甚至在哪个版本停用、下线,数据库特性的全生命周期都可以完整地体现在文档中。目前能将文档做到这种程度的国产数据库屈指可数,大部分还是将文档捂着藏着、展现部分残缺不全,不知是否在未来半年会不会有明显改观,毕竟好多行业、领域已经开始深度使用国产数据库,将会遇到更多、更难的问题。当然,标杆案例、最佳实践也是文档的重要组成部分。

有配套文档的数据库才有资格从“ 能用”升级到“好用”。有好文档才有好知识库。有好知识库的数据库,才有资格从“ 好用”升级到“ 爱用”。

说回 BIC-QA

我们再回到今天的主题:BIC-QA

BIC-QA 的核心功能特性包括:

  • 智能语义理解:能够准确理解用户问答意图。
  • 知识图谱构造:构建数据库知识之间的关联网络,以便提供上下文中相关的答案。
  • 实时知识更新:随着数据库版本、特性、最佳实践等的变化,知识库内容可以持续更新。
  • 多维检索:用户可以按数据库类型、问题类型、技术领域等维度检索知识。

BIC-QA 扩展插件代码以宽松的 Apache 协议开源,你可以随意修改,开源地址:

  • GitHub: https://github.com/BIC-QA/BIC-QA
  • Gitee: https://gitee.com/BIC-QA/bic-qa

它以 Chrome、Edge 浏览器插件的形式提供用户界面,结合知识库服务和 AI 模型进行问答。

版本号当前为 v1.0.6(2025 年 8 月发布)。

下面是从零开始用 BIC-QA 的安装、配置流程:

1. 下载安装浏览器插件

从项目中下载 Zip 包,在本地解压。在浏览器中打开扩展管理页面(例如 Chrome 的 “扩展程序管理” 页面),开启 “开发者模式”,点击“加载未打包扩展”选项。选择下载好的文件夹(含 manifest.json 等内容)加载到浏览器中。这样插件就安装好了。

2. 四步配置

Step 1:用户注册。在插件的设置页中填写用户名、公司名、邮箱等信息,保存后会发送 API Key 到你的邮箱。



Step 2:知识库服务配置。在知识库服务配置页中填写获得的 API Key,确认连接到知识库服务。

Step 3:AI 模型配置。你可以使用自建大模型,或者订阅 AI 模型服务商的 API。在配置页添加服务提供商,填写 API 地址、Key 等信息,并测试连接。这里我使用的是阿里千问在线 API。


Step 4:开始使用。在插件中选择一个已配置好的模型服务提供商,选择一个知识库,比如 Kingbase,在输入框中输入问题并发送,即可获取答案。

总结

总的来说,BIC-QA 是一个在数据库知识管理+问答场景中非常有前景的产品。它结合了知识库+检索+大模型问答/语言模型语义理解的能力,在多种数据库支持、可配置性、易用性方面都有不错设计。如果你所在团队有频繁查询数据库问题、调优、排障等需求,这种工具能大幅节省查资料、问答案的时间,同时提高准确性。

Have a nice day ~


🌻 往期精彩 ▼

– / END / –

👉 欢迎关注我的视频号

👉 这里有得聊

如果对国产基础软件(操作系统、数据库、中间件)感兴趣,可以加群一起聊聊。
关注微信公众号:少安事务所,后台回复[群],即可看到入口。

如果这篇文章为你带来了灵感或启发,请帮忙『 三连』吧,感谢!ღ( ´・ᴗ・` )~

                                                                                </div>



Source link

未经允许不得转载:紫竹林-程序员中文网 » BIC-QA:国产数据库的“咖啡伴侣”

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
关于我们 免责申明 意见反馈 隐私政策
程序员中文网:公益在线网站,帮助学习者快速成长!
关注微信 技术交流
推荐文章
每天精选资源文章推送
推荐文章
随时随地碎片化学习
推荐文章
发现有趣的