
压缩率提升 48%,详解 Apache Doris 存储压缩优化之道|Deep Dive
摘要 本文基于 ClickBench 数据集,展示了 Apache Doris 如何通过选择压缩算法、调整数据页大小与分桶数、优化编码策略以及改进数据排序来提升压缩效率。最终,相同数据集的压缩空间从 16.08 GB 降至 8.2 GB,压...

摘要 本文基于 ClickBench 数据集,展示了 Apache Doris 如何通过选择压缩算法、调整数据页大小与分桶数、优化编码策略以及改进数据排序来提升压缩效率。最终,相同数据集的压缩空间从 16.08 GB 降至 8.2 GB,压...

本文由自字节跳动技术肖新蔚、赵彦奇分享,有修订和重新排版。 1、引言 本文要分享的是字节跳动团队针对火山HTTPDNS Cache2.0通过自研网段库与动态划分算法,将缓存粒度从“城市-运营商”细化为“网段”,解决了传统方案的城市级调度污染...

前几天,我看到了一个来自 Turso 创始人 Pekka 的观点: SQLite 被认为是 AI agent 的理想数据库,因为它轻量级且适用于 AI agent 的各种场景,但仍然需要进化。 评论区里也有意思,有人会和大家分享自己为了 S...

作者:张凤婷(娜米) 对于大多数客户而言,使用 Serverless 容器服务时最核心的顾虑始终是安全性与租户隔离能力。确实,并非只要采用了容器技术、实现了资源共享,就天然具备稳定可靠的安全保障。容器本身只是隔离手段之一,其安全边界高度依赖...

摘要:在如 Snowflake、ElasticSearch、ClickHouse…. 等传统系统中,对于 JSON 的处理往往面临灵活性及性能无法兼得的困境,而 Apache Doris 的 VARIANT 类型,通过动态子列、...

在前面的课程中,我们利用所学的 RAG 知识,搭建了一个基于论文的问答系统。但是当论文数量比较多时,针对一些统计信息,比如某个方向的论文数量、某个会议的论文数量等,如果只通过传统的 RAG 是没办法对这些信息进行检索的。 对此,本章将先简单...

2025的中国AI以一种踏实却令人振奋的方式茁壮生长。当焦躁褪去, 实践 不仅是对AI从生成到执行的注解,也是创新者精神的注脚。作为立足深圳、连接大湾区产学研圈的研究机构,IDEA研究院在2025 IDEA大会上端出一场高密度发布——从具身...

2025的中国AI以一种踏实却令人振奋的方式茁壮生长。当焦躁褪去, 实践 不仅是对AI从生成到执行的注解,也是创新者精神的注脚。作为立足深圳、连接大湾区产学研圈的研究机构,IDEA研究院在2025 IDEA大会上端出一场高密度发布——从具身...

11月22日, 由 深圳市科技创新局、深圳市福田区人民政府、河套深港科技创新合作区深圳园区发展署指导 ,粤港澳大湾区数字经济研究院 (International Digital Economy Academy,简称“IDEA研究院”) 主办...

孵化自 IDEA研究院的视觉大模型企业,视启未来(深圳)科技有限公司宣布完成近亿元天使轮融资。本轮由A股上市公司安凯微领投,昊辰资本、德虎资本、元禾璞华、银杏谷资本、力合中科、数字未来、九安智能等机构跟投。 视启未来的技术根基源于“万物检测...