利用OushuDB实现Native ORC格式增量备份
数据库备份是确保数据安全的关键组成部分,尤其是增量备份,通过快速高效的方式来保持数据的最新状态。
我们如何帮助银行构建开放的大数据贴源层
国有大行、股份制银行以及头部城商行都在进行大数据体系的研究、规划和建设
OushuDB历史SQL监控功能详解
历史SQL监控功能可以存储和分析过去的数据库活动,确保数据库的安全性和稳定性。
实时数据处理的“终极”版本是什么?
当下,瞬息万变的市场环境要求企业更快的做出商业决策,一个大型企业可能要在一分钟内做出上千个商业决策。“双十一 ”和春晚直播的实时大屏、银行和证券交易行为的实时监控、电商和短视频的实时个性化推荐等场景不断涌现,说明各行业都在向实时在线化发展。以短视频的实时个性化推荐为例,基于用户在前1分钟或者30秒内观看的视频情况,在后续浏览中系统就要根据算法测算用户特征偏好,然后实时向用户推荐其可能会喜欢的视频内容。
从北京到南京:偶数在能源行业的数据迁移实践
当前,大数据技术在以电力为代表的能源行业不断推进,同时,分布式能源、储能、电网技术不断改进,电力行业的数字化转型充满了机遇和挑战。
大模型、实时需求推动湖仓平台走向开放
AI+实时,俨然成为了企业数据平台无法避免的技术焦点。那么,如何让企业数据平台拥抱AI+实时的双重能力?
有湖有仓,如何升级到湖仓一体
本期文章聚焦讨论湖仓一体升级改造的可选方案。
湖仓一体概念快问快答
“湖仓一体”是一种新的架构模式,湖仓一体是将数据湖的灵活性和数仓的易用性、规范性、高性能结合起来的融合架构,无数据孤岛。湖仓一体数据存储在数据湖低成本的存储架构之上,既拥有数据湖数据格式的开放灵活性,又继承了数据仓库的高性能、易用性和规范性。
新冠“二阳”规模到底有多大?什么时候结束?
进入4月份以来,不少网友反映身边陆续出现了“二阳”的朋友。4月22日,中国疾控中心公布了全国新型冠状病毒感染最新情况,数据显示2023年4月20日的阳性率达到了1.7%。在5月22日召开的“2023大湾区科学论坛生物医药与健康分论坛”上,钟南山院士透露,基于传染病传播模型SEIRS模型预测,今年的第二波疫情高峰将在6月底发生。
Transformer 要占领地球了,大语言模型最全盘点!
Transformer 的核心思想是使用自注意力机制(Self-Attention Mechanism)来建立序列之间的依赖关系。就在2年前,很多模型主要还是基于长短期记忆(LSTM)和递归神经网络(RNN)的其他变体,而如今大语言模型都是基于 Transformer 的注意力机制。AI领域从传统机器学习,到神经网络,再到如今的 Transformer,正以井喷的势头快速发展。