【2024ICDE】入选论文大盘点,阿里云PolarDB斩获“最佳论文奖”


数据库国产化
数据库国产化 2024-05-22 09:27:29 36486
分类专栏: 资讯

ICDE(The International Conference on Data Engineering)作为数据库领域最高权威的国际顶级学术会议之一,与 VLDB、SIGMOD 并称数据库领域三大顶会。会议主要收录研究机构以及科技企业在数据库领域最前沿、最顶级的研究成果。

此次在荷兰召开的ICDE 2024大会,共吸引北京大学、清华大学、浙江大学、MIT、斯坦福等机构,以及谷歌、微软、阿里云、华为、字节等公司的近1000名人员参会,共同探讨AI、数据库、数据处理领域的前沿技术问题。

图片

在数字化浪潮的持续推动下,中国数据库厂商凭借技术创新获得国际权威的普遍认可。在本届IDCE会议中,截至目前华为云、OceanBase、腾讯云和浪潮集团均有论文成功入选,阿里云PolarDB斩获ICDE 2024工业赛道最佳论文,恭喜各位优秀的厂商伙伴!下面小编带大家一起盘点 (以下罗列不分先后顺序,并持续更新中)

01

PolarDB

🏆工业和应用赛道的“最佳论文奖”

《共享存储数据库迈向无感Severless,实现无感跨机弹升和强一致读扩展(Towards aShared-storage-based Serverless Database Achieving Seamless Scale-up and Read Scale-out)
图片

阿里云斩获工业和应用赛道的“最佳论文奖”,这也是中国企业首次获此殊荣。阿里云PolarDB创新性地解决了数据库Serverless中跨机事务迁移的核心难题,在全局一致性读的高性能云原生数据库PolarDB基础上,通过一种高效的事务迁移机制的设计,将跨机迁移时间压缩到0.5秒以内,整体性能提升数十倍。据了解,今年阿里云共有5篇论文被ICDE 2024收录。

 

02

华为云

入选论文:

论文标题 主要内容
《A Unified Replay-based Continuous Learning Framework for Spatio-Temporal Prediction on Streaming Data》 该论文由奥尔堡大学数据存储及管理研究组和华为云数据库创新LAB共同完成,提出了一种新的时空预测框架。随着移动设备的增加使得时空数据激增,利用这些数据进行时空预测对社会稳定性和安全性具有非常重要的意义。最近的许多研究着眼于通过深度学习模型来进行时空预测,但这些模型依然存在不足,这里面的问题包括:严重的灾难性遗忘问题、时空数据和时空数据预测方法的多样性问题,以及整体特征保存问题等。本文提出了一个统一的基于回放的增量学习框架(URCL),包括数据集成、时空数据增量表示学习(STCRL)和时空预测三大主要模块以解决相关的问题,该框架对于流式场景下的时空预测具有重要意义。ICDE审稿人高度认可该论文,认为该论文对于流式场景下的时空预测具有重要意义。
DACE: A Database-Agnostic Cost Estimator 该论文是由电子科技大学和华为云数据库创新LAB共同完成,旨在解决现有数据库代价估计模型鲁棒性方面的不足。论文中提出了一个与数据库无关的代价估计模型DACE,它可以跨不同数据集学习通用知识,并在准确性、鲁棒性和高效性方面显示出优势。研究表明,DACE可以学习查询优化器中的错误分布,这一分布具有高度的可迁移性。DACE还能学习不同数据库间的通用知识,并能通过动态损失调整策略减少信息冗余。该模型不仅能够在新数据库上直接进行准确的代价估计,还能通过预训练作为编码器辅助现有模型,解决冷启动问题。ICDE审稿人高度评价该论文,认为其提出了一种先进的代价估计模型,推动了现有技术的发展。
《Temporal-Frequency Masked Autoencoders for Time Series Anomaly Detection》 该论文是由电子科技大学和华为云数据库创新LAB共同完成的,通过设计一个轻量级、基于深度学习的时频掩码自编码器异常检测算法TFMAE,旨在帮助时序数据库提早感知异常,以降低潜在损失。该研究首次采用时频掩码对比的方法进行时序异常检测,并在多个公开数据集上验证了算法的有效性。论文的关键贡献包括:引入基于时间域和频率域掩码的对比准则,以更为准确和稳健地确定异常检测阈值;提出两种掩码策略,有效地消除序列中潜在的异常观察和模式,使得TFMAE成为一个能抵抗异常偏置的模型;在五个真实世界数据集与两个合成数据集上展示了TFMAE的检测性能和速度均有提升。该论文被 ICDE 审稿人高度评价,认为其提出了时序异常检测的新范式,最终无需修改被 ICDE 2024 直接录用。
《Attributed Network Embedding in Streaming Style》 该论文由东北大学、北京理工大学研究团队与华为云数据库创新LAB共同完成。该研究论文针对时序图数据中的Label Constrained Reachability (LCR)问题提出了一个新颖的查询方法 TDLCR,并设计了三种高效的算法来解决该查询问题。其中,BII 算法能够有效平衡索引构建代价和查询效率,并且具有良好的稳定性和可扩展性。
《Label Constrained Reachability Queries on Time Dependent Graph》 该论文由东北大学、北京理工大学研究团队与华为云数据库创新LAB共同完成。为了解决华为云图数据管理中的, 图嵌入问题。本文提出了一种新的图节点嵌入框架,通过属性增强技术提高了节点嵌入的表达能力,在各个方面都表现出优于其他 ANE 方法的性能。SANE 有望在社交网络分析、推荐系统、知识图谱构建和自然语言处理等领域得到广泛应用。

 

03

OceanBase

入选论文:

论文标题 主要内容
《Functionality-Aware Database Tuning via Multi-Task Learning》 此论文的研究工作由 OceanBase 与华东师范大学数据科学与工程学院科研团队共同完成。为了有效解决 OceanBase 等数据库 DBA 在参数调优方面遇到的问题,论文设计了一个功能感知的数据库调优系统,简称 OBTune,并展示了其在 OceanBase 中的应用。
《Generative and Contrastive Paradigms Are Complementary for Graph Self-Supervised Learning》 该研究论文由 OceanBase 与武汉大学共同完成,提出了 GCMAE 框架,将生成式和对比式学习范式相结合,提升了图自监督学习的性能。传统方法如 MAE 和 CL 各自独立使用,但我们观察到它们互补。因此,GCMAE 集成了 MAE 和 CL 分支,共享一个编码器,使得 GCMAE 能够充分利用全局信息。我们在四个流行的图任务上评估了 GCMAE,并与 14 个最先进的基线方法进行了比较。结果显示,GCMAE 在各任务上均提供了良好的准确性,最大准确性提高率相对于最佳基线方法高达 3.2%。
《BENCHTEMP: A General Benchmark for Evaluating Temporal Graph Neural Networks》 该论文由 OceanBase 与武汉大学共同完成,提出了 BENCHTEMP,这是一个用于评估各种任务下 TGNN 模型的通用基准。提供了一系列基准数据集和统一的评估流程,助力研究人员更加高效地评估和开发时序图神经网络模型。BENCHTEMP 支持多种任务和设定,并同时考察了模型的有效性和效率,为 TGNN 模型的公平比较和全面评估奠定了基础。

 

04

腾讯云

入选论文:

论文标题 主要内容
《Lion: Minimizing Distributed Transactions through Adaptive Replica Provision》 该研究论文提出了一种新颖的事务处理协议——Lion。作为一种自适应的副本放置机制,Lion利用基于分区的复制来减少分布式事务的发生。该机制增强了基于LSTM的工作负载预测算法,以确定定位共同访问分区的副本的适当节点。通过采用这种自适应副本放置策略,可以确保大多数事务可以在单个节点上高效处理,而无需额外的开销。因此,Lion有效地最小化了分布式事务,同时避免了由数据迁移或超级节点的创建引起的任何中断。大量实验结果显示,Lion与各种先进的事务处理协议相比,吞吐量提高了最多2.7倍、可扩展性提高了76.4%。
《IndeXY: A Framework for Constructing Indexes Larger than Memory》 针对数据库系统中,索引可能会消耗大量内存而无法完全存放的难题,腾讯云联合德州大学阿灵顿分校,在该研究论文中,提出了名为IndeXY的内存-磁盘跨越索引设计框架。该框架解耦了索引内存部分和磁盘部分的设计,精心设计内存部分向磁盘的选择性卸载并优化了磁盘重新加载索引并保留在内存的策略,以最大化优化内存访问机会和效率。

 

05

浪潮

入选论文:

论文标题 主要内容
《FOSS:A Self-Learned Doctor for Query Optimizer》 该研究论文聚焦于FOSS这种基于深度强化学习的新型查询优化框架,从传统优化器生成的原始计划开始进行优化,并通过一系列动作逐步改进计划中的次优节点。此外通过非对称优势模型,用于评估两个计划之间的优势,将它与传统优化器集成形成一个模拟环境。利用这个模拟环境,FOSS可以快速生成大量高质量的模拟经验。FOSS然后从这些经验中学习,以提高其优化能力。实验结果表明,在延迟性能方面,FOSS优于当前最先进的方法。与PostgreSQL相比,FOSS在不同的基准测试中实现了从1.15倍到8.33倍的总延迟加速。

 

06

高校

除厂商外,中国高校也秉承着持续钻研的学术精神,发表了共263篇文章。从统计结果可以看出,会议中香港科技大学、浙江大学、北京理工大学和北京大学被接收研究论文篇数较为突出,华东师范大学和哈尔滨工业大学紧随其后,其中以第一作者单位为中国高校发表的文章有249篇,占比66%,相较于ICDE 2023会议有所增长。

图片

另外,ICDE 2024会议中属于中国大陆(不含港澳台地区)高校发表的文章仍有214篇,大约占所有接收研究论文总数的56.7%左右。

网站声明:如果转载,请联系本站管理员。否则一切后果自行承担。

本文链接:https://www.xckfsq.com/news/show.html?id=53677
赞同 1
评论 0 条
数据库国产化L2
粉丝 1 发表 9 + 关注 私信
上周热门
如何使用 StarRocks 管理和优化数据湖中的数据?  2935
【软件正版化】软件正版化工作要点  2854
统信UOS试玩黑神话:悟空  2811
信刻光盘安全隔离与信息交换系统  2702
镜舟科技与中启乘数科技达成战略合作,共筑数据服务新生态  1235
grub引导程序无法找到指定设备和分区  1205
点击报名 | 京东2025校招进校行程预告  162
华为全联接大会2024丨软通动力分论坛精彩议程抢先看!  160
2024海洋能源产业融合发展论坛暨博览会同期活动-海洋能源与数字化智能化论坛成功举办  156
华为纯血鸿蒙正式版9月底见!但Mate 70的内情还得接着挖...  154
本周热议
我的信创开放社区兼职赚钱历程 40
今天你签到了吗? 27
信创开放社区邀请他人注册的具体步骤如下 15
如何玩转信创开放社区—从小白进阶到专家 15
方德桌面操作系统 14
我有15积分有什么用? 13
用抖音玩法闯信创开放社区——用平台宣传企业产品服务 13
如何让你先人一步获得悬赏问题信息?(创作者必看) 12
2024中国信创产业发展大会暨中国信息科技创新与应用博览会 9
中央国家机关政府采购中心:应当将CPU、操作系统符合安全可靠测评要求纳入采购需求 8

加入交流群

请使用微信扫一扫!