最近经常看到阿里云的 AnalyticDB / EMR 的公关稿, 说是打破了 TPC-DS 的世界纪录, 那么这个 TPC-DS 是什么呢? 于是打算写一个系列, 深度的解读一下它.
假设你是一个公司的老板, 公司历史上积累了很多的数据(单机容量已经放不下), 现在想采购一个系统来对这些数据进行一些分析挖掘(主要包含四大场景: 周期报表/ad-hoc查询/迭代式查询/数据挖掘), 于是到市场上问询, 发现市场上有许多产品都可以提供分析能力, 包括:
有点眼花缭乱, 这时应该如何选择呢?
针对300多个引擎进行测试, 需要极大的人力开销, 并且还可能遗漏部分场景.
如果有人针对最通用的商用场景做抽象, 提出一套通用的测试标准, 各个数据引擎都主动或被动的分别经历了这个测试, 并且出具了各自的测试报告(包括各场景下性能表现, 被测系统的详细配置、软硬件和包含N年维护费在内的总价格), 并且这个测试报告被一个值得信任的组织严格审查过, 那该多好? 于是TPC-DS 应运而生.
网站声明:如果转载,请联系本站管理员。否则一切后果自行承担。
加入交流群
请使用微信扫一扫!