简体中文
Appearance
简体中文
Appearance
在时序数据场景中,降采样与聚合计算是核心的数据处理技术。通过降低数据采样频率并将多个数据点合并为代表性数值,能够有效减少计算和传输开销,特别适用于长期趋势分析和可视化展示。
典型应用场景:工业物联网监控、系统性能指标分析、业务数据趋势展示等。
以传感器数据为例,采集频率为1秒级别。当需要展示最近一天或一个月的数据趋势时,原始数据点过于密集会导致:
时间窗口聚合通过数据分组和计算,有效解决上述问题。
Table schema 如下:
CREATE TABLE sensor_info (
ts TIMESTAMP(9) NOT NULL DEFAULT CURRENT_TIMESTAMP,
sn INT32 NOT NULL,
speed DOUBLE,
temperature DOUBLE,
timestamp KEY (ts))
PARTITION BY HASH(sn) PARTITIONS 2
ENGINE=TimeSeries
with (ttl='10d');查询设备sn=1的温度数据,按1分钟窗口计算平均值
SELECT
date_bin('1 minutes', ts) as timepoint,
avg(temperature) as avg_temp
FROM sensor_info
WHERE sn = 1
GROUP BY timepoint查询设备sn=1的温度数据,按1天窗口计算最大值
SELECT
date_bin('1 day', ts) as timepoint,
max(temperature) as max_temp
FROM sensor_info
WHERE sn = 1
GROUP BY timepoint更多函数说明: