1

Symbolic Aggregate Approximation谈论将时间序列(x,t)转换为符号。基于此,我几乎没有基本查询。如果时间信号是表示位置坐标的 (x,y,z,t) 的复合物,或者是带有时间戳 t 的二维图像的简单 (x,y,t) 的复合物,该怎么办。那么我如何使用这个工具来分配符号/离散化。请帮忙。

4

1 回答 1

1

您可以将SAX转换分别应用于每个维度,然后组合每个时间戳的符号/字母。

以 (x,y,z,t) 为例,你会得到b,a,ct=1 的组合,然后a,a,c是 t=2 的组合,等等。

然后,您可以根据需要组合这些符号以形成“巨型符号”。假设符号集是Symbols={a,b,c}。那么新的一组字母就是笛卡尔积SxSxS(每个维度一个)。

换句话说,aaa成为新字母Aaab如,B然后aac,,,等。abaabb


编辑:

这是一些代码来显示我的想法。由于我没有 SAX 算法的实现,我将使用以下函数作为占位符(它返回垃圾):

%# use your actual SAX function instead of this one
my_sax_function = @(x,n,a) randi(a, [n 1]);

这是代码:

%# time series of length=100, with (x,y,z) at each timestamp
data = cumsum(randn(100,3));

%# apply your SAX function to each dimension independently
N = 20;     %# number of segments to divide the signal into
A = 3;      %# size of alphabet (a,b,c)
dataSAX = zeros(N,3);
for i=1:3
    dataSAX(:,i) = my_sax_function(data(:,i), N, A);
end

%# we assume the above function returns integers denoting the symbols
%# therefore row i corresponds to A=3 symbols for each of the 3 x/y/z dimensions
dataSAX(1,:)

%# build cartesian product of all combinations of the A=3 symbols
[x y z] = ndgrid(1:A,1:A,1:A);
cartProd = [x(:) y(:) z(:)];

%# map to the new alphabet with 3*3*3 = 27 symbols
[~,V] = ismember(dataSAX, cartProd, 'rows')

%# A to Z with $ character to make up 27 symbols
oldSymbols = {'a';'b';'c'};             %# 1: a, 2: b, 3: c
newSymbols = cellstr(['A':'Z' '$']');   %# 1: A, ..., 26: Z, 27: $

%# SAX representation of the entire time series as a string
mappedV = char(newSymbols(V))'
于 2012-07-26T00:56:09.240 回答