提取的特征概览

tsfresh 计算了全面的特征数量。所有特征计算器都包含在子模块中

tsfresh.feature_extraction.feature_calculators

此模块包含以时间序列作为输入并计算特征值的特征计算器。

以下列表包含当前版本 tsfresh 支持的所有特征计算

abs_energy(x)

返回时间序列的绝对能量,即平方值的总和

absolute_maximum(x)

计算时间序列 x 的最高绝对值。

absolute_sum_of_changes(x)

返回序列 x 中连续变化的绝对值之和

agg_autocorrelation(x, param)

时间序列自相关性的描述性统计。

agg_linear_trend(x, param)

计算时间序列值的线性最小二乘回归,这些值是按块聚合的,对比从 0 到块数减一的序列。

approximate_entropy(x, m, r)

实现了一个向量化的近似熵算法。

ar_coefficient(x, param)

此特征计算器拟合自回归 AR(k) 过程的无条件最大似然。

augmented_dickey_fuller(x, param)

时间序列是否具有单位根?

autocorrelation(x, lag)

根据公式 [1] 计算指定滞后的自相关性

benford_correlation(x)

适用于异常检测应用 [1][2]。返回首位数字分布的相关性,当

binned_entropy(x, max_bins)

首先将 x 的值分箱到 max_bins 个等距箱中。

c3(x, lag)

使用 c3 统计量测量时间序列中的非线性

change_quantiles(x, ql, qh, isabs, f_agg)

首先固定由 x 分布的分位数 ql 和 qh 给定的走廊。

cid_ce(x, normalize)

此函数计算器是对时间序列复杂度的估计 [1](更复杂的时间序列有更多的峰、谷等)。

count_above(x, t)

返回 x 中高于 t 的值的百分比

count_above_mean(x)

返回 x 中高于 x 的平均值的数量

count_below(x, t)

返回 x 中低于 t 的值的百分比

count_below_mean(x)

返回 x 中低于 x 的平均值的数量

cwt_coefficients(x, param)

计算 Ricker 小波(也称为“墨西哥帽小波”)的连续小波变换,该小波由以下定义

energy_ratio_by_chunks(x, param)

计算 N 个块中第 i 个块的平方和,表示为与整个序列的平方和之比。

fft_aggregated(x, param)

返回绝对傅里叶变换谱的谱质心(平均值)、方差、偏度和峰度。

fft_coefficient(x, param)

通过快速傅里叶变换算法计算实输入的一维离散傅里叶变换的傅里叶系数

first_location_of_maximum(x)

返回 x 最大值的第一个位置。

first_location_of_minimum(x)

返回 x 最小值的第一个位置。

fourier_entropy(x, bins)

计算时间序列功率谱密度(使用 Welch 方法)的分箱熵。

friedrich_coefficients(x, param)

多项式 h(x) 的系数,该多项式已拟合到 Langevin 模型的确定性动力学

has_duplicate(x)

检查 x 中的任何值是否出现不止一次

has_duplicate_max(x)

检查 x 的最大值是否被观察到不止一次

has_duplicate_min(x)

检查 x 的最小值是否被观察到不止一次

index_mass_quantile(x, param)

计算时间序列 x 的相对索引 i,其中 x 质量的 q% 位于 i 的左侧。

kurtosis(x)

返回 x 的峰度(使用调整后的 Fisher-Pearson 标准化矩系数 G2 计算)。

large_standard_deviation(x, r)

时间序列是否具有标准差?

last_location_of_maximum(x)

返回 x 最大值的相对最后一个位置。

last_location_of_minimum(x)

返回 x 最小值的最后一个位置。

lempel_ziv_complexity(x, bins)

根据 Lempel-Ziv 压缩算法计算复杂度估计。

length(x)

返回 x 的长度

linear_trend(x, param)

计算时间序列值的线性最小二乘回归,对比从 0 到时间序列长度减一的序列。

linear_trend_timewise(x, param)

计算时间序列值的线性最小二乘回归,对比从 0 到时间序列长度减一的序列。

longest_strike_above_mean(x)

返回 x 中比 x 平均值大的最长连续子序列的长度

longest_strike_below_mean(x)

返回 x 中比 x 平均值小的最长连续子序列的长度

matrix_profile(x, param)

计算一维矩阵剖面[1],并返回 Tukey 五数概括加上该矩阵剖面的平均值。

max_langevin_fixed_point(x, r, m)

动力学的最大不动点 :math:argmax_x {h(x)=0} `,由拟合到 Langevin 模型确定性动力学的多项式 h(x) 估计

maximum(x)

计算时间序列 x 的最高值。

mean(x)

返回 x 的平均值

mean_abs_change(x)

第一次差分的平均值。

mean_change(x)

时间序列差分的平均值。

mean_n_absolute_max(x, number_of_maxima)

计算时间序列的 n 个绝对最大值的算术平均值。

mean_second_derivative_central(x)

返回二阶导数的中心近似平均值

median(x)

返回 x 的中位数

minimum(x)

计算时间序列 x 的最低值。

number_crossing_m(x, m)

计算 x 在 m 上的交叉次数。

number_cwt_peaks(x, n)

x 中不同峰的数量。

number_peaks(x, n)

计算时间序列 x 中至少支持 n 的峰数。

partial_autocorrelation(x, param)

计算给定滞后处偏自相关函数的值。

percentage_of_reoccurring_datapoints_to_all_datapoints(x)

返回非唯一数据点的百分比。

percentage_of_reoccurring_values_to_all_values(x)

返回在时间序列中出现不止一次的值的百分比。

permutation_entropy(x, tau, dimension)

计算排列熵。

quantile(x, q)

计算 x 的 q 分位数。

query_similarity_count(x, param)

此特征计算器接受一个输入查询子序列参数,将该查询(在 z 归一化欧几里得距离下)与时间序列中的所有子序列进行比较,并返回在时间序列中找到查询的次数计数(在某个预定义的最大距离阈值内)。

range_count(x, min, max)

计算区间 [min, max) 内观测值的数量。

ratio_beyond_r_sigma(x, r)

值与 x 的平均值相差 r * std(x)(即 r 倍 sigma)的比例。

ratio_value_number_to_time_series_length(x)

如果时间序列中的所有值只出现一次,则返回 1,否则返回小于 1 的因子。

root_mean_square(x)

返回时间序列的均方根 (rms)。

sample_entropy(x)

计算并返回 x 的样本熵。

set_property(key, value)

此方法返回一个装饰器,将函数的属性 key 设置为 value

skewness(x)

返回 x 的样本偏度(使用调整后的 Fisher-Pearson 标准化矩系数 G1 计算)。

spkt_welch_density(x, param)

此特征计算器估计时间序列 x 在不同频率下的互功率谱密度。

standard_deviation(x)

返回 x 的标准差

sum_of_reoccurring_data_points(x)

返回在时间序列中出现不止一次的所有数据点之和。

sum_of_reoccurring_values(x)

返回在时间序列中出现不止一次的所有值之和。

sum_values(x)

计算时间序列值的总和

symmetry_looking(x, param)

布尔变量,指示 x 的分布是否看起来对称

time_reversal_asymmetry_statistic(x, lag)

返回时间反转不对称统计量。

value_count(x, value)

计算 value 在时间序列 x 中的出现次数。

variance(x)

返回 x 的方差

variance_larger_than_standard_deviation(x)

方差是否高于标准差?

variation_coefficient(x)

返回 x 的变异系数(标准误差 / 平均值,给出围绕平均值的相对变异值)。