您现在的位置是:主页 > news > 网站开发购物店/什么是引流推广
网站开发购物店/什么是引流推广
admin2025/5/5 13:16:11【news】
简介网站开发购物店,什么是引流推广,合肥专业网站排名推广,可以做区位分析的网站本周张天平学弟在组会上讲了两篇时间序列预测上的最新文章,其中一篇文章用到了 CV 领域非常有意思的一个工作。原文传送门N-BEATS(ICLR 2020):Oreshkin, Boris N., et al. "N-BEATS: Neural basis expansion analysis for in…

本周张天平学弟在组会上讲了两篇时间序列预测上的最新文章,其中一篇文章用到了 CV 领域非常有意思的一个工作。
原文传送门
N-BEATS(ICLR 2020):Oreshkin, Boris N., et al. "N-BEATS: Neural basis expansion analysis for interpretable time series forecasting." arXiv preprint arXiv:1905.10437 (2019).
Saliency detection(CVPR 2007):Hou, Xiaodi, and Liqing Zhang. "Saliency detection: A spectral residual approach." 2007 IEEE Conference on computer vision and pattern recognition. Ieee, 2007.
Time series anomaly detection(KDD 2019):Ren, Hansheng, et al. "Time-Series Anomaly Detection Service at Microsoft." Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2019.
特色
第一篇 paper 是 ICLR 2020 的文章,讲了一个纯深度学习的模型,用来预测时间序列,在竞赛上有较好的结果。同时,具有一定的可解释性。比较有意思的是第二篇文章,通过几行代码就可以识别出来一个图片中最显著的关注点位置,这篇文章是 Xiaodi Hou 在本科的时候做出来的,现在引用已经超过了 3000。第三篇文章是 KDD 2019 的文章,主要用来做时间序列中的异常点检测,用到了第二篇文章的技术。
过程
1、N-BEATS
神经网络结构
神经网络的结构如下,输入的是过去一段时间的数据,预测未来一段时间的数据。模型由若干个 stack 组成,各个 stack 的结果加和起来得到最后的预测结果;每个 stack 又由若干个 block 组成,每个 block 会向前和向后预测,向前预测的结果会加和起来得到最后的结果,向后预测的结果用于和原始信号相减,然后给下一个 block 使用。我的理解是,通过这样的方法可以先预测比较明显的 pattern,减去之后再去预测另外的 pattern。

每个 block 内的具体的计算过程如下:

接下来,forecast 和 backcast 的结果是预测出来的系数

可解释性
基底 v 可以学习,也可以规定成相应的反映比如趋势或者周期性的基底,这样就具有一定的可解释性。(什么叫可解释性?感觉这种所谓的可解释性比较弱啊)


ps. 最后还需要做 ensembling,确实我们在实验中也发现对于时间序列的预测,特别是金融里面,ensembing 的效果提升是比较大的。Ensemble 中不同的模型使用不同的 loss function、horizon 和样本(bagging)。不同的 loss function 包括:

实验结果
这里主要看一下这个模型不同 stack 的作用是什么,其中标记为 G 的模型基底是可以学习的,而标记为 I 的模型是指定的基底,这样具有一定的可解释性。可以看到 I 模型中可以现实地要求学习出来各个时间序列的趋势和周期。

2、Saliency detection
显著性检查(saliency detection)的目标是,给定一张图片,输出这个图片中拿一个部分比较有意思。这个任务比较符合人的视觉思维,把一张图片展示给人看的时候,人通常会把注意力集中在图片的特定的一些点上。这里就是想找出图片中的哪些地方比较具有吸引力。
这篇文章从信息论的角度,认为一张图片的信息可以被分为两个部分,即先验信息和这个图片特定的信息。

对于图像来说,给定一个频率 f,可以计算得到图像在该频率下的频谱强度 L(f),把许多图片的频谱强度函数做平均可以得到 A(f) 。由于图片具有缩放不变性,因此对于所有图片的平均来讲,这个频谱满足一定的关系

但是对于特定的图片来说,只是大致趋势上差不多,但是会有一些细节上的特别之处。


把这些特别之处定位出来,再利用傅里叶逆变换就可以锁定图片中比较有意思的部分。文章提出计算 spectral residual R(f),它是单张图片的频谱函数 L(f) 和所有图片的平均 A(f) 的差

它也可以看做是已知图片先验之后,再见到这张图片所提供的信息

另外文章还提出平均谱 A(f) 也不需要根据所有图片取平均,而是直接对给定的这一张图片做平滑即可。

得到 saliency map 的过程总结如下。对于一张图片,做傅里叶变换,得到相应的振幅和相位。把振幅减去该图片平均之后的振幅,然后加上相位做傅里叶逆变换。为了看起来更舒服,对于最后的 saliency map 还用 g(x) 做了一定的平滑。


文章后面还讲了如何把 saliency map 转化为 object map。


3、Time series anomaly detection
这篇文章号称是第一个把 spectral residual 应用到时间序列异常检测。现实中时间序列异常检测遇到如下困难
- Lack of labels:数据很多,但是异常点的标签很少。
- Generalization:需要监测的时间序列数据类型很多,希望模型能适用各种时间序列数据。
- Efficiency:由于是在时间序列上做异常监测,因此需要实时给出反馈,而不能用特别复杂的模型。
文章的做法就是在时间序列上计算 saliency map。


不过最后把哪个点判断为异常点呢?这里文章训练一个 CNN 来做判断。训练数据是人造的数据,并且人为加入异常点,CNN 的输入就是 saliency map 这个时间序列,输出就是在异常点进入的时候给出相应的信号。
