内容字号:默认大号超大号

段落设置:段首缩进取消段首缩进

字体设置:切换到微软雅黑切换到宋体

主页 > CDN >

云服务器_阿里云域名优惠口令_怎么样

2021-07-12 01:00 出处:欧普曼云计算 人气: 评论(0

摘要

在本博客中,SAP-HANA-PAL的动态时间扭曲算法被应用于两个信号的对齐,这两个信号可以用来评估一段长的铁路轨道的质量。该算法快速高效,是预测分析库的一个非常有用的补充,用于解决时间序列的比较和平均问题。

动机

截至2016年,美国每年有近3000万火车乘客,七条一级铁路运营的140000英里铁路每年运输近4000万辆汽车,产生820亿美元的货运收入[1,2] .

由于钢轨缺陷通常是脱轨事故的原因,因此维护铁路的组成部件对于确保列车能够安全行驶非常重要[3]。为了保证安全的交通条件,测试持续使用且对列车运行时间影响最小的轨道是很重要的。由于捣固、道碴清理或更新、轨枕更换、接头修理、钢轨打磨或更换、下部结构处理和其他维护干预,此维护过程成本高昂。

传统上,通过运行测量轨道几何基本参数的专用移动测量车来监测轨道质量每隔三个月左右。通常,检查车测量并记录轨距的变化、垂直和横向定线以及横向水平(轨道上的角度变化等)。这些测量值大约每900毫米记录一次,从最长100公里的长度开始,产生一长串的数据(信号)。

通过将信号与一组先前记录的参考信号进行比较来评估轨道的状况。在完成这项工作之前,需要对两组信号进行校准,以便相应的信号指向轨道上的同一点,并注意必须同时进行匹配。这种匹配通常是通过同时对信号进行目视检查来手动完成的

为了使过程自动化并尽可能缩短匹配长信号序列的时间,我们使用SAP HANA预测分析库(PAL)新的动态时间扭曲算法[4]。自动化这一过程将减少与最佳对齐的视觉估计相关的错误,并加快准确的结果,这对于长距离序列尤其困难。

数据集对应于墨西哥查帕拉湖附近的区域,如图1所示。这是一个自然地形危险的地区,道路横穿西马德雷山脉,这是一个风力条件不断变化的地区,容易进行定期维护[5]。

动态时间扭曲

动态时间扭曲(DTW)是为语音识别而开发的[6],通常用于比较数据序列,机器学习应用中的时间序列或分类样本,用于光学字符识别、机器人技术、医疗应用、时间序列平均等。两个特征向量序列的对齐是通过重复不同的数据点迭代拉伸时间轴,直到两个特征向量序列之间的最佳度量序列以最佳方式最小化。

假设我们要比较两个序列,即目标或查询x=(x1,x2,x3,…,xN)和参考y=(y1,y2,y3,…,yM)。两个序列都从图2所示网格的左下角开始。为了对齐比较序列,必须建立nxm维的距离矩阵C。矩阵C的元素是两个点席席和YJ之间的适当距离,并由CIJ表示,例如对于欧几里得距离,云服务器和服务器,CIJ=(Xi-YJ)2。一旦建立了距离矩阵,大数据学什么,DTW算法就会找到符合边界条件、单调性和步长的对齐路径,它贯穿定义x和y之间映射的矩阵元素。算法及其实现的详细信息可在[6]中找到。

数据集

图1所示轨道沿线的数据约为27000 m,从117 km到144 km。查询集(目标)有88749个点,参考集有91261个点。集合中的三个信号同时对齐,即曲率(Curvatura)、加载轨距(Medidor Cargado)、交叉电平(Nivel Cruzado)。

由于累积距离矩阵C有N x M个条目,经典DTW算法的计算复杂度为O(NM),即对于很长的序列,构建DTW解决方案的计算成本可能非常昂贵。在我们的例子中,距离矩阵C的大小是N x M=8099322000,对于我们正在分析的一小部分轨道,

为了减少这个问题的计算时间和内存需求,我们将引用和查询分别划分为1.2km和1km的子序列,确保分区和查询中的位置之间始终存在重叠,即查询是引用中位置的子集。最终输出仅仅是以1km的间隔排列的信号的附加值,覆盖整个轨道长度。这在图3所示的图像序列中进行了说明。

图3所示的图像说明了作为参考位置函数的参考和查询的交叉电平信号。蓝线对应于参考信号,定位间隔为1公里。图3(b)中信号的结尾对应于图3(d)中信号的开头。类似地,图3(d)中信号的结尾对应于图3(f)中信号的开头。通过以这种方式组合信号,我们获得整个数据集的对齐。这是通过使用HANA固有的预测分析库中的循环和DTW实现的。我们顺便注意到,校准只是为分析预测性维护做准备。一旦我们将参考信号和目标信号对齐,信号沿位置的差异就可以用于分析铁路状况。

我们使用SAP HANA PAL的DTW,使用SQL脚本[4]实现了解决方案,大数据分析应用,并用于比较R和Python的性能。我们发现HANA中的DTW速度非常快,至少快了100倍。R中的解决方案大约需要27秒(包"dtw"[7]),python中需要20秒(包"dtw python"[8]),HANA中使用sqlpal只需要不到一秒的时间来计算整个数据集。SQL脚本和数据可以通过联系作者或在github存储库中获得[9]。附录中提供了演示双通道DTW使用的示例代码。

备注

DTW算法在数据科学中有许多应用,铁路预测性维护只是其中之一。DTW算法是SAP HANA 2 SPS05和SAP HANA Cloud中SAP HANA预测分析库的一个受欢迎的补充。我们目前正在使用此算法对时间序列进行平均[10],并将其应用于海事感知。本文将在不久的将来介绍时间序列平均法的程序及其在利用DTW构建船舶从一个港口到另一个港口的路径中的应用。

参考文献

[1]https://www.amtrak.com/content/dam/projects/dotcom/english/public/documents/corporate/nationalfactsheets/National-Fact-Sheet-FY2016-0717.pdf

[2] https://gacc.nifc.gov/sacc/predictive/intelligence/NationalLargeIncidentYTDReport.pdf

[3] https://railroads.dot.gov/

[4]SAP HANA预测分析库(PAL)https://help.sap.com/viewer/2cfbc5cf2bc14f028cfbe2a2bba60a50/2.0.05/en-US

[5] https://theguadalajarareporter.net/index.php/news/news/lake-chapala/53457-firefers-battle-wildfire-in-chapala-mountain-range-2

[6]Sakoe H.,千叶S.(1978)。"语音识别的动态规划算法优化。声学。语音信号处理,海量数据,卷ASSP-26,43-49。https://ieeexplore.ieee.org/document/1163055

[7]Giorgino,T.(2009)。在R中计算和可视化动态时间扭曲对齐:"dtw"包。统计软件杂志,31(7),1-24,doi:10.18637/jss.v031.i07。

[8]python包"dtw python"https://pypi.org/project/dtw-python/

[9]SAP HANA机器学习Github:https://github.com/SAP-samples/hana-ml-samples/tree/master/PAL-SQL/usecase\u示例

分享给小伙伴们:
本文标签: 服务器阿里域名优惠口令口令怎么样

相关文章

评论

发表评论愿您的每句评论,都能给大家的生活添色彩,带来共鸣,带来思索,带来快乐。

签名: 验证码: 点击我更换图片

评论列表