Processing math: 100%
  • 中国出版政府奖提名奖

    中国百强科技报刊

    湖北出版政府奖

    中国高校百佳科技期刊

    中国最美期刊

    留言板

    尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

    姓名
    邮箱
    手机号码
    标题
    留言内容
    验证码

    基于长短期记忆神经网络的实时地震烈度预测模型

    胡进军 丁祎天 张辉 靳超越 汤超

    胡进军, 丁祎天, 张辉, 靳超越, 汤超, 2023. 基于长短期记忆神经网络的实时地震烈度预测模型. 地球科学, 48(5): 1853-1864. doi: 10.3799/dqkx.2022.338
    引用本文: 胡进军, 丁祎天, 张辉, 靳超越, 汤超, 2023. 基于长短期记忆神经网络的实时地震烈度预测模型. 地球科学, 48(5): 1853-1864. doi: 10.3799/dqkx.2022.338
    Hu Jinjun, Ding Yitian, Zhang Hui, Jin Chaoyue, Tang Chao, 2023. A Real-Time Seismic Intensity Prediction Model Based on Long Short-Term Memory Neural Network. Earth Science, 48(5): 1853-1864. doi: 10.3799/dqkx.2022.338
    Citation: Hu Jinjun, Ding Yitian, Zhang Hui, Jin Chaoyue, Tang Chao, 2023. A Real-Time Seismic Intensity Prediction Model Based on Long Short-Term Memory Neural Network. Earth Science, 48(5): 1853-1864. doi: 10.3799/dqkx.2022.338

    基于长短期记忆神经网络的实时地震烈度预测模型

    doi: 10.3799/dqkx.2022.338
    基金项目: 

    国家自然科学基金重点项目 U1939210

    中国地震局工程力学研究所基本科研业务费专项 2021EEEVL0103

    详细信息
      作者简介:

      胡进军(1978-),男,研究员,博士生导师,研究方向为地震动模型和强度指标工作. ORCID: 0000-0001-7151-0049. E-mail: hujinjun@iem.ac.cn

      通讯作者:

      胡进军,E-mail: hujinjun@iem.ac.cn

    • 中图分类号: P315

    A Real-Time Seismic Intensity Prediction Model Based on Long Short-Term Memory Neural Network

    • 摘要: 实时烈度预测可在破坏性地震波到达前,根据P波估计地震可能造成的最大影响.预警对象可以采取措施,降低可能造成的损失.P波位移幅值是一种有效估计地震动峰值的参数,然而单个或多个参数难以全面表征地震动中的信息.同时,参数的计算需要确定时间窗大小,无法实现连续预测.为了解决上述问题,提出了一种基于长短期记忆网络的实时地震烈度预测模型.基于2010-2021年K-NET数据构建模型,并选取2022年3月MJMA7.3地震事件作为案例验证模型.结果表明,P波到达后可以在记录的每个时间步预测烈度,P波到达3 s时在测试集中准确率为96.47%.提出的LSTM模型改善了烈度预测的准确性和连续性,可为地震预警、应急响应等提供科学依据.

       

    • 破坏性地震已经在多个国家造成人员伤亡、经济损失等灾难性后果.仪器地震烈度能够可观、快速地反映地震对工程建筑的影响程度,因此在灾情处置、应急响应等方面仪器地震烈度发挥了不可替代的作用(陈以伦和金星,2016孙得璋等,2018刘如山等,2021).由于以上各种需求,仪器地震烈度也被广泛应用于地震预警中,以在破坏性地震波到达前获取地震可能造成破坏程度的强弱(Hoshiba et al.,2008Yamamoto et al.,2008).目前,许多国家已经开发或正在建设自己的地震预警系统并在防灾减震中发挥了重要的作用,例如墨西哥(Suárez et al.,2018)、韩国(Sheen et al.,2017)、日本(Kamigaichi et al.,2009)等国家.现地地震预警的目的是根据P波段信息预测地震动峰值并发布地震预计造成的破坏(Kanamori,2005),从而使预警对象采取不同应对措施以减小损失.例如,日本预警系统面向不同需求的用户采取不同的预警策略并发布预测的仪器地震烈度,使人员、重要设施等采取不同应对措施(Hoshiba et al.,2008).因此,快速、准确的预测仪器地震烈度对于防灾减灾尤为重要.

      传统的现地地震预警方法需要通过特征参数代表P波中蕴含的信息,其中位移幅值(peak P⁃wave displacement amplitude,Pd)是一种被广泛应用的特征参数(Wu and Kanamori,2005).我们通过对加速度记录二次积分得到位移,滤波后的位移幅值即为特征参数Pd.最近,研究人员提出了能够更全面表示P波中时域和频域信息的特征参数,例如速度二次积分(squared velocity integral,IV2)、位移二次积分(squared velocity integral,ID2)等(Festa et al.,2008Wang and Zhao,2018).目前单个特征参数难以较为全面地代表P波中蕴含的信息,因此基于多参数的预测模型被提出,其提高了预测中的准确性并减少了不确定性(Nazeri et al.,2017Zollo et al.,2010).然而,基于有限特征参数(例如Pd等)无法完整代表P波中的信息,选取不同参数会导致模型预测效果出现较大的差异,并且基于多参数的模型还存在难以选取和解释特征参数的问题.

      由于震源、路径、场地等因素,地震的传播是一个复杂的过程,随着到达台站的地震信息增多,预测也会更加的准确并为后续的灾后救援提供依据.因此,地震烈度预测的连续性也显得尤为重要.基于参数的预测模型需要确定时间窗长度并通过拓展时间窗的方式以达到连续预测的效果,但由于时间窗之间存在一定时间的间隔,使得采取时间窗的连续预测方法会导致预警时间的减少.为了解决上述问题,本文通过应用深度学习方法来实时预测地震烈度.

      近些年来,深度学习已被成功应用于计算机视觉、语音识别、目标检测等各个领域(Deng and Yu,2014Zhao et al.,2019).最近,在土木工程等各个领域中深度学习也得到了成功的应用(Xie et al.,2020Xu et al.,2021Zhang et al.,2021Zhu et al.,2021储德平等,2021左仁广等,2021Zhang and Phoon,2022).地震记录是时间序列数据,深度学习中的循环神经网络(Recurrent Neural Network,RNN)表现出对时间序列任务的卓越性能(Graves et al.,2006).其中,LSTM是基于循环神经网络的改进模型(Hochreiter and Schmidhuber,1997),已被证明适合于长序列的数据输入(Yu et al.,2019Sherstinsky,2020).

      针对以上基于参数的预测模型中存在参数选取、解释以及预测连续性的问题,本文提出了基于长短期记忆网络(Long short⁃term memory,LSTM)的烈度预测模型,该模型采用数据驱动的方法有效解决了上述问题,其核心是建立了连续P波与烈度之间的映射关系.选取K⁃NET强震台网的地震记录建立并测试烈度预测模型,并且将其对比了在3 s时间窗下Pd模型的预测结果.此外,选取2022年3月MJMA7.3的未处理的地震事件作为案例,真实验证了模型的有效性和泛化性.

      本文基于K⁃NET(Kyoshin network)数据库2010年1月至2021年8月的地震动记录,选取大于MJMA4.0且震源距小于200 km记录到的事件(Peng et al.,2017).由于训练数据质量对机器学习模型的性能有着较大的影响,因此选取三分量加速度分别大于0.02 m/s-2Wang et al.,2022),并限制了数据的信噪比大于5 dB(Carranza et al.,2013).根据以上条件选取其中2010年至2018年1 020个台站的52 560组三分量记录,随机划分90%作为训练集、10%作为验证集,选取2019年至2021年的849个台站的9 166组地震动记录作为测试集.震级、震中位置分布和台站的位置分布如图 1所示.数据集的震级和距离关系和震级烈度的记录数量分布如图 2图 3所示.

      图  1  台站在训练集、测试集(a)和案例集(c)以及震中位置在训练集、测试集(b)和案例集(d)上的分布
      Fig.  1.  Distribution of stations on training set, test set (a) and case set (c), and location of the epicenters on training set, test set (b) and case set (d)
      图  2  地震动数据的分布
      a.震级‒数量分布;b.仪器地震烈度‒数量分布
      Fig.  2.  Distribution of ground motion
      图  3  震级和震源距关系
      Fig.  3.  Magnitude and source distance relationship

      由于地震动记录通常存在偏离零线的现象,因此使用加速度记录减去其均值校正零线,之后采用长短时平均(Short⁃Term Average/Long⁃Term Average,STA/LTA)判别方法自动拾取P波到达的时间并采用人工核准记录.最后,选取25 s时间窗长度的加速度记录以及在P波到达前1 s的数据作为模型的输入.图 4为选取地震动输入特征和标签的示意图.因此,地震动记录仅需要做零线校正处理而无需计算其他参数,即可用于实时烈度的预测.

      图  4  选取的输入特征和标签
      Fig.  4.  Selected input features and labels

      本文的目标是实时预测最大地震烈度,计算日本气象厅(Japan Meteorological Agency,JMA)地震烈度首先需要使用特定的滤波器分别对三分量加速度滤波,随后根据公式(1)合成得到加速度.最后,选取有效峰值加速度为0.3 s时对应的加速度ac带入公式(2)中计算得到地震烈度.

      a(ti)=a2(ti)EW+a2(ti)NS+a2(ti)UD, (1)

      其中a(ti)EW为东西分量加速度时程,a(ti)NS为南北分量加速度时程,a(ti)UD为竖向加速度时程,a(ti)为三分量合成的加速度值.

      I=2×log10(ac)+0.94, (2)

      ac中有效峰值加速度为0.3 s时对应的加速度,I为JMA地震烈度.

      1996年定义的JMA地震烈度使用频域滤波器,其需要将时域上的加速度转换到频域后滤波,再通过傅里叶逆变换将其变回时域.而频域滤波器无法做到实时计算地震烈度,因此(Kunugi et al.,2013)设计了时域滤波器,其可以实时计算地震烈度,本文采用了该方法计算JMA地震烈度.

      LSTM(Hochreiter and Schmidhuber,1997)是RNNs的一种,它是以LSTM神经元为基础组成的神经网络.由于RNNs模型的输入根据数据的先后是事件的,所以RNNs模型相较于其他神经网络模型(例如,全连接网络(Full Connect Neural Network,FC⁃Net)、卷积神经网络(Convolutional Neural Networks,CNN)等)更适合处理时间事件数据.LSTM相比于简单RNN模型,通过更加复杂的网络结构解决了梯度消失的问题更加适合长事件数据的输入,因此其十分适合用于烈度估计中的长时序数据预测.

      LSTM神经网络是由一组LSTM单元以及全连接神经网络组合而成,每个LSTM单元如同其他神经网络是由神经元中的权重、偏置项以及激活函数构成的(如图 5所示).特殊的门单元组成了LSTM单元,其包括状态单元、遗忘门、输入门以及输出门.状态单元的作用是将前序单元的状态信息传递到后序的LSTM单元中,其是LSTM单元的核心.接收到状态单元传递的信息后需要丢弃不重要的信息,这是通过遗忘门来完成的,其被定义为公式(3):

      图  5  LSTM单元在时间t时刻的示意
      Fig.  5.  Schematic diagram of the LSTM cell at time t
      ft=σ(Wf[ht1,xt]+bf), (3)

      其中xtt时刻的加速度,ht-1是上一时间步中隐藏层的输出,Wfbf分别是单元的权重项和偏置项,σ是激活函数.丢弃前序状态单元中不重要的信息后,使用输入门决定更新状态单元的信息,描述为公式(4)和公式(5):

      it=σ(Wi·[ht1,xt]+bi), (4)
      ˜Ct=tanh(WC·[ht1,xt]+bc), (5)

      其中WiWC是单元的权重项,bibc是单元的偏置项.通过遗忘门忘记前一时间步中的一部分信息,再经过输入门输入当前时间步中的一部分信息,更新后的状态单元信息表示为:

      Ct=ft×Ct1+itטCt, (6)

      更新状态单元后,需要将ht-1xt经过输出门的sigmoid层,然后将状态单元Ct经过tanh层的向量相乘,最终得到单元在该时间步的输出ht.该步骤表示为公式(7)和公式(8):

      ot=σ(Wo[ht1,xt]+bo), (7)
      ht=ot×tanh(Ct). (8)

      基于LSTM神经网络的实时烈度预测模型是由多层LSTM单元以及全连接神经网络构成的,如图 6所示.全连接网络是将输入乘以权重矩阵W再加上偏置向量b后得到输出,其作用是将LSTM单元中隐藏层的输出维度变为目标值的维度.LSTM网络中使用反向传播训练模型(Wang and Jiang,2015),本文在更新优化模型系数时选取Adam优化器(Kingma and Ba,2014),其目的是为了得到最小的损失函数.预测的目标值是连续值,因此该问题被归为回归问题,回归问题的损失函数通常定义为均方误差:

      图  6  LSTM网络架构
      Fig.  6.  Architecture of LSTM Network
      MSE=ni=1(ˆyy)2 (9)

      其中ˆyy是地震烈度的预测值和观测值,n是选取时间窗内采样点的个数.本文中地震记录的采样频率为100 Hz,选取26 s时间窗共2 600个采样点.

      超参数的选取决定着网络结构、模型参数等,不合适的超参数会导致模型训练中无法找到最优解(Reimers and Gurevych,2017).为了获得最优模型,接下来对网络的超参数进行调整,并在完成训练网络后在验证集上确定模型的超参数.

      LSTM的网络结构是由网络层数和隐藏单元个数这两个超参数决定的.本文选取1~4层的网络层数以及8~128个隐藏单元共20种网络结构,本文选取的网络结构如表 1所示.表 1给出了不同网络结构在验证集上性能和训练效率,均方误差代表了每个样本中所有时间步的预测与观测值的误差之和,训练时间代表了模型的训练所需的时间.

      表  1  不同LSTM网络结构的MSE和训练时间(验证集)
      Table  Supplementary Table   MSE and training time for different LSTM network structures (validation set)
      No. 网络层数 隐层单元数量 MSE 训练时间
      1 1 8 828.350 6 13 477.373 6
      2 1 16 667.354 3 14 354.786 8
      3 1 32 569.153 7 16 753.753 1
      4 1 64 448.534 1 13 578.841 5
      5 1 128 392.617 7 6 252.108 5
      6 2 8 355.553 5 22 833.113 7
      7 2 16 328.543 4 23 788.3574
      8 2 32 267.564 8 22 879.357 4
      9 2 64 228.820 8 20 708.898 1
      10 2 128 224.943 3 22 326.148 8
      11 3 8 297.358 7 32 443.092 9
      12 3 16 276.548 6 34 512.365 7
      13 3 32 257.789 3 33 574.789 3
      14 3 64 234.638 5 32 876.654 7
      15 3 128 238.049 9 29 957.053 3
      16 4 8 295.915 5 39 464.159 2
      17 4 16 268.465 1 40 873.546 1
      18 4 32 243.165 7 37 453.312 8
      19 4 64 225.267 7 33 316.395 8
      20 4 128 226.192 1 38 112.503 2
      注:其他超参数的值为:Learning rate=10-3 Batch size=50; Maximum iterations=100 (Early stop=30).
      下载: 导出CSV 
      | 显示表格

      随着模型的深度以及隐藏单元个数的增加,深度学习模型会变得更加复杂.如果模型参数过多而训练样本不足,容易导致模型在训练集上损失较小,预测准确率较高;但是在测试集上损失较大,预测准确率较低,即过拟合现象.丢失率是通过忽略一部分的神经单元的方法,有效缓解网络的过拟合现象(Srivastava et al.,2014).总的来说,丢弃率(dropout)使用推荐的0.2可以很好地防止可能出现的过拟合现象,然而对于只有一个隐藏层的网络,丢失率是无效的.

      表 1中可以看出,网络层数为1的LSTM模型的均方误差均大于其他网络结构;模型网络层数为2,隐藏单元数量为128时模型的表现最佳;网络层数增加到3时,128个隐藏单元的网络表现反而不如64个隐藏单元的网络,同样的现象也出现在网络层数为4的网络结构中.总的来看,在所有模型中模型网络层数为2、隐藏单元数量为128时,模型在验证集上的均方误差(mean⁃square error,MSE)最小、性能最优.

      在测试集验证本文构建的烈度预测模型,对模型的准确率和效率评价,并将LSTM模型与传统Pd方法的预测结果对比.

      图 7a7b表示模型P波到达后在测试集上MSE和准确率随时间变化的关系.其中,准确率被认为是预测结果与真实结果相差在1度地震烈度内,则被归类为正确预测;反之,如果预测结果与真实结果相差大于1度的地震烈度则被归类为错误的预测(Otake et al.,2020).图 7a7b显示出模型随着到达台站的信息增加,误差不断减小,预测的准确率不断提高,即预测值与真实值之间的误差稳步降低.在P波达到1 s时准确率为91.36%,3 s后可以看出模型预测的准确率可以达到96.47%,并且MSE快速趋于收敛.总体来看,P波到达后短时间内模型可以进行粗略预测,随着地震波的到达和地震信息的更新,模型可以快速降低预测的误差,提高预测的准确率.

      图  7  P波到达后MSE(a)和准确率(b)随时间变化的关系
      Fig.  7.  Relationship of MSE (a) and accuracy (b) with time after P-wave arrival

      地震烈度的估计不止需要高精度的预测结果,而且需要高效的预测结果.因为只有在极短时间内给出预测结果,才能够使得预警对象有充足的反应时间.机器学习模型的训练通常需要较长的时间,而完成训练后模型可以快速完成预测,表 2中给出了模型训练以及模型预测时间(GPU:RTX⁃3060).从表 2中可以看出训练所需的时间相对较长,可以在地震未发生时对模型训练与调参.预测每个样本时(参数计算的时间可以忽略)可以在10-3 s以内完成,因此可以满足地震响应所需的时效性.

      表  2  不同阶段模型的计算效率
      Table  Supplementary Table   Computational efficiency of models at different stages
      阶段 时间
      输入信息计算时间 忽略
      训练模型时间(共47 304样本) 1.78×101 s
      测试模型时间(共9 166样本) 3.153 3×101
      案例数据集上测试模型时间(每个样本) 3.440×10-3 s
      下载: 导出CSV 
      | 显示表格

      Pd方法通过3 s时间窗的峰值位移来预测最终的峰值加速度.该方法具有较高的精度和鲁棒性,同时由于拟合公式简单,因此在地震发生后可以高效地预测峰值响应(Wu and Zhao,2006).选用并划分与前文相同的数据集,进行拟合得到Pd预测模型.

      图 8a图 8b为LSTM模型和Pd模型时间窗为3 s时的对比图,其中横轴为地震烈度的观测值,纵轴为模型的预测值.深灰色区域表示模型正确预测最大地震烈度,而黄色区域表示预测结果高于观测值,浅蓝色区域表示预测结果低于观测值.图 8中可以明显看出在高烈度区域Pd模型低估现象较为明显,而LSTM模型对高烈度区的低估现象有明显改善,同时LSTM模型在低烈度区域收敛性也更好.表 3中对比了两个模型的准确率和MSE指标,可以看出LSTM模型优于Pd模型.

      图  8  3 s时间窗时的预测值和观测值
      a. LSTM模型;b. Pd模型的对比
      Fig.  8.  Comparison of predicted and observed values at 3-second time window
      表  3  3秒时间窗时Pd和LSTM模型的评价指标
      Table  Supplementary Table   Evaluation metrics for Pd and LSTM models at 3-second time windows
      评价指标 Pd方法 LSTM方法
      准确率(%) 90.17 96.47
      MSE 0.379 5 0.369 1
      下载: 导出CSV 
      | 显示表格

      为了验证LSTM模型训练完成后在一次地震中的整体表现,本文选取2022年3月发生的MJMA7.3地震,对震源距为200 km以内的所有台站记录共80个进行测试,并未对地震记录做其他筛选.震中位置分布和台站的位置分布如图 9a所示,图 9b为预测烈度的空间分布,图 9c显示了所有台站记录烈度的数据分布.

      图  9  案例中震源(a)和台站的位置以及烈度的空间分布(b)和数据分布(c)
      Fig.  9.  Location of the epicenter and stations(a), and spatial distribution (b) and data distribution (c) of intensities on case set

      图 10描述了实时估计的烈度与最大观测烈度之间的残差.在台站刚触发后烈度预测的残差仍较大,但随着时间残差逐渐减小.在烈度为2.5≤ MJMA < 4.5(灰色实线和橙色实线)的台站中烈度没有明显高估,而对于4.5≤ MJMA < 6.5(黑色实线和红色实线),在前2 s时烈度明显被低估.然而,残差随着时间的增加逐渐减小,高烈度低估问题随着时间的增加而改善.

      图  10  台站被触发后烈度估计的误差与时间之间的关系
      Fig.  10.  Relationship between the intensity estimation errors and the time after the station is triggered

      为了清晰直观地说明模型预测的地震烈度和实时仪器地震烈度随时间的变化,绘制了不同模型预测与观测烈度的实时变化图.图 11a~11l代表了在不同烈度范围的预测效果,横轴的零值代表P波到达的时间,纵轴代表地震烈度,不同颜色的虚线代表不同的模型,黄色点线代表观测的实时烈度,水平红线代表观测的最大烈度,图 11中的时间代表实时烈度到达最大烈度的时刻.最大烈度在5~6度范围时,模型可以P波到达后的最初几秒成功预测最大烈度(图 11a~11f).例如,图 11a显示出最大烈度在15.56 s时到达,模型可以在第2 s左右成功预测到最大震动烈度.从图 11g~11l中可以看出,最大烈度为3~4度范围时,模型在第1 s至第4 s即可准确预测最大烈度.因此,预测模型可以提前在最大烈度到来之前预测出最终烈度,为不同目标对象争取了采取应对措施的时间.

      图  11  (a)~(l)分别为不同烈度下仪器地震烈度的预测值和观测值随时间变化的关系
      Fig.  11.  (a) to (l) are the predicted and observed values of the instrumental seismic intensity with time for different intensities

      针对基于参数预测方法中存在的参数选取、解释以及预测连续性问题,本文提出了一种基于LSTM的实时烈度预测模型.选取日本K⁃NET强震数据训练、测试模型,并对比了传统Pd预测方法.最后,选取2022年3月MJMA7.3的地震事件进行案例验证.本研究得到以下结论:

      (1)本文提出的烈度预测模型基于原始记录进行预测,解决了传统方法中参数选取的问题.基于参数预测方法中需要对原始记录进行预处理并计算出代表记录一定特征的参数,而LSTM模型则无需进行复杂的预处理,其直接采用原始记录作为输入,更能全面代表记录中蕴含的信息.

      (2)在预测的连续性方面,LSTM预测模型依据台站的采样频率连续预测,解决了传统方法中使用扩展时间窗的问题.传统方法中通常采用扩展时间窗的方法,时间窗之间存在的时间间隔导致预警时间的减少.本文提出的LSTM模型在每个时间步上进行预测,增加了预警时间,使得预警目标有更多的应对时间.

      (3)提出的基于LSTM模型比Pd模型更加准确且高效.在测试集上P波到达3 s后准确率可以达到96.47%,并且随着到达台站地震信息的更新模型的误差快速收敛,模型预测的准确率不断提高.通过对比得到,在3 s时间窗时LSTM模型的评价指标都优于Pd模型.同时,预测可以在10-3 s以内完成满足时效性.

      本文基于长短时神经网络实时预测地震烈度,在烈度预测中具有一定的工程应用价值.目前有许多快速获取地震烈度的方法,例如USGS(United States Geological Survey)开展的ShakeMap项目,其应用是在震后快速提供地面运动和烈度的地图.区别于这类用于震后响应的方法,本文的模型主要应用于现地地震预警中,可根据P波提前预测出台站位置可能的最大烈度.本文使用的K⁃NET强震台网,其台站密度大,地震事件丰富,训练得到的模型具有较好的性能.但对于台站稀疏、地震事件较少的地区,需要更多的适用性验证和评估.因此,接下来我们将利用日本数据与其他地区数据的相似性,结合迁移学习等方法将模型应用到台站稀疏、地震事件较少的地区.

    • 图  1  台站在训练集、测试集(a)和案例集(c)以及震中位置在训练集、测试集(b)和案例集(d)上的分布

      Fig.  1.  Distribution of stations on training set, test set (a) and case set (c), and location of the epicenters on training set, test set (b) and case set (d)

      图  2  地震动数据的分布

      a.震级‒数量分布;b.仪器地震烈度‒数量分布

      Fig.  2.  Distribution of ground motion

      图  3  震级和震源距关系

      Fig.  3.  Magnitude and source distance relationship

      图  4  选取的输入特征和标签

      Fig.  4.  Selected input features and labels

      图  5  LSTM单元在时间t时刻的示意

      Fig.  5.  Schematic diagram of the LSTM cell at time t

      图  6  LSTM网络架构

      Fig.  6.  Architecture of LSTM Network

      图  7  P波到达后MSE(a)和准确率(b)随时间变化的关系

      Fig.  7.  Relationship of MSE (a) and accuracy (b) with time after P-wave arrival

      图  8  3 s时间窗时的预测值和观测值

      a. LSTM模型;b. Pd模型的对比

      Fig.  8.  Comparison of predicted and observed values at 3-second time window

      图  9  案例中震源(a)和台站的位置以及烈度的空间分布(b)和数据分布(c)

      Fig.  9.  Location of the epicenter and stations(a), and spatial distribution (b) and data distribution (c) of intensities on case set

      图  10  台站被触发后烈度估计的误差与时间之间的关系

      Fig.  10.  Relationship between the intensity estimation errors and the time after the station is triggered

      图  11  (a)~(l)分别为不同烈度下仪器地震烈度的预测值和观测值随时间变化的关系

      Fig.  11.  (a) to (l) are the predicted and observed values of the instrumental seismic intensity with time for different intensities

      表  1  不同LSTM网络结构的MSE和训练时间(验证集)

      Table  1.   MSE and training time for different LSTM network structures (validation set)

      No. 网络层数 隐层单元数量 MSE 训练时间
      1 1 8 828.350 6 13 477.373 6
      2 1 16 667.354 3 14 354.786 8
      3 1 32 569.153 7 16 753.753 1
      4 1 64 448.534 1 13 578.841 5
      5 1 128 392.617 7 6 252.108 5
      6 2 8 355.553 5 22 833.113 7
      7 2 16 328.543 4 23 788.3574
      8 2 32 267.564 8 22 879.357 4
      9 2 64 228.820 8 20 708.898 1
      10 2 128 224.943 3 22 326.148 8
      11 3 8 297.358 7 32 443.092 9
      12 3 16 276.548 6 34 512.365 7
      13 3 32 257.789 3 33 574.789 3
      14 3 64 234.638 5 32 876.654 7
      15 3 128 238.049 9 29 957.053 3
      16 4 8 295.915 5 39 464.159 2
      17 4 16 268.465 1 40 873.546 1
      18 4 32 243.165 7 37 453.312 8
      19 4 64 225.267 7 33 316.395 8
      20 4 128 226.192 1 38 112.503 2
      注:其他超参数的值为:Learning rate=10-3 Batch size=50; Maximum iterations=100 (Early stop=30).
      下载: 导出CSV

      表  2  不同阶段模型的计算效率

      Table  2.   Computational efficiency of models at different stages

      阶段 时间
      输入信息计算时间 忽略
      训练模型时间(共47 304样本) 1.78×101 s
      测试模型时间(共9 166样本) 3.153 3×101
      案例数据集上测试模型时间(每个样本) 3.440×10-3 s
      下载: 导出CSV

      表  3  3秒时间窗时Pd和LSTM模型的评价指标

      Table  3.   Evaluation metrics for Pd and LSTM models at 3-second time windows

      评价指标 Pd方法 LSTM方法
      准确率(%) 90.17 96.47
      MSE 0.379 5 0.369 1
      下载: 导出CSV
    • Carranza, M., Buforn, E., Colombelli, S., et al., 2013. Earthquake Early Warning for Southern Iberia: A P Wave Threshold‐Based Approach. Geophysical Research Letters, 40: 4588-4593. https://doi.org/10.1002/grl.50903
      Chen, Y. L., Jin, X., 2016. A Continuous Real⁃Time Method for Seismic Intensity Prediction. Earthquake Engineering and Engineering Dynamics, 36(6): 22-29 (in Chinese with English abstract).
      Chu, D. P., Wan, B., Li, H., et al., 2021. Geological Entity Recognition Based on ELMO⁃C0NN⁃BiLSTM⁃CRF Model. Earth Science, 46(8): 3039-3048 (in Chinese with English abstract). doi: 10.12090/j.issn.1006-6616.2021.27.03.035
      Deng, L., Yu, D., 2014. Deep Learning: Methods and Applications. Foundations and Trends in Signal Processing, 7: 197-387. https://doi.org/10.1561/2000000039
      Festa, G., Zollo, A., Lancieri, M., 2008. Earthquake Magnitude Estimation from Early Radiated Energy. Geophysical Research Letters, 35(22): L22307. https://doi.org/10.1029/2008GL035576
      Graves, A., Fernández, S., Gomez, F., et al., 2006. Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurrent Neural Networks. In: Proceedings of the 23rd International Conference on Machine Learning. Association for Computing Machinery, New York, 369-376. https://doi.org/10.1145/1143844.1143891
      Hochreiter, S., Schmidhuber, J., 1997. Long Short⁃Term Memory. Neural Computation, 9: 1735-1780. https://doi.org/10.1162/neco.1997.9.8.1735
      Hoshiba, M., Kamigaichi, O., Saito, M., et al., 2008. Earthquake Early Warning Starts Nationwide in Japan. EOS, Transactions American Geophysical Union, 89: 73-74. https://doi.org/10.1029/2008EO080001
      Kamigaichi, O., Saito, M., Doi, K., et al., 2009. Earthquake Early Warning in Japan: Warning the General Public and Future Prospects. Seismological Research Letters, 80: 717. https://doi.org/10.1785/gssrl.80.5.717
      Kanamori, H., 2005. Real⁃Time Seismology and Earthquake Damage Mitigation. Annu. Rev. Earth Planet. Sci. , 33: 195-214. https://doi.org/10.1146/annurev.earth.33.092203.122626
      Kingma, D. P., Ba, J., 2014. ADAM: A Method for Stochastic Optimization. https://doi.org/10.48550/arXiv.1412.6980
      Kunugi, T., Aoi, S., Nakamura, H., et al., 2013. An Improved Approximating Filter for Real⁃Time Calculation of Seismic Intensity. Zisin, 2: 223-230. https://doi.org/10.4294/zisin.65.223
      Liu, R. S., Xiong, M. P., Ma, Q., et al., 2021. Vulnerability Study for High Voltage Electrical Equipment in Substations Based on Instrumental Seismic Intensity. Journal of Natural Disasters, 30(2): 14-23 (in Chinese with English abstract).
      Nazeri, S., Shomali, Z. H., Colombelli, S., et al., 2017. Magnitude Estimation Based on Integrated Amplitude and Frequency Content of the Initial P Wave in Earthquake Early Warning Applied to Tehran, Iran. Bulletin of the Seismological Society of America, 107: 1432-1438. https://doi.org/10.1007/978⁃3⁃642⁃55903⁃7_92
      Otake, R., Kurima, J., Goto, H., et al., 2020. Deep Learning Model for Spatial Interpolation of Real‐Time Seismic Intensity. Seismological Research Letters, 91: 3433-3443. https://doi.org/10.1785/0220200006
      Peng, C. Y., Yang, J. S., Zheng, Y., et al., 2017. New Τc Regression Relationship Derived from all P Wave Time Windows for Rapid Magnitude Estimation. Geophysical Research Letters, 44: 1724-1731. http://www.researchgate.net/profile/Peng_Chaoyong/publication/313653194_New_t_c_regression_relationship_derived_from_all_P-wave_time_windows_for_rapid_magnitude_estimation/links/59d21862a6fdcc181ad5e238/New-t-c-regression-relationship-derived-from-all-P-wave-time-windows-for-rapid-magnitude-estimation.pdf
      Reimers, N., Gurevych, I., 2017. Optimal Hyperparameters for Deep LSTM⁃Networks for Sequence Labeling Tasks. Geophysical Research Letters, 44(4): 1724-1731. https://doi.org/10.1002/2016GL071672
      Sheen, D. H., Park, J. H., Chi, H. C., et al., 2017. The First Stage of an Earthquake Early Warning System in South Korea. Seismological Research Letters, 88: 1491-1498. https://doi.org/10.1785/0220170062
      Sherstinsky, A., 2020. Fundamentals of Recurrent Neural Network (RNN) and Long Short⁃Term Memory (LSTM) Network. Physica D: Nonlinear Phenomena, 404: 132306. https://doi.org/10.1016/j.physd.2019.132306
      Srivastava, N., Hinton, G., Krizhevsky, A., et al., 2014. Dropout: A Simple Way to Prevent Neural Networks from Overfitting. The Journal of Machine Learning Research, 15: 1929-1958. http://pdfs.semanticscholar.org/6c8b/30f63f265c32e26d999aa1fef5286b8308ad.pdf
      Suárez, G., Espinosa Aranda, J. M., Cuéllar, A., et al., 2018. A Dedicated Seismic Early Warning Network: The Mexican Seismic Alert System (SASMEX). Seismological Research Letters, 89: 382-391. https://doi.org/10.1785/0220170184
      Sun, D. Z., Zhang, R. P., Sun, B. T., 2018. Discussion on the Application of Instrumental Intensity for Seismic Intensity Assessment. Building Structure, 48(S2): 279-283 (in Chinese with English abstract). http://en.cnki.com.cn/Article_en/CJFDTotal-JCJG2018S2057.htm
      Wang, S., Jiang, J., 2015. Learning Natural Language Inference with LSTM. In: Proceedings of the Human Language Technologies: The 2016 Annual Conference of the North American Chapter of the Association for Computational Linguistics. Association for Computational Linguistics. Association for Computational Linguistics, Stroudsburg. https://doi.org/10.48550/arXiv.1512.08849
      Wang, Y., Li, X., Li, L., et al., 2022. New Magnitude Proxy for Earthquake Early Warning Based on Initial Time Series and Frequency. Seismological Research Letters, 93: 216-225. https://doi.org/10.1785/0220210106
      Wang, Z., Zhao, B., 2018. Method of Accurate⁃Fast Magnitude Estimation for Earthquake Early Warning: Trial and Application for the 2008 Wenchuan Earthquake. Soil Dynamics and Earthquake Engineering, 109: 227-234. https://doi.org/10.1016/j.soildyn.2018.03.006
      Wu, Y., Kanamori, H., 2005. Rapid Assessment of Damage Potential of Earthquakes in Taiwan from the Beginning of P Waves. Bulletin of the Seismological Society of America, 95: 1181-1185. https://doi.org/10.1785/0120040193
      Wu, Y. M., Zhao, L., 2006. Magnitude Estimation Using the First Three Seconds P‐Wave Amplitude in Earthquake Early Warning. Geophysical Research Letters, 33(16): L16312. https://doi.org/10.1029/2006GL026871
      Xie, Y., Ebad Sichani, M., Padgett, J. E., et al., 2020. The Promise of Implementing Machine Learning in Earthquake Engineering: A State⁃of⁃the⁃Art Review. Earthquake Spectra, 36: 1769-1801. https://doi.org/10.1177/8755293020919419
      Xu, Y., Lu, X., Cetiner, B., et al., 2021. Real‐Time Regional Seismic Damage Assessment Framework Based on Long Short‐Term Memory Neural Network. Computer‐Aided Civil and Infrastructure Engineering, 36: 504-521. https://doi.org/10.1080/13632469.2020.1826371
      Yamamoto, S., Rydelek, P., Horiuchi, S., et al., 2008. On the Estimation of Seismic Intensity in Earthquake Early Warning Systems. Geophysical Research Letters, 35(7): L07302. https://doi.org/10.1029/2007GL033034
      Yu, Y., Si, X., Hu, C., et al., 2019. A Review of Recurrent Neural Networks: LSTM Cells and Network Architectures. Neural Computation, 31: 1235-1270. https://doi.org/10.1162/neco_a_01199
      Zhang, W., Li, H., Li, Y., et al., 2021. Application of Deep Learning Algorithms in Geotechnical Engineering: A Short Critical Review. Artificial Intelligence Review, 54: 5633-5673. https://doi.org/10.1007/s10462⁃021⁃09967⁃1
      Zhang, W., Phoon, K., 2022. Editorial for Advances and Applications of Deep Learning and Soft Computing in Geotechnical Underground Engineering. Elsevier, 14: 671-673. https://doi.org/10.1016/j.jrmge.2022.01.001
      Zhao, Z., Zheng, P., Xu, S., et al., 2019. Object Detection with Deep Learning: A Review. IEEE Transactions on Neural Networks and Learning Systems, 30: 3212-3232. https://doi.org/10.1109/TNNLS.2018.2876865
      Zhu, J., Li, S., Song, J., et al., 2021. Magnitude Estimation for Earthquake Early Warning Using a Deep Convolutional Neural Network. Frontiers in Earth Science, 9: 341. https://doi.org/10.3389/feart.2021.653226
      Zollo, A., Amoroso, O., Lancieri, M., et al., 2010. A Threshold⁃Based Earthquake Early Warning Using Dense Accelerometer Networks. Geophysical Journal International, 183: 963-974. https://doi.org/10.1111/j.1365⁃246X.2010.04765.x
      Zuo, R. G., Peng, Y., Li, T., et al., 2021. Challenges of Geological Prospecting Big Data Mining and Integration Using Deep Learning Algorithms. Earth Science, 46(1): 350-358 (in Chinese with English abstract).
      陈以伦, 金星, 2016. 一种持续实时预测仪器地震烈度的方法. 地震工程与工程振动, 36(6): 22-29. https://www.cnki.com.cn/Article/CJFDTOTAL-DGGC201606003.htm
      储德平, 万波, 李红, 等, 2021. 基于ELMO⁃CNN⁃BiLSTM⁃CRF模型的地质实体识别. 地球科学, 46(8): 3039-3048. doi: 10.3799/dqkx.2020.309
      刘如山, 熊明攀, 马强, 等, 2021. 基于仪器地震烈度的变电站高压电气设备易损性研究. 自然灾害学报, 30(2): 14-23. https://www.cnki.com.cn/Article/CJFDTOTAL-ZRZH202102002.htm
      孙得璋, 张仁鹏, 孙柏涛, 2018. 浅谈仪器烈度在地震烈度评定中的应用. 建筑结构, 48(S2): 279-283. https://www.cnki.com.cn/Article/CJFDTOTAL-JCJG2018S2057.htm
      左仁广, 彭勇, 李童, 等, 2021. 基于深度学习的地质找矿大数据挖掘与集成的挑战. 地球科学, 46(1): 350-358. doi: 10.3799/dqkx.2020.111
    • 期刊类型引用(6)

      1. 李宗超,纪志伟,孙吉泽,陈鲲,谢俊举. 基于安徽合肥M_S4.7地震快速估计本地区M_S6.0设定地震加速度时程及其破坏能力. 地球与行星物理论评(中英文). 2025(03): 338-351 . 百度学术
      2. Guoxin Chen,Jun Li,Jinxin Chen,Rongsen Du,Yutao Liu,Yuli Qi,Chun-Feng Li,Xingguo Huang. High-Precision Sub-Seafloor Velocity Building Based on Joint Tomography and Deep Learning on OBS Data in the South China Sea. Journal of Earth Science. 2025(02): 830-834 . 必应学术
      3. 李山有,陈欣,卢建旗,马强,谢志南,陶冬旺,李伟. 基于XGBoost的现地地震烈度阈值实时判别模型. 地球科学. 2024(02): 379-390 . 本站查看
      4. 周宝峰,宋泉,任叶飞,温瑞智,陈相兆. 基墩高度对强震动记录的影响及应用研究. 地球科学. 2024(02): 414-424 . 本站查看
      5. 彭朝勇,程振鹏,郑钰,徐志强. 考虑P波预警参数的震源破裂特征实时持续估测方法. 地球科学. 2024(02): 391-402 . 本站查看
      6. 蒋策,吕作勇,房立华. 融合处理速度和加速度记录的地震检测模型及其在新丰江水库的应用. 地球科学. 2024(02): 469-479 . 本站查看

      其他类型引用(1)

    • 加载中
    图(11) / 表(3)
    计量
    • 文章访问数:  1128
    • HTML全文浏览量:  678
    • PDF下载量:  82
    • 被引次数: 7
    出版历程
    • 收稿日期:  2022-08-19
    • 网络出版日期:  2023-06-06
    • 刊出日期:  2023-05-25

    目录

    /

    返回文章
    返回