为了有效利用已知信息快速地进行数据聚类,提出了一种基于网格的半监督密度峰值聚类(GS-DPC)算法。利用统计信息网格对数据集进行划分,将落在网格内数据点的个数作为局部密度值,计算出每一个网格代表点;根据局部密度值和相对距离值确定聚类中心;利用成对约束集指导聚类过程后得到聚类结果。实验结果表明,GS-DPC算法进行数据聚类算法的平均消耗时间比密度峰值聚类算法(DPC)降低32百分点;GS-DPC算法在6个数据集上的平均精确度(ACC)约为0.84,平均调整互信息(AMI)约为0.68,平均调整兰德系数(ARI)约为0.67,因此GS-DPC算法可以快速且有效地进行数据聚类并获得较好的聚类结果。
文章以2012—2022年上证50、沪深300、中证500三支股指交易数据为研究对象,利用深度学习预测股指,分别构建了卷积神经网络(CNN)模型、长短期记忆神经网络(LSTM)模型和CNN-LSTM组合神经网络模型,使用均方根误差(RMSE)、平均绝对误差(MAE)、平均百分比误差绝对值(MAPE)和决定系数(R2)4个指标对模型进行评价。结果表明,组合模型兼有CNN模型的高维特征挖掘优势和LSTM 模型的时序特征提取优势,在3支股指的预测中,组合模型的预测精度均高于CNN模型和LSTM 模型单一模型,其RMSE指标分别提升了28.60百分点、52.56百分点和25.28百分点,证实了CNN-LSTM组合神经网络模型的有效性和准确性。
针对专利技术主题识别效率偏低、识别难度大等问题,文章提出了FPC-Kmeans++(Kmeans plus pluswith feature phrase clusters)专利聚类分析与技术主题识别方法,该方法创新性地使用特征短语替代传统的分词结果,作为专利数据分析的基础。文章以无人机专利为例,对该方法进行了实证检验。实验结果表明,相较于传统的Kmeans++(Kmeans plus plus)和LDAKmeans++(Kmeans plus plus with Latent Dirichlet Allocation)方法,该方法能更精确地判断出最佳主题数和得到层次更鲜明的聚类效果,展现了其在专利主题识别上的优势。并且,相较于其他对比算法,文章提出的NER-FPP(Named Entity Recognition with Feature Phrase Probability)算法在专利特征短语提取上效果最好,F1值分数最高,达到了93.36%。
火情检测的作用和意义在于保护人民群众的人身财产安全。为了提升火情检测的精度,提出一种基于改进YOLOv8的火情智能检测算法。首先,通过添加CBAM(Convolutional Block Attention Module)注意力模块帮助模型更加准确地检测和定位火情;其次,使用空洞空间卷积池化金字塔模块获取多尺度信息,提升火情检测精度;最后,引入BiFPN(Bi-directional Feature Pyramid Network)模块帮助模型针对性地学习特征。将该算法应用于火情数据集,实验结果表明,较之其他YOLO系列检测算法,改进YOLOv8的火情智能检测算法的火情检测效果最优;相较于YOLOv8n算法,检测精确率提升了1.4百分点,召回率提升了4.3百分点,mAP@0.5提升了5.1百分点,mAP@0.5-0.95提升了1.6百分点,可以有效地检测火情。
针对动物图像存在图像背景复杂多变、类间特征差异小、类内特征差异大的特点,提出多尺度可变ViT(Vision Transformer)图像识别模型。在ViT模型的基础上,融合卷积神经网络多层特征图,并提出可变注意力机制,使模型能较好地融合图像的局部特征和全局特征,能较好地识别图像中各种尺度的动物。构建包含90种类别、共21 142张图像的动物数据集,在数据集上进行实验的结果表明,所提出的模型取得了90.34%和97.59%的Top-1准确率和Top-5准确率。
针对传统的导弹型号识别主要依赖人工经验和专家知识对导弹外观特征进行分析和比对的方法存在准确率和实时性难以兼顾的问题,提出了一种基于ResNet18卷积神经网络的导弹型号识别模型用于解决这一问题。首先,根据作战任务背景分析,提取导弹的主要特征指标,构建几种常见的导弹模型;其次,以各个角度的导弹照片作为输入,输出图片的均值和方差;再次,通过对特征值进行量化,生成训练样本数据;最后,利用基于ResNet18卷积神经网络模型对导弹型号进行识别训练。实验结果表明,该模型在保证实时性和满足实战要求的前提下,具有较高的准确率,对实验中选择的6种导弹型号的识别准确率达到了99.80%。
为揭示并破译太阳神鸟金箔图案可能存在的历史与文化内涵,利用图像处理技术对图案的几何结构进行定量研究和分析。首先,利用最小二乘法结合等角螺旋的数学表达式对图案内层弧形旋转芒纹进行拟合。其次,在猜想图案几何结构的基础上得到重构图形,利用弦点距离累积技术检测出图案所涉内、外两组角点,通过计算内、外圈角点到中心的径向距离相对于重构图形中两内切圆半径的误差平均值,定量验证相关猜想的合理性。实验结果显示:太阳神鸟图案内层的弧形旋转芒纹对应等角螺旋结构,内、外圈角点到中心的径向距离相对于重构图形中两内切圆半径的误差平均值都在5.3%以内,证明了图案与古代历法的关联性。
:针对口罩机在多工序生产中故障特征难以诊断的问题,提出了一种基于自组织映射(SOM)和误差反向传播网络(BP)的故障检测模型。首先针对4种减速机故障类型搭建SOM-BP复合型神经网络模型并完成检测分类,其次通过提取原振动信号的20组时域和频域参数作为SOM网络的输入样本进行初步聚类,并根据仿真结果确定最佳竞争层结构,最后将聚类后结果输入BP网络进行预测并完成分类,实现故障检测。研究结果表明,7×7竞争层结构下的SOM-BP复合型神经网络对于减速机的8种时域和频域参数的检测效果最优,分类准确率可达93.5%,173次迭代即可收敛,数据拟合度最高达0.998 76,达到实际检测要求,验证了该方案的有效性和可行性。
随着高等教育的普及,各类管理决策需求增加,基于数据驱动和知识驱动的决策方法成为新的发展趋势。基于此,提出了一种通过改进概率软逻辑模型挖掘知识规律和推理学生状态的方法,该方法通过引入规则挖掘算法,赋予概率软逻辑模型自动挖掘规则的能力。在真实学生状态数据上的实验结果表明,该方法在多项目标关系的推理上,准确率能达到80%以上,并且多层次推理结构的实验效果优于非层次推理结构的实验效果。对于学生状态类非完整知识库数据的挖掘和推理,该方法减少了人工工作量,降低了因人为认知偏差带来的不确定性。
TCR(T细胞受体)-多肽结合位点的准确预测对免疫治疗和相关药物发现具有重要意义。文章综合多个文献及数据库整理了一个TCR-多肽结合位点数据集,并引入了一种基于卷积神经网络的预测方法Propep-TCR。该方法综合考虑了输入TCR的序列特征和结构特征,通过采用残基可变滑动窗口方法提取每个目标残基的特征向量。为解决数据集中正负样本不平衡的问题,还采用了改进的损失函数和过采样技术。实验结果表明,Propep-TCR可以成功预测出TCR序列中的潜在结合位点,取得了优于传统算法的性能,其预测准确度达到0.98,AUROC达到了0.95。
为提高流感预测模型的准确率,针对流感数据的季节性与波动性特点,提出利用离散小波分解(DWT)、季节性自回归综合移动平均模型(SARIMA)和长短期记忆神经网络(LSTM)综合建模,构建DWT-SARIMA-LSTM混合预测模型。首先,将流感数据分解为高频成分与低频成分,对低频成分使用SARIMA 模型、高频成分使用LSTM模型分别进行预测;其次,将预测值融合得到最终的预测结果;最后,构建流行控制图预警模型。使用从中国香港卫生署官网获得的中国香港地区2010—2019年的流感数据对模型进行预测和验证,其MAE为0.342 7,MAPE为8.097 3%,RMSE为0.463 2,预警模型的准确率为100%,该模型较于如ARIMA-LSTM等其他混合模型有更高的预测精度。
在民航运输体系中,航站楼是其核心组成部分,随着民航运输量的增加,机场航站楼的运行压力也随之增大。针对航站楼运行压力大的问题,首先分析旅客出行流程,其次采用仿真模拟技术对航站楼内部空间建模,同时考虑社会力模型中的个体运动时受到多个力的作用,能够较好地反映群体运动特点。使用Anylogic仿真软件对机场航站楼进行仿真建模,并接入真实参数,使用封装智能体的方法进行逻辑建模,并对仿真运行中的数据进行可视化处理。实验获得了较好的仿真模拟效果,对后续开展机场航站楼布局方案优化和更好地进行航站楼内部资源管理有着积极作用。
大量机组的老化问题导致原有故障预警系统失效,为实现老旧机组的技改增效,提出一种基于迁移学习的老化机组故障预警方法。首先,分析老化问题对机组数据分布的影响,并利用MIC(Maximal InformationCoefficient)最大互信息系数和长短期记忆神经网络(Long Short-Term Memory,LSTM))构建多年度机组故障预警模型,探究老化问题对现有故障预警技术的影响;其次,基于模型的迁移学习提出老化机组故障预警方法,在保留原模型大量信息的基础上,高效且快速地解决老化问题导致的原模型失效问题。实际风场数据采集及监控系统(Supervisory Control and Data Acquisition,SCADA)的数据验证表明,所提老化机组故障预警方法与重新训练的模型均能在故障发生前46 h发出预警,此外,所提方法大幅缩减了模型的构建时间和资源。
针对现有网络入侵检测技术存在的数据不平衡导致检测准确率不足、实时性差和泛化性能低等问题,对基于ResNet(深度残差网络)的入侵检测模型进行改进。在ResNet的每个Dense(全连接)层后添加自注意力层,形成残差连接,旨在通过捕捉长距离依赖关系增强特征表示能力,同时提升网络的学习能力、灵活性和解释性。使用CIC-IDS-2017数据集对新模型进行验证,结果显示,模型的准确率为97.56%,真正例率为97.46%,误报率为4.00%,损失函数值快速收敛至0.044。本文模型与其他文献模型相比,真正例率平均提升约5.62百分点,准确率平均提升约3.94百分点。