2025年, 第45卷, 第4期 刊出日期:2025-07-15
  

  • 全选
    |
  • 杭州电子科技大学学报. 2025, 45(4): 0-0.
    摘要 ( ) PDF全文 ( )   可视化   收藏
  • 计算机科学与技术登峰学科专刊
  • 徐小良, 朱润锴, 耿玉霞
    杭州电子科技大学学报. 2025, 45(4): 1-11. https://doi.org/10.13954/j.cnki.hdu.2025.04.001
    摘要 ( ) PDF全文 ( )   可视化   收藏
    组合零样本学习将类别定义为属性和对象的组合,要求模型在训练时对未见过的组合上进行准确的识别,不仅可以有效降低模型对标注数据的依赖,还可以探究深度学习模型的组合泛化能力。现有方法在组合识别时,往往忽略了属性和对象在不同组合情境下的外观差异性,导致泛化能力不足。为此,提出了一种基于情境感知决策的组合零样本学习方法,利用多模态预训练模型CLIP作为编码器,结合文本软提示、适配器微调和特征去噪机制,分别提取属性、对象的独立特征,并设计情境相关门控网络,在模型决策阶段根据图像自适应地融合属性和对象的预测得分。在四个主流基准数据集上进行了实验,结果表明,该方法显著提升了组合零样本学习的性能,证实了基于属性和对象组合的情境参与决策的有效性。
  • 陈小雕, 杨浩
    杭州电子科技大学学报. 2025, 45(4): 12-21. https://doi.org/10.13954/j.cnki.hdu.2025.04.002
    摘要 ( ) PDF全文 ( )   可视化   收藏
    曲线逼近是计算机辅助几何设计(CAGD)中的基本问题之一,在数据压缩、路径规划和轨迹生成等方面有着广泛的应用。然而在处理复杂交曲线的逼近问题时,常面临计算复杂度较高和逼近效果不佳的挑战。针对上述挑战,本文提出一种基于最小化平方距离积分的曲线逼近算法,通过最小化原曲线与指定逼近曲线在参数区间内的平方距离积分,实现逼近曲线控制点的求解。不同于传统积分最小化方法,该算法采用高斯-克朗罗德积分法来精确快速完成复杂积分的数值计算,提高了逼近精度和计算效率。实验结果表明,基于最小化平方距离积分的曲线逼近算法相比现有技术能实现更高的逼近精度和更小的数据量。
  • 陈成, 姜明, 张旻
    杭州电子科技大学学报. 2025, 45(4): 22-31. https://doi.org/10.13954/j.cnki.hdu.2025.04.003
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在复杂场景下,汉字识别面临挑战。由于字符可能被遮盖或变形,传统的特征提取或分类方法常常无法提取足够的特征,导致识别错误。此外,现有的视觉和语言结合的模型忽略了隐藏字符特征对语言模型的重要性,使得错误纠正不准确。为此,提出了一种基于字符、字根、关键笔形的多维表征识别算法。该算法结合自注意力机制提取多层次字符特征,有效解决了特征提取不足问题导致的识别错误问题。此外,构建了多维表征融合机制来连接视觉模型与语言模型,以有效传递隐藏字符特征给语言模型。算法分文本识别、识别字符检错、字符纠错三个阶段。实验结果表明,相较于基于Transformer架构的最先进模型,本文算法在场景文本、网页文本、印刷文本和手写文本数据集上的性能分别提升了1.81%、1.11%、0.25%和2.27%。
  • 张卓群, 王荣波, 黄孝喜
    杭州电子科技大学学报. 2025, 45(4): 32-41. https://doi.org/10.13954/j.cnki.hdu.2025.04.004
    摘要 ( ) PDF全文 ( )   可视化   收藏
    从海量的医疗文本中挖掘信息,提取关键的命名实体,对提升医疗信息处理与对话理解的效率至关重要。针对医疗领域命名实体识别任务中复杂的医学术语识别困难、单一特征方法难以全面精准捕捉的问题,提出一种融合字音、字形及词典信息等多种特征的医疗文本命名实体识别方法。该方法使用预训练模型提取语义向量,构建汉字笔画、部首的字形向量及带有音调的拼音向量,通过双向匹配对齐医疗词典并动态融合特征,最终将多模态特征输入到BiLSTM-CRF模型以提升识别效果。实验结果表明,该方法在IMCS互联网医患在线对话文本上的识别效果上显著优于其他对比实验。测试集上的F1值最高达到了92.5%,相较于其他五个对比实验(Base-BERT、MC-BERT、RoBERTa-wwm-ext、Medbert-Kd-Chinese、Albert-Base-Chinese),其F1值最高提升了8.6个百分点。此外,消融实验也进一步验证了融合特征对提升识别效果的有效性。
  • 王伟志, 胡海洋, 顾盼, 崔高宾, 李正华, 李渊
    杭州电子科技大学学报. 2025, 45(4): 42-50. https://doi.org/10.13954/j.cnki.hdu.2025.04.005
    摘要 ( ) PDF全文 ( )   可视化   收藏
    铆钉在工业领域中常被用于金属零件或者结构体的连接,一旦出现漏装,就可能发生严重的安全事故。为了解决上述的问题,提出了一种用于铆钉连接检测的新模型LRD-DETR。模型在提取网络进行特征提取后,加入了一个多尺度融合模块DSPANet,加强了特征图的语义信息;在编码器中设计了一种限制范围的可变形注意力机制,限制了每一个参考点选取采样点的范围;在解码器中使用了DAB-DETR的解码器部分,并在其基础上设计了一种新的MLP(Multilayer Perceptron)模块用于更新每一次的4D锚框信息。在自建的铆钉数据集中,模型取得了令人满意的结果,mAP值达到了59.2%,实验结果表明,相比于主流的目标检测算法,本文提出的铆钉检测方法效果更优。
  • 白依卓, 豆孝龙, 周文晖
    杭州电子科技大学学报. 2025, 45(4): 51-58. https://doi.org/10.13954/j.cnki.hdu.2025.04.006
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对微表情持续时间短暂以及面部肌肉动作幅度细微的特点,提出一种基于双流Transformer的微表情序列识别网络(TSTMER)。首先,利用TV-L1光流法计算微表情序列帧与起始帧的光流信息,以获取微表情面部肌肉的运动特征。其次,设计微表情特征提取模块,该模块由两个Transformer网络和交叉注意力机制构成,其中两个Transformer网络分别用于提取光流图像和微表情图像的空间特征,交叉注意力机制将两者的空间特征融合为新特征。然后,设计一种时空注意力机制,以增强微表情局部区域和序列帧的权重。最后,采用Bi-LSTM学习微表情序列在时间维度上的前向和后向依赖关系。在多个微表情数据集上的实验表明,TSTMER网络在UAR和UF1测度上具有明显的优势。
  • 张亚凯, 吴子朝, 杨萍
    杭州电子科技大学学报. 2025, 45(4): 59-68. https://doi.org/10.13954/j.cnki.hdu.2025.04.007
    摘要 ( ) PDF全文 ( )   可视化   收藏
    信息技术的发展带来了对3D资产的巨大需求。最近, 文本引导的3D生成模型因为其易用性得到了广泛关注。为了满足用户对于快速生成多样且高质量的3D形状的需求,提出了一种基于多模态检索系统和潜空间扩散模型的三维形状生成方法Re3Diffusion。给定文本提示,Re3Diffusion能够访问外部多模态知识库来检索相关形状,并将其作为生成3D模型的参考。为了生成更符合文本描述的3D形状,先使用了对比学习预训练以参数学习的方式缩小不同模态之间的间隙,之后在推理时间结合检索系统以非参数学习的方式缩小与目标分布之间的距离。为了避免检索到与文本条件相关性低的信息误导生成结果,进一步设计了一种自适应权重方案,以有选择性地利用检索到的形状信息。该方法同时支持文本引导的形状编辑。实验结果表明,该方法在保持较快生成速度的同时,显著提高了生成的3D形状与文本条件语义的匹配程度,并且具备新颖的域外泛化能力。
  • 赵坚, 应娜, 舒勤
    杭州电子科技大学学报. 2025, 45(4): 69-77. https://doi.org/10.13954/j.cnki.hdu.2025.04.008
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对跨视角步态识别方法在复杂穿着条件下识别精度不足等问题,本文提出了一种全局与局部特征融合(Global and Local Feature Fusion, GLFF )的跨视角步态识别算法。算法引入深度过参数化卷积构建神经网络来增强网络表征能力,首先通过水平分块卷积突出四肢运动信息,增强网络局部空间的细粒度特征;再利用集合池化层(Set Pooling, SP)提取视角鲁棒性高的全局静态特征,聚合不同步态时间点下的步态;接着融合特征并使用微动作模板构建器提取微动作特征,训练得到GLFF。利用中国科学院自动化所的CASIA-B数据集进行实验验证,本文算法在跨视角条件下平均识别准确率达到了88.9%,其中在复杂穿着条件下的识别率达到了79.5%。该结果表明全局与局部特征融合可以有效减少穿着因素对跨视角步态识别的负面影响。
  • 郭尹君, 石义芳
    杭州电子科技大学学报. 2025, 45(4): 78-87. https://doi.org/10.13954/j.cnki.hdu.2025.04.009
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在视场互补传感网目标跟踪应用中,当目标跨节点视场时,目标在每个时刻仅能被部分节点观测到并返回目标量测,导致各节点对同一目标的状态估计精度参差不齐,节点间进行自适应一致性信息融合的增益权重失配,使得传感网目标跟踪性能恶化。在现有ACFr滤波算法基础上提出了一种基于置信度的自适应一致性滤波算法(Confidence-based Adaptive Consensus Filter, CB-ACF)。所提算法利用节点对目标可观性的历史统计量,将目标跨节点状态细分为入视场和出视场两种情况,并基于其设计能够反映各节点对目标状态估计精度变化趋势的自适应置信度计算规则,利用节点置信度设计一致性增益权重并对各节点间状态估计值进行自适应一致性滤波融合。仿真验证结果表明,所提算法与经典自适应一致性滤波算法相比,传感网的目标状态估计精度及节点间目标状态估计一致性均有较大提升。
  • 柳春锋, 王海艳, 丁祥海
    杭州电子科技大学学报. 2025, 45(4): 88-96. https://doi.org/10.13954/j.cnki.hdu.2025.04.010
    摘要 ( ) PDF全文 ( )   可视化   收藏
    为解决产能共享平台产能闲置率高及多主体利益不均问题,分析了制造方的服务费投入和订单获取收益、需求方的产品质量和交货要求、平台方生产协调和成本控制,建立以产能利用率公平性和订单价值公平性为目标函数的模型,制定订单拆分、订单分配和生产调度策略。提出了改进的离散布谷鸟搜索算法进行模型求解,改进了随机游走机制,避免算法陷入局部最优;设计自适应抛弃概率,可以在前期进行较多的随机游走以增加解的多样性;同时开发了专门的编码映射方式,避免从Levy飞行退化为随机搜索。大量数值实验结果表明,在相同运行时间内改进的离散布谷鸟搜索的寻优性能优于经典布谷鸟搜索算法和遗传算法。
  • 朱佳斌, 孔万增
    杭州电子科技大学学报. 2025, 45(4): 97-102. https://doi.org/10.13954/j.cnki.hdu.2025.04.011
    摘要 ( ) PDF全文 ( )   可视化   收藏
    针对脑机接口目标检测范式中脑电数据样本呈长尾分布所导致的识别率低、稳定性差等问题,文章提出一种基于解耦表征网络的脑机目标检测模型。首先,将脑电数据以三元组的形式输入到神经网络模型的特征提取模块中,提取脑电数据的时空特征,并通过投影层将这些特征映射到低维空间,利用三元组损失函数训练模型的特征提取模块。然后,冻结特征提取器参数,对脑电数据进行下采样,以平衡目标样本和非目标样本的数量,并使用交叉熵损失函数对分类器进行训练。实验结果表明,相较于传统的一阶段式训练方式,采用解耦的方式分别学习模型的特征提取器与分类器,所得到的模型具有更高的分类准确率和稳定性。