张考,男,南京信息工程大学,硕士生导师,人工智能系副系主任(代理系主任)。2014,2016和2020年分别获武汉大学遥感信息工程学院学士,硕士和博士学位。2020.12-2023.2武汉大学重点资助博士后,助理研究员。研究方向为视觉显著性建模、图像与视频处理、遥感视频分析、虚拟现实。在IEEE TIP/TCSVT/TMM等发表会议期刊论文10余篇。曾获2014年湖北省优秀学士学位论文奖,2016年国际摄影测量与遥感大会最佳海报奖(合作论文),2017年IEEE ICME Salient360! 挑战赛最佳学生奖,2018年IEEE ICME Salient360! 挑战赛图像赛大奖等多项奖励。主持国家自然科学基金青年项目,中国博士后面上项目等科研项目9项;参与国家重点研发课题2项,国家自然科学基金重点项目1项,面上项目2项,社会科学青年基金1项。目前担任IEEE TIP/TMM/TCSVT/TGRS/JSTARS/GRSL和IEEE ICIP/ICME/ICASSP等期刊会议审稿人。
[2025级硕士研究生名额若干!也欢迎对本课题组研究方向感兴趣的2023和2024级本科生加入!]
招生方向:
[1] Visual saliency modeling (视觉显著性建模)
[2] Object detection and tracking in satellite/UAVvideos (卫星/无人机视频目标检测与跟踪)
[3] Multimodal emotion recognition (多模态情感识别)
学生要求:具备扎实的数学基础与编程实践能力,积极参加课题组组会。
课题组与武大、浙大、南航、华为、腾讯、阿里等单位有较好合作关系,优先招收对上述方向感兴趣的学生。可指导学生参与科研项目、论文专利撰写、学术竞赛等,成果特别优秀者可推荐至武大、浙大和国外名校深造,或推荐至腾讯、阿里等公司工作。
一、主要科研项目经历
主持
[1] 横向研究课题,**红外视频典型目标检测与预警分析(主持,在研),2024.8-2025.7;
[2] 横向研究课题,**光学视频典型目标检测与预警分析(主持,在研),2024.12-2025.11;
[3] 国家自然科学基金项目青年科学基金项目,基于弱监督学习的高效视频显著性预测方法研究(主持,在研),2023.1-2025.12;
[4] 国家级人工智能现代产业学院 “产教融合型”教材(新编)揭榜挂帅项目,虚拟现实技术(主持,在研),2023.10-2025.08;
[5] 南京信息工程大学科研启动经费资助项目,多源无人机视频显著性检测(主持,在研),2024.3-2026.10;
[6] 横向研究课题,虚拟现实图像目标检测与场景理解技术研究(主持,在研),2023.6-2024.5;
[7] 中国博士后科学基金会面上项目,遥感视频显著性预测关键技术研究(主持), 2021.7-2023.2;
[8] 湖北省博士后创新研究岗位项目,无人机视频显著性预测关键技术研究(主持),2021.7-2023.2;
[9] 测绘遥感信息工程国家重点实验室探索类课题,遥感视频显著性目标检测(主持), 2021.1-2021.12;
参与
[1] 国家社会科学基金青年项目,增强网络意识形态风险防范的战略主动及其能力研究(参与,在研), 2024.1-2026.12
[2] 国家重点研发计划项目课题,公共安全立体化协同监测关键技术(参与),2018.5-2021.4
[3] 国家重点研发计划项目课题,融合多通道语境信息的类人智能感知机制与方法(项目骨干),2017.10-2021.9
[4] 国家自然科学基金重点项目,面向遥感影像的视觉启发机器学习方法研究(参与),2021.1-2025.12
[5] 国家自然科学基金面上项目,基于视觉特性的视觉感知分析与视频编码优化(参与),2018.1-2021.12
[6] 国家自然科学基金面上项目,基于全局视觉冗余分析的高效视频编码研究(参与),2015.1-2018.12
指导
[1] 国家级大学生创新创业训练计划立项项目,“AI视频剪影”——基于显著性方法的智能视频剪辑系统(指导教师,在研,202410300256E),2024.6-2025.6
二、主要论文
视觉显著性建模/图像处理/计算机视觉
[1] Kao Zhang, Zhenzhong Chen, Songnan Li, Shan Liu. An Efficient Saliency Prediction Model for Unmanned Aerial Vehicle Video[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2022, 194: 152-166. (SCI Q1, IF: 11.774)
[2] Kao Zhang, Zhenzhong Chen, Shan Liu. A Spatial-temporal Recurrent Neural Network for Video Saliency Prediction[J]. IEEE Transactions on Image Processing, 2021, 30: 572-587. (SCI Q1, IF: 11.041)
[3] Kao Zhang, Zhenzhong Chen. Video Saliency Prediction Based on Spatial-Temporal Two-Stream Network[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2019, 29(12): 3544-3557. (SCI Q1, IF: 4.133)
[4] Di Liu, Kao Zhang, Zhenzhong Chen. Attentive Cross-Modal Fusion Network for RGB-D Saliency Detection[J]. IEEE Transactions on Multimedia, 2021, 23: 967-981. (SCI Q1, IF: 8.182)
[5] Hao Cai*, Kao Zhang*, Zhao Chen, Chenxi Jiang, Zhenzhong Chen. Video saliency prediction for first-person view UAV videos: Dataset and benchmark[J]. Neurocomputing, 2024: 127876. (SCI Q1, IF: 6.00, 共同一作)
[6] Zhao Chen*, Kao Zhang*, Hao Cai, Xiaoying Ding, Chenxi Jiang, Zhenzhong Chen. Audio-visual saliency prediction for movie viewing in immersive environments: Dataset and benchmarks[J]. Journal of Visual Communication and Image Representation, 2024: 104095. (SCI Q2, IF: 2.6, 共同一作)
[7] Jing Ling, Kao Zhang, Yingxue Zhang, Daiqin Yang, Zhenzhong Chen. A saliency prediction model on 360 degree images using color dictionary based sparse representation[J]. Signal Processing: Image Communication, 2018, 69: 60-68. (SCI Q2, IF: 2.779)
[8] Kao Zhang, Yan Shang, Songnan Li, Shan Liu, Zhenzhong Chen. SalCrop: Spatio-temporal Saliency Based Video Cropping[C]. IEEE VCIP, 2022. (Demo, Oral, Poster, EI)
[9] Pengyuan Quan, Zihao Mao, Nenglun Chen, Yang Zhang, Kao Zhang, Zhigeng Pan. Attentive Fusion for Efficient Wrist-worn Gesture Recognition based on Dual-view Cameras[J]. IEEE Sensors Journal, 2024. (SCI Q1, IF: 4.3)
遥感信息处理
[1] Yang Li*, Kao Zhang*, Zhao Chen, Wanping Ouyang, Mingpeng Cui, Chenxi Jiang, Daiqin Yang and Zhenzhong Chen. Towards Object Tracking for Quadruped Robots[J]. Journal of Visual Communication and Image Representation, 2023, 97: 103958. (SCI Q2, IF: 2.6, 共同一作)
[2] Zhihua Hu, Kao Zhang, Yuxuan Liu. Edge constrained DSM refinement based on shading from high resolution multi-view satellite images[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2025. (SCI Q1, IF: 4.7)
[3] Zhaopeng Hu, Daiqin Yang, Kao Zhang, Zhenzhong Chen. Object Tracking in Satellite Videos Based on Convolutional Regression Network with Appearance and Motion Features[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2020, 13: 783-793. (SCI Q1, IF: 3.827)
[4] Ruiqian Zhang, Jian Yao, Kao Zhang, Chen Feng and Jiadong Zhang. S-CNN-Based Ship Detection from High-Resolution Remote Sensing Images[C]. ISPRS Congress, 2016. (Best Poster Award, EI).
[5] Tong He, Jian Yao, Kao Zhang, Yaolin Hou, Shiyao Han. Accurate Multi-Scale License Plate Localization Via Image Saliency[C]. IEEE ITSC, 2014. (Oral, EI).
三、相关获奖
2021,武汉大学研究生学术创新奖,二等奖
2018,IEEE ICME 2018 Salient360! 挑战赛,图像任务大奖
2018,IEEE ICME 2018 Salient360! 挑战赛,视频显著性预测,第一名
2018,IEEE ICME 2018 Salient360! 挑战赛,图像头部显著性预测,第一名
2017,IEEE ICME 2017 Salient360! 挑战赛,最佳学生奖
2017,IEEE ICME 2017 Salient360! 挑战赛,图像显著性预测,第二名
2016,国际摄影测量与遥感大会(ISPRS2016),最佳海报奖 (Best Poster Award), (合作论文)
2014,第一届"全国研究生智慧城市技术与创意设计大赛视频挑战赛",二等奖
2014,湖北省优秀学士学位论文奖,武汉大学优秀学士学位论文
四、发明专利
[1] 罗洋洋,张考,宋涛,胡志华,等. 一种视频裁剪方法及裁剪视频的质量评价方法. 申请号:CN202411886091.3.(实审)
[2] 李雨顺,胡志华,潘志庚,张考,等. 基于神经辐射场和双向反射分布函数的数字地面三维重建方法、装置、设备及存储介质. 申请号:CN202411757299.5.(实审)
[3] 蔡创新,潘志庚,张考,胡志华,等. 一种基于面部和体态行为感知的渐进性放松训练方法. 申请号:CN202411003151.2.(授权)
[4] 蔡创新,潘志庚,张考,胡志华,等. 融合交互式会话语境和会话者身份属性的情感识别方法. 申请号:CN202411328293.6.(授权)
[5] 李昌利,章世钰,林贤煊,张考,等. 一种关键帧提取方法、装置及存储介质. 申请号:CN202411314338.4.(授权)
[6] 陈震中,李洋,张考. 一种基于孪生网络的四足机器人目标跟踪方法. 申请号: CN202310399358.5.(实审)
[7] 陈震中,陈钊,张考.一种基于音视频特征的视频显著性预测方法和系统. 申请号: CN202310247030.1.(实审)
[8] 张考,李松南. 图像裁剪方法、装置、计算机设备及存储介质. 申请号: CN202011644040.1.(实审)
[9] 姚剑,张考,贺通,朱飒. 一种基于仿射校正的多尺度车牌精准定位方法. 申请号: CN201410077985.8.(授权)
五、书籍
[1] 中国图象图形学学会编著. 元宇宙产业技术路线图. 中国科学技术出版社,2024.11,ISBN:9787523607367.(编写组成员,全书整理汇编).
六、授课信息
数字图像处理、数字孪生技术、神经网络与深度学习
程序设计基础(C语言)、基础编程语言(Python)