张考
已经得到个称赞     给我点赞
  • 所在单位:人工智能学院(未来技术学院、人工智能产业学院)
  • 学历:博士研究生毕业
  • 办公地点:南京信息工程大学临江楼A1911
  • 联系方式:kaozhang@nuist.edu.cn
  • 在职信息:在岗
  • 毕业院校:武汉大学
  • 学科:摄影测量与遥感
  • 个人简介
  • 研究方向
  • 社会兼职
  • 教育经历
  • 工作经历
  • 团队成员
  • 其他联系方式

张考,男,南京信息工程大学,硕士生导师,人工智能系副系主任(代理系主任)。2014,2016和2020年分别获武汉大学遥感信息工程学院学士,硕士和博士学位。2020.12-2023.2武汉大学重点资助博士后,助理研究员。研究方向为视觉显著性建模、图像与视频处理、遥感视频分析、虚拟现实。在IEEE TIP/TCSVT/TMM等发表会议期刊论文10余篇。曾获2014年湖北省优秀学士学位论文奖,2016年国际摄影测量与遥感大会最佳海报奖(合作论文),2017年IEEE ICME Salient360! 挑战赛最佳学生奖,2018年IEEE ICME Salient360! 挑战赛图像赛大奖等多项奖励。主持国家自然科学基金青年项目,中国博士后面上项目等科研项目9项;参与国家重点研发课题2项,国家自然科学基金重点项目1项,面上项目2项,社会科学青年基金1项。目前担任IEEE TIP/TMM/TCSVT/TGRS/JSTARS/GRSL和IEEE ICIP/ICME/ICASSP等期刊会议审稿人。

英文主页; 谷歌学术GitHub

课题组胡志华老师主页李明老师主页

[欢迎对本课题组研究方向感兴趣的本科生加入!]

招生方向

[1] Visual saliency modeling (视觉显著性建模)

[2] Object detection and tracking in satellite/UAVvideos (卫星/无人机视频目标检测与跟踪)

[3] Multimodal emotion recognition (多模态情感识别)

[4] Dataset and benchmark(数据集和测试基准)

已有基础

[1] 课题组配备英伟达多型号GPU 30余张(持续扩充中),与中国移动南京江北分公司超算中心具有良好合作关系,能为课题研究提供充足的算力支持。

[2] 课题组已完成海岸场景红外目标检测数据集1个(约4万张),可见光目标检测数据集1个(约2万张),正在完成红外多目标跟踪数据集1个(约4万帧),项目累积海岸场景红外和可见光有效数据超过10万张(约1年视频数据),能为目标检测与跟踪相关课题研究提供充足的数据支持。[欢迎对感兴趣的同学加入数据集构建!]

[3] 课题组已完成沉浸式音视频显著性数据集1个(256段2K视频,后续扩充到500段),第一人称无人机视频显著性数据集1个(200段4K视频,后续扩充到500段),计划采集第一人称视频显著性数据集1个(计划500段4K),能为显著性相关课题研究提供充足的数据支持。[欢迎对感兴趣的同学加入数据集构建!]

学生要求:具备扎实的数学基础与编程实践能力,积极参加课题组组会。课题组与武大、浙大、南航、华为、腾讯、阿里等单位有较好合作关系,优先招收对上述方向感兴趣的学生。可指导学生参与科研项目、论文专利撰写、学术竞赛等,成果特别优秀者可推荐至武大、浙大和国外名校深造,或推荐至腾讯、阿里等公司工作。


一、主要科研项目经历

主持

[1] 横向研究课题,**红外视频典型目标检测与预警分析(主持,在研),2024.8-2025.7;

[2] 横向研究课题,**光学视频典型目标检测与预警分析(主持,在研),2024.12-2025.11;

[3] 国家自然科学基金项目青年科学基金项目,基于弱监督学习的高效视频显著性预测方法研究(主持,在研),2023.1-2025.12;

[4] 国家级人工智能现代产业学院 “产教融合型”教材(新编)揭榜挂帅项目,虚拟现实技术(主持,在研),2023.10-2025.08;

[5] 南京信息工程大学科研启动经费资助项目,多源无人机视频显著性检测(主持,在研),2024.3-2026.10;

[6] 横向研究课题,虚拟现实图像目标检测与场景理解技术研究(主持,结题),2023.6-2024.5;

[7] 中国博士后科学基金会面上项目,遥感视频显著性预测关键技术研究(主持,结题),  2021.7-2023.2;

[8] 湖北省博士后创新研究岗位项目,无人机视频显著性预测关键技术研究(主持,结题),2021.7-2023.2;

[9] 测绘遥感信息工程国家重点实验室探索类课题,遥感视频显著性目标检测(主持,结题),  2021.1-2021.12;

参与

[1] 国家社会科学基金青年项目,增强网络意识形态风险防范的战略主动及其能力研究(参与,在研), 2024.1-2026.12

[2] 国家重点研发计划项目课题,公共安全立体化协同监测关键技术(参与,结题),2018.5-2021.4

[3] 国家重点研发计划项目课题,融合多通道语境信息的类人智能感知机制与方法(项目骨干,结题),2017.10-2021.9

[4] 国家自然科学基金重点项目,面向遥感影像的视觉启发机器学习方法研究(参与),2021.1-2025.12

[5] 国家自然科学基金面上项目,基于视觉特性的视觉感知分析与视频编码优化(参与,结题),2018.1-2021.12

[6] 国家自然科学基金面上项目,基于全局视觉冗余分析的高效视频编码研究(参与,结题),2015.1-2018.12

指导

[1] 国家级大学生创新创业训练计划立项项目,“AI视频剪影”——基于显著性方法的智能视频剪辑系统(指导教师,结题,202410300256E,经费0.9万),2024.6-2025.5

[2] 国家级大学生创新创业训练计划立项项目,“基于时空特征的海岸红外目标检测算法研究与应用(指导教师,在研,立项资助),2025.6-2026.5

[3] 江苏省研究生科研与实践创新计划项目,基于注意力机制的音视频显著性预测方法研究(指导教师,在研,KYCX25 1654,经费1.5万),2025.5-2026.4

[4] 江苏省大学生创新创业训练计划立项项目,基于YOLOv12的多尺度红外船舶检测算法(指导教师,在研,立项资助),2025.5-2026.4

[5] 校级大学生创新创业训练计划立项项目,基于弱监督学习的视频显著性预测方法研究(指导教师,结题),2024.6-2025.5

[6] 校级大学生创新创业训练计划立项项目,无人机影像目标检测研究(指导教师,在研,立项资助),2025.5-2026.4


二、主要论文

视觉显著性建模/图像处理/计算机视觉

[1] Xin Ding, Yongwei Wang, Kao Zhang, Z. Jane Wang. CCDM: Continuous conditional diffusion models for image generation[J]. IEEE Transactions on Multimedia. 2025.(SCI Q1, IF: 9.70)

[2] Chuangxin Cai, Kao Zhang, Zhihua Hu, Xianxuan Lin, Zhigeng Pan. Prompt-based hybrid supervised contrastive learning for emotion recognition in conversation. Neurocomputing, 2025, 130453. (SCI Q1, IF: 6.50)

[3] Pengyuan Quan, Zihao Mao, Nenglun Chen, Yang Zhang, Kao Zhang, Zhigeng Pan. Attentive Fusion for Efficient Wrist-worn Gesture Recognition based on Dual-view Cameras[J]. IEEE Sensors Journal, 2024. (SCI Q1, IF: 4.5)

[4] Hao Cai*, Kao Zhang*, Zhao Chen, Chenxi Jiang, Zhenzhong Chen. Video saliency prediction for first-person view UAV videos: Dataset and benchmark[J]. Neurocomputing, 2024: 127876. (SCI Q1, IF: 6.50, 共同一作)

[5] Zhao Chen*, Kao Zhang*, Hao Cai, Xiaoying Ding, Chenxi Jiang, Zhenzhong Chen. Audio-visual saliency prediction for movie viewing in immersive environments: Dataset and benchmarks[J]. Journal of Visual Communication and Image Representation, 2024: 104095. (SCI Q2, IF: 3.1, 共同一作)

[6] Kao Zhang, Yan Shang, Songnan Li, Shan Liu, Zhenzhong Chen. SalCrop: Spatio-temporal Saliency Based Video Cropping[C]. IEEE VCIP, 2022. (Demo, Oral, Poster, EI)

[7] Kao Zhang, Zhenzhong Chen, Shan Liu. A Spatial-temporal Recurrent Neural Network for Video Saliency Prediction[J]. IEEE Transactions on Image Processing, 2021, 30: 572-587. (SCI Q1, IF: 11.041)

[8] Di Liu, Kao Zhang, Zhenzhong Chen. Attentive Cross-Modal Fusion Network for RGB-D Saliency Detection[J]. IEEE Transactions on Multimedia, 2021, 23: 967-981. (SCI Q1, IF: 8.182)

[9] Kao Zhang, Zhenzhong Chen. Video Saliency Prediction Based on Spatial-Temporal Two-Stream Network[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2019, 29(12): 3544-3557. (SCI Q1, IF: 4.133)

[10] Jing Ling, Kao Zhang, Yingxue Zhang, Daiqin Yang, Zhenzhong Chen. A saliency prediction model on 360 degree images using color dictionary based sparse representation[J]. Signal Processing: Image Communication, 2018, 69: 60-68. (SCI Q2, IF: 2.779)


遥感信息处理

[1] Zhihua Hu, Kao Zhang, Yuxuan Liu. Edge constrained DSM refinement based on shading from high resolution multi-view satellite images[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2025. (SCI Q1, IF5.3)

[2] Zhihua Hu, Wanjie Lu, Kao Zhang, Helong Yang, Yaoyang Wang, Nannan Qin, Yuxuan Liu, Sisi Zlatanova. Accurate room layout estimation from multi-view panoramas with multi-label graph cut[J]. International Journal of Applied Earth Observation and Geoinformation, 2025. (SCI Q1, IF: 8.6)

[3] Yang Li*, Kao Zhang*, Zhao Chen, Wanping Ouyang, Mingpeng Cui, Chenxi Jiang, Daiqin Yang and Zhenzhong Chen. Towards Object Tracking for Quadruped Robots[J]. Journal of Visual Communication and Image Representation, 2023, 97: 103958. (SCI Q2, IF2.6, 共同一作)

[4] Kao Zhang, Zhenzhong Chen, Songnan Li, Shan Liu. An Efficient Saliency Prediction Model for Unmanned Aerial Vehicle Video[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2022, 194: 152-166. (SCI Q1, IF: 12.7)

[5] Zhaopeng Hu, Daiqin Yang, Kao Zhang, Zhenzhong Chen. Object Tracking in Satellite Videos Based on Convolutional Regression Network with Appearance and Motion Features[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2020, 13: 783-793. (SCI Q1, IF: 3.827)

[6] Ruiqian Zhang, Jian Yao, Kao Zhang, Chen Feng and Jiadong Zhang. S-CNN-Based Ship Detection from High-Resolution Remote Sensing Images[C]. ISPRS Congress, 2016. (Best Poster Award, EI).

[7] Tong He, Jian Yao, Kao Zhang, Yaolin Hou, Shiyao Han. Accurate Multi-Scale License Plate Localization Via Image Saliency[C]. IEEE ITSC, 2014. (Oral, EI).


三、相关获奖

2025,南京信息工程大学优秀班主任

2024,南京信息工程大学优秀教职工

2021,武汉大学研究生学术创新奖,二等奖

2018,IEEE ICME 2018 Salient360! 挑战赛,图像任务大奖

2018,IEEE ICME 2018 Salient360! 挑战赛,视频显著性预测,第一名

2018,IEEE ICME 2018 Salient360! 挑战赛,图像头部显著性预测,第一名

2017,IEEE ICME 2017 Salient360! 挑战赛,最佳学生奖

2017,IEEE ICME 2017 Salient360! 挑战赛,图像显著性预测,第二名

2016,国际摄影测量与遥感大会(ISPRS2016),最佳海报奖 (Best Poster Award), (合作论文)

2014,第一届"全国研究生智慧城市技术与创意设计大赛视频挑战赛",二等奖

2014,湖北省优秀学士学位论文奖,武汉大学优秀学士学位论文


四、发明专利

  • 张考,刘志彬,潘志庚,胡志华,等. 基于红外视频监控的预警和存储方法、系统、设备及介质. 申请号: CN202511016292.2.(授权

  • 杨贺龙,胡志华,张考,李明,等. 基于多视图全景与多标签图割的房屋空间布局估计方法、装置、设备及存储介质. 申请号CN202510208123.2.(授权)

  • 罗洋洋,张考,宋涛,胡志华,等. 一种视频裁剪方法及裁剪视频的质量评价方法. 申请号CN202411886091.3.(授权)

  • 蔡创新,潘志庚,张考,胡志华,等. 一种基于面部和体态行为感知的渐进性放松训练方法. 申请号CN202411003151.2.(授权)

  • 蔡创新,潘志庚,张考,胡志华,等.  融合交互式会话语境和会话者身份属性的情感识别方法. 申请号CN202411328293.6.(授权)

  • 蔡创新,潘志庚,邹宇,林贤煊,夏先亮,张考,等. 一种多模态对话情感识别方法. 申请号: CN202411833608.2.(授权)

  • 李昌利,章世钰,林贤煊,张考,等. 一种关键帧提取方法、装置及存储介质. 申请号CN202411314338.4.(授权)

  • 李雨顺,胡志华,潘志庚,张考,等. 基于神经辐射场和双向反射分布函数的数字地面三维重建方法、装置、设备及存储介质. 申请号: CN202411757299.5.(授权)

  • 姚剑,张考,贺通,朱飒. 一种基于仿射校正的多尺度车牌精准定位方法. 申请号: CN201410077985.8.(授权)

  • 陈震中,李洋,张考. 一种基于孪生网络的四足机器人目标跟踪方法. 申请号CN202310399358.5.(实审)
  • 陈震中,陈钊,张考.一种基于音视频特征的视频显著性预测方法和系统. 申请号: CN202310247030.1.(实审)

  • 张考,李松南. 图像裁剪方法、装置、计算机设备及存储介质. 申请号: CN202011644040.1.(实审)

  • 张考宋涛,胡志华,李明,等. 一种快速的全景视频显著性预测方法. 申请号: CN202510708582.7.(实审)



五、书籍

[1] 中国图象图形学学会编著. 元宇宙产业技术路线图. 中国科学技术出版社,2024.11,ISBN:9787523607367.(编写组成员,全书整理汇编).


六、授课信息

数字图像处理、神经网络与深度学习虚拟现实导论

人工智能导论(全英文)、机器学习课程设计(全英文)

程序设计基础(C语言)、基础编程语言(Python)


视觉显著性建模、摄影测量与遥感、图像视频处理、虚拟现实

通讯/办公地址:
  • 邮箱: