当前位置:科学网首页 > 基金首页 > 高逼真度视听系统的理论与方法

国家自然科学基金项目查询

高逼真度视听系统的理论与方法

批准号61421062 学科分类计算机应用技术 ( F0205 )
项目负责人姜明 负责人职称教授 依托单位北京大学
资助金额600.00
万元
项目类别创新研究群体科学基金 研究期限2015 年 01 月 01 日 至
2017 年 12 月 31 日
中文主题词视频处理;音频处理;图像处理;虚拟现实;音视频标准
英文主题词video processing;audio processing;image processing;virtual reality;video and audio standards

摘要

中文摘要 在进一步的研究工作中,本群体将继续围绕大规模高逼真度视听数据处理和呈现这个核心问题,发挥群体过去特别是近三年形成的合作和研究优势,以建立“高逼真度视听系统的理论与方法”为总体科学目标,解决未来高逼真度视听系统的基础理论问题和核心技术难题,为满足国家在高逼真度视听系统方面的重大战略需求奠定理论和技术基础。拟在如下三个方面开展研究:1)高逼真度视听信息表示与重建理论:包括表示理论、视觉信息熵、快速重建算法、超分辨重建算法等;2)高逼真度视听信息编码理论与方法:包括高逼真度视频编码方法、基于模型的视频编码方法、高逼真度音频编码方法、高逼真度图像视频质量评价方法等;3)视听场景高逼真度呈现:包括高清晰度视听场景结构快速重建、高清晰度视听场景和虚拟场景的融合计算、高逼真度视听验证系统的构建及其示范等。
英文摘要 In the future, we will continue to focus on the key issues of large-scale HF video and audio data processing and presentation. We will take advantage of the past achievements, develop “theories and methods of HF video and audio system”, solve related fundamental theoretical and technical problems and provide fundamental theories to meet the national request on super-high-definition video and audio system. We will carry out research on (1) The representation and reconstruction of HF video and audio: representation theories, visual information entropy, efficient reconstruction algorithm and super-resolution reconstruction algorithm etc. (2) Theories and methods of HF video and audio coding: HF video coding, model-based video coding, HF audio coding, HF image and video evaluation etc. (3) The presentation of HF video and audio scene: efficient reconstruction of HF video and audio scene structure, the mixed computing of HF video and audio scene and virtual scene, the development and demonstration of HF video and audio validation systems.
结题摘要 高逼真度视音频的广泛应用产生了若干理论和方法挑战。本创新研究群体围绕大规模高逼真度视听数据处理和呈现这一核心问题,发挥群体的合作和研究优势,以建立“高逼真度视听系统的理论与方法”为总体科学目标,通过解决高逼真度视听系统的基础理论问题和核心技术难题,为满足国家在高逼真度视听系统方面的重大战略需求奠定理论和技术基础。过去六年中,本创新研究群体重点开展了高逼真度视听信息表示与重建的理论与方法、编码理论与方法、视听场景呈现与高效计算方法等方面的研究,取得如下主要成果:(1) 针对高逼真度视听信息表示与重建问题,在视觉信息论、高阶全变差、Mumford-Shah泛函正则化理论和硬件加速重建方法、超分辨重建等方面取得进展。(2) 针对高逼真度视频压缩问题,提出了一系列高效预测变换编码技术,牵头制定了新一代AVS2高效视频编码标准和IEEE 1857系列标准;提出了基于背景建模的场景视频编码方法,位于国际领先水平;建立了视觉特征紧凑表示方法及高性能图像搜索技术,牵头制定了紧凑特征国际标准CDVS;提出了高逼真度视频质量评价新方法。(3)针对高逼真度声音场景分析和音频编码问题,在多通道信号采集、复杂声音场景分析模型和多通道方面取得进展。(4)针对视听场景呈现与高效计算问题,在大规模场景的高效绘制、快速重建、编辑修改、场景管理、场景快速融合、重建场景正则化与场景化等关键技术上取得进展;在HEVC编码器和AVS2超高清编码器硬件设计优化高效计算方面取得进展。研究成果进入多项国家和国际标准并应用于多项民用、国防项目。研制了AVS2超高清编码器,可实现4K超高清视频的实时编码;研制了一类面向各种任务的飞行模拟器成套设备;研制了一套32通道的声音采集系统及22.2声道的高逼真度、高临场感的三维虚拟声播放系统;研制了完成2亿像素24Hz超高分辨率光学成像相机,实现了高逼真度视觉场景采集、呈现与高效计算。在人才培养方面,本群体新增国家杰出青年科学基金获得者2人、优秀青年基金获得者1人、中国科协求是杰出青年成果转化奖获得者1人。经过近六年的发展,以项目实施单位北京大学数字视频编解码技术国家工程实验室为核心,本创新研究群体形成了团结协作、分工明确和管理规范的学术环境,创新能力不断提高,技术体系初步形成,国际化水平和国际竞争力不断提升,学术影响日益扩大,研究团队已经成为国内外相关领域的一流研究团队。

成果

序号 标题 类型 作者
1 Non-local Structure-based Filter for VideoCoding 会议 Jian Zhang|Chuanmin Jia|Siwei Ma|Wen Gao|
2 Multi-stage vector quantization towards low-bit rate visual search 会议 Rongrong Ji|Zhe Wang|Tiejun Huang|Wen Gao|
3 Learning Sparse Tag Patterns for Social Image Classification 会议 Ling-Yu Duan|Junsong Yuan|Qingyong LI|Siwei Luo|
4 Background-Foreground Division based Search for Motion Estimation in Surveillance Video Coding 会议 Long Zhao|Yonghong Tian|Tiejun Huang|
5 Joint Optimization of JPEG Quantization Table and Coefficient Thresholding for Low Bit Rate Mobile Visual Search 会议 Ling-Yu Duan|Jie Lin|Tiejun Huang|Wen Gao|

关于我们| 网站声明| 服务条款| 联系方式| RSS| 中国科学报社 京ICP备14006957 京公网安备110402500057号
Copyright @ 2007- 中国科学报社 All Rights Reserved
地址:北京市海淀区中关村南一条乙三号   电话:010-62580783