ImageVerifierCode 换一换
格式:PDF , 页数:9 ,大小:1.60MB ,
资源ID:2248687      下载积分:10 积分
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝扫码支付 微信扫码支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wnwk.com/docdown/2248687.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(基于GPU的荧光油膜运动路径实时测量_吴培灵.pdf)为本站会员(哎呦****中)主动上传,蜗牛文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知蜗牛文库(发送邮件至admin@wnwk.com或直接QQ联系客服),我们立即给予删除!

基于GPU的荧光油膜运动路径实时测量_吴培灵.pdf

1、第 14 卷 第 1 期2023 年 2 月Vol.14 No.1Feb.2023航空工程进展ADVANCES IN AERONAUTICAL SCIENCE AND ENGINEERING基于 GPU的荧光油膜运动路径实时测量吴培灵1,张征宇1,2,孙维1(1.西南科技大学 信息工程学院,绵阳 621010)(2.中国空气动力研究与发展中心 高速空气动力研究所,绵阳 621010)摘要:在风洞试验中,现有的基于 CPU 的光流法求解荧光油膜运动速度场耗时过长,而基于 GPU 的光流法存在 GPU 资源利用不充分的问题。为此,提出基于荧光油膜图像分块和临界约束的 GPU 荧光油膜运动路径实时测

2、量方法。将荧光油膜时序图像按照 GPU 的资源将整帧图像切割分块并行处理,创建其对应的光流并行计算策略,即充分利用 GPU 的并行流水架构优势和共享内存实现各并行块的光流计算的硬件加速;同时结合块间临界约束条件,以各块的速度矩阵迭代差为标志控制其迭代计算次数。结果表明:本文方法在保证荧光油膜运动速度场计算精度的条件下,较传统的基于 CPU 的光流法解算速度平均提升了 2 789.5倍,较整帧图像的GPU 光流法速度平均提升了 10.09倍,实时解算速度可达 90帧/秒。关键词:光流法;图像分块;临界约束;荧光油膜;共享内存中图分类号:V211.7 文献标识码:ADOI:10.16615/ki.

3、1674-8190.2023.01.19Real-time measurement of fluorescent oil film motion path based on GPUWU Peiling1,ZHANG Zhengyu1,2,SUN Wei1(1.School of Information Engineering,Southwest University of Science and Technology,Mianyang 621010,China)(2.High Speed Aerodynamics Research Institute,China Aerodynamics Re

4、search and Development Center,Mianyang 621010,China)Abstract:In the wind tunnel experiment,the existing CPU-based optical flow method takes too long to solve the velocity field of the fluorescent oil film,while the GPU-based optical flow method has the problem of insufficient utilization of GPU reso

5、urces.To this end,a real-time measurement method of GPU fluorescent oil film motion path based on fluorescent oil film image segmentation and critical constraints is proposed.The fluorescent oil film time-series image is divided into blocks and processed in parallel according to the resources of the

6、 GPU,and the corresponding optical flow parallel computing strategy is created,that is,the advantages of the parallel pipeline architecture of the GPU and the shared memory are fully utilized to realize the optical flow calculation of each parallel block.At the same time,combined with the critical c

7、onstraints between blocks,the number of iterative calculations is controlled by the iterative difference of the speed matrix of each block as a symbol.The experimental results show that the method proposed in this paper is 2 789.5 times faster than the traditional CPU-based optical flow method under

8、 the condition of ensuring the calculation accuracy of the velocity field of the fluorescent oil film motion,and the average speed of the GPU optical flow method of the whole frame image is improved.10.09 times and the real-time solution speed can reach 90 frames per second.Key words:optical flow me

9、thod;image block;critical constraint;fluorescent oil film;shared memory文章编号:1674-8190(2023)01-157-08收稿日期:20220302;修回日期:20220503基金项目:国家自然科学基金(11872069)通信作者:张征宇,zhang_引用格式:吴培灵,张征宇,孙维.基于 GPU 的荧光油膜运动路径实时测量J.航空工程进展,2023,14(1):157-164,174.WU Peiling,ZHANG Zhengyu,SUN Wei.Real-time measurement of fluoresce

10、nt oil film motion path based on GPUJ.Advances in Aeronautical Science and Engineering,2023,14(1):157-164,174.(in Chinese)第 14 卷航空工程进展0引 言风洞试验模型表面的荧光油膜受来流的黏性摩擦作用,在模型表面产生位移(形成荧光油膜运动路径),因此,风洞试验中模型表面荧光油膜运动的时序图像蕴含了油膜在来流剪切力作用下的运动信息,即采用光学流动技术1-3处理模型表面荧光油膜运动的时序图像,可以解得模型表面流场的拓扑结构和荧光油膜运动路径速度场4-5。一方面,可定量观测模型壁

11、面流场的奇点(结点和鞍点)分布,为掌握试验模型壁面发生流动分离的位置、分离方式与特点以及漩涡形成机理等提供重要的研究数据;另一方面,可用于计算模型的表面摩擦力分布信息6-8。G.Schrauf9研究发现,摩擦阻力(简称摩阻)占据飞行器所受总阻力的 45%50%,其占比大于其他阻力项,摩阻每降低 1%燃油消耗可下降0.625%。飞行器防护设计依赖于表面摩阻的测量10,在高超声速条件下,飞行器防护设计不当会导致飞行器的外壳烧毁或制造材料严重浪费。因此,摩阻测量研究对于飞行器的燃料节省、航程增加以及防护材料设计都有重要意义。L.C.Squire11在考虑剪切力作用下的油膜运动时推导得出薄油膜方程,为

12、基于油膜的剪切应力测量技术奠定了基础;L.H.Tanner等12通过油膜干涉测量表面摩阻,将推导出的方程赋予实际意义,为后续研究打下了坚实的基础;随后 D.J.Monson 等13、J.L.Brown 等14对油膜演化方程进行了进一步完善;Liu Tianshu 等15提出了采用荧光油膜代替传统油膜的方法,进一步推进了摩阻的测量研究;李鹏16推导了荧光油膜控制方程并进行了简化,得到了荧光油膜测量方程,该方程表明,摩阻测量与荧光油膜运动速度、荧光油膜厚度相关,需要采用光流法求出荧光油膜运动速度再将厚度代入即可获得摩阻。在现有众多全局摩阻的测量技术中,如 Preston管法、热线法、MEMS 摩擦

13、天平17等,大都需要依托复杂的外部设备,而且制造难度系数大、成本高、空间分辨率低、风洞环境条件要求高等问题都在一定程度上限制了其应用发展。荧光油膜摩阻测量方法具有设备简单、成本低、对环境模型无特殊 要 求、空 间 分 辨 率 高 等 优 点,是 当 前 研 究 的热点。荧光油膜运动路径速度求解在摩阻测量中是至关重要的环节,但采用光流法对荧光油膜进行运动速度求解时,因为其解算方程的数值计算涉及大量的卷积计算和多次迭代计算,导致基于中央处理器(Central Processing Unit,简称 CPU)的光流法求解一次风洞荧光油膜试验图像太耗时,需要花费 46 h18,且不能在试验过程中实时定量

14、显示试验模型物面流态及其演化过程,降低了其工程应用的价值。现 有 的 现 场 可 编 程 门 阵 列19-20(Field-Programmable Gate Array,简称 FPGA)技术,受限于片上资源,加之编程难度大,目前常用于图像的预处理阶段。戚烜20的研究表明,对于分辨率为640480 的 普 通 图 像,其 光 流 解 算 时 间 为 22.7 ms。可见若利用 FPGA 进行较高分辨率的图像解算效果并不理想21。鉴于图形处理器22(Graphics Processing Unit,简称 GPU)既有擅长数据并行处理的架构,又具有大量与 CPU 相同的算术逻辑单元(计算能力优于

15、FPGA),因此,可以直接基于 GPU 并行迭代的硬件架构将图像分块,利用 CPU 无法比拟的大量线程完成分块图像数据的并行计算,即有通过硬件加速实现实时求解光流方程的可能性。同时,相较于 FPGA 技术,统一计算设备架构(Compute Unified Device Architecture,简称 CUDA)编程更灵活,从而为模型表面流场的拓扑结构和荧光油膜运动路径速度场实时观测提供了一条新的可行路径。A.Plyer 等23和 孙 瑞 鑫 等24分 别 实 现 了 以14.4和 30帧/秒的计算速度解算分辨率为 1 9201 080 的图像,但仅适用于特定场景。对于风洞试验的高分辨率高帧率图

16、片而言,这样的计算速度无法满足工业实时解算需求。为此,本文提出基于荧光油膜图像分块和临界约束的 GPU 荧光油膜运动路径实时测量方法,将荧光油膜时序图像按GPU 的资源自适应分块,分别创建其对应的光流并行计算与块边界光滑约束方法,充分利用 GPU的并行架构优势,实现实时定量观测模型表面流场的拓扑结构和荧光油膜运动路径速度场。1油膜图像的分块并行约束法本文提出荧光油膜时序图像按 GPU 的资源分块方法,在 GPU 上将待计算的图像先进行分块处158第 1 期吴培灵等:基于 GPU 的荧光油膜运动路径实时测量理,分块后的图像子块分别存储于 GPU 的共享内存上,利用 GPU 多线程对需要光流解算的每帧图像数据进行并行计算,可大量减少内存数据的存储次数,从而减少光流迭代计算中的时间消耗,再针对图像中存在突变噪声或者运动趋势不明显的情 况,以 块 为 单 位 添 加 约 束 条 件,减 少 冗 余 计算量。1.1GPU的并行架构GPU 上含有多个流式处理器(Streaming Multiprocessors,简称 SM),如图 1 所示,每个 SM 中包含有多个 block,一个 block的

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2