智能信号处理平台技术综述

【www.zhangdahai.com--其他范文】

马 超, 辛增献, 马 亮, 蒋张涛, 王 灿

(上海无线电设备研究所,上海 201109)

自2006年Geoffrey Hinton提出深度学习概念以来,在算法、数据和算力三方面研究进展的共同推动下,人工智能(AI)进入了第三个发展高潮期。2012年Alexnet模型在ImageNet图像分类竞赛中取得了超过其他方法10%以上的识别性能。2015年ResNet模型在ImageNet图像分类竞赛中准确率超越人工识别。2016年及2017年阿尔法围棋(AlphaGo)分别战胜了李世石和柯洁。2019年在Dota2游戏平台,人工智能系统Open AI Five打败了TI8冠军OG队。2019年Deep Mind公司人工智能程序AlphaStar战胜了“星际争霸2”顶尖人类职业选手[1]。

深度学习在雷达领域的应用已经成为相关学者的研究热点。文献[2]采用神经网络对合成孔径雷达(SAR)图像中的舰船目标进行检测。文献[3]将基于卷积神经网络(convolutional neural networks,CNN)超分辨谱估计的空时自适应处理框架用于杂波抑制。文献[4]采用的神经网络数据关联算法优于经典的关联算法。

美军同样非常重视未来智能化战场上的导弹智能化技术发展。导弹在感知、决策、控制、突防等方面要实现智能赋能,离不开具备适应深度学习算法实现的智能化计算平台[5]。本文主要论述导弹智能化落地对智能信号处理平台的需求,并详细分析现阶段神经网络AI处理芯片的发展现状及应用场景,为智能信号处理平台技术发展提供解决思路和方案。

智能信号处理平台是导弹智能化算法实现的硬件基础,决定了先进人工智能算法是否能在弹载平台部署落地,是导弹智能化水平的基础支撑。

算力是智能信号处理平台的核心指标[6]。算力的提升一直是人工智能快速发展的重要因素。Open AI近日发布的分析数据表明,自2012年以来,人工智能算法对算力的需求增长超过了30万倍,而摩尔定律是每18个月翻倍,只有12倍增长[7]。典型卷积神经网络参数个数如表1所示。随着网络性能的提升,神经网络模型的复杂度急剧增加。

表1 典型卷积神经网络参数个数[8]

人工智能芯片按部署位置可分为云端、边缘端。边缘端人工智能芯片[6]侧重功耗比,通常用于算法推理,主要部署在无人机、摄像头移动设备或嵌入式设备上。本文结合人工智能芯片的技术现状,从人工智能芯片算力、部署位置、应用成熟度等多方面进行对比,研究一种适用于弹载的智能信号处理平台技术实现途径。

人工智能芯片当前的技术发展主要有两种技术路径:一种是以图形处理器(GPU)、可编程逻辑阵列(FPGA)、专用集成电路(ASIC)为代表,此类人工智能芯片延续了传统的冯·诺依曼计算架构,占据市场主导地位;另外一种是采用类脑神经结构进行智能计算,彻底颠覆了冯·诺依曼计算架构,得益于体系架构更适应神经网络计算的特点,在算力、功耗、延时等方面极具潜力,有可能给人工智能产业带来新的技术变革[9-11]。本文对GPU、FPGA、ASIC、类脑芯片逐类分析,对比其优势和特点。

2.1 GPU智能计算加速

GPU是一种由大量运算单元组成的大规模并行计算架构芯片,具备了比中央处理器(CPU)更强大的浮点运算能力和更快的并行计算速度[6]。图1为GPU与CPU架构对比,算术逻辑单元占据了GPU绝大部分芯片面积。

图1 CPU与GPU架构对比

GPU更加适用于解决人工智能算法的训练难题。人工智能芯片领域的代表企业英伟达开发了基于GPU的统一计算设备架构(CUDA)开发平台,为开发者提供了丰富的开发软件工具包(SDK),支持现有大部分的机器学习和深度学习开发框架。英伟达“GPU+CUDA”开发模式已形成了相当可观的使用规模,奠定了当前英伟达在人工智能领域的霸主地位[12]。

2019年11月,英伟达公司宣布推出世界上最小的边缘端人工智能超级计算机——Jetson Xavier NX[13]。该边缘端智能计算机可以部署在诸多终端上,如视频安防摄像头、无人机、机器人和无人小车等,使其具备优异的AI边缘推断计算能力。而“嵌入式”结构则可以很好地解决这些终端进行人工智能计算所面临的带宽不足、延迟等问题[14]。目前英伟达公司已发布Jetson Nano、Jetson TX2、Jetson Xavier NX、Jetson AGX Xavier、Jetson Orin NX、Jetson AGX Orin等系列化产品线,并且Jetson系列边缘端智能计算机与其他英伟达平台上所用的AI软件和云原生工作流相兼容,并能为用户构建软件定义的自主机器学习环境提供所需的性能和能效。

国内学者对采用英伟达Jeston系列产品实现智能处理平台开展了大量研究。Jetson TX 1是英伟达在2015年推出的适用边缘端推理的AI计算平台,在功耗7W条件下可提供0.46 TOPS的峰值计算能力。文献[15]选用Jetson TX1作为AI计算核心,构建嵌入式智能处理平台搭载大疆无人机,对tiny-YOLO(you only look once)模型进行了一定压缩优化,将训练好的模型迁移部署在Jetson TX 1嵌入式AI推断平台上,实现了对目标的实时分类及检测。

文献[16]把YOLO目标识别算法移植到Jetson TX2平台(AI峰值算力1.33 TOPS),实现了对装甲车辆的实时目标检测,平均检测速度在15 fps左右。文献[17]对 小型快速区域卷积神经网络(small-faster region-CNN,S-Faster RCNN)模型进行改进用于空中小目标检测,对双层快速区域卷积神经网络(bilayer-faster region-CNN,B-Faster R-CNN)模型进行改进用于空中大目标检测,最后在Jetson TX2平台上完成空中目标检测模型的部署和验证。

文献[18]采用Jetson Xavier NX计算平台实现SAR图像舰船目标检测,Jetson Xavier NX嵌入式AI加速模组如图2所示。模组尺寸为69.6 mm×45.0 mm,AI峰值算力21 TOPS,典型功耗15 W。对YOLOV3原版的特征提取网络做Tensor RT的INT8量化,准确率可以达到94.2%,速度可达69.46 fps。若对YOLOV3的主干网络进行Mobile Net V2替换,最后通过英伟达Tensor RT工具进行INT8的优化,其目标检测算法运行速度可达196.97 fps。

图2 Jetson Xavier NX嵌入式AI加速模组

文献[15-18]研究表明,采用英伟达Jetson嵌入式AI计算平台,可以实时运行主流图像检测网络模型(如YOLOV3),功耗与DSP6678接近,体积可控。英伟达提供的统一开发环境支持各大主流AI框架,具备完善的部署工具链,对算法开发人员的硬件知识要求不高。

2022年英伟达继续发布Jetson Orin系列产品,算力进一步提升。目前主流英伟达Jeston系列产品性能如表2所示。

表2 英伟达Jeston系列产品性能

2.2 FPGA智能计算加速

采用FPGA芯片构建的智能信号处理平台,可以实现与传统弹载信号处理平台的无缝兼容,环境适应性好,人工智能算法可与雷达信号预处理在统一信号处理平台实现。国外FPGA的代表企业有赛灵思(Xilinx)和阿尔特拉(Altera)[19],国内代表企业有复旦微电子、紫光国微、成都华微电子等。国内研究基于FPGA实现的智能信号处理平台,主要以赛灵思厂商芯片为主。

在图像分类应用方面,文献[20]基于赛灵思的Zynq-7000全可编程系统级芯片(SOC)构建了智能信号处理平台,在可编程逻辑(PL)端开发神经网络加速器,并采用卷积运算中乘积结果复用的算法,实现了卷积神经网络中卷积层计算的加速。

在图像检测应用方面,文献[21]在基于Zynq-7100的硬件平台上部署实现轻量化深度网络模 型 Mobilenet-SSD。经 验 证,针 对Mobilenet-SSD,CNN加速器获得的峰值计算速度为26.67 GOPS。

在目标特征检测应用方面,文献[22]把雷达目标识别与深度学习相结合,得到目标的微多普勒特征后,利用CNN进行训练学习,根据特征差异对目标进行识别。在FPGA上构建了多层CNN(9层卷积层),用于旋翼飞机的识别,可以实现大四旋翼无人机、小四旋翼无人机、直升机的高准确率分类,可实现29.10 GOPS的峰值计算算力。

在武器智能决策应用方面,文献[23]以赛灵思的Zynq硬件平台为核心构建智能信号处理平台,利用FPGA构建了深度Q学习网络(DQN),实现了智能体对倒立摆的稳定控制。文献[24]对无人机自主决策进行了平台部署算法验证。

文献[20-24]均是以FPGA为AI芯片构建智能信号处理平台,并且在图像分类、目标检测、旋翼谱特征提取、深度强化学习方面都做了部署研究。但是采用的FPGA加速方案仍然基于传统的FPGA逻辑计算资源,其算力仅能实现每秒几百亿次操作。实现的网络层数也有限,远不能满足弹载信号处理平台的实时性要求。

在AI解决方案方面,目前赛灵思公司推出了自适应加速平台Versal ACAP。该平台是一个完全支持软件编程的异构计算平台,可将标量引擎、自适应引擎和智能引擎相结合,实现性能显著提升。例如VC1902可以实现不小于100 TOPS@INT8的AI算力。国内FPGA厂商也同时在发展集成AI引擎模块的异构FPGA,但是较赛灵思公司的Versal系列差距较大,目前可应用的FPGA产品算力落后2个数量级。以FPGA为AI芯片构建的智能信号处理平台的发展依赖未来国产FPGA算力的突破提升。

2.3 ASIC智能计算加速

由于ASIC芯片可针对人工智能算法模型的应用场景要求进行全定制化的设计[6],所以与GPU、FPGA芯片相比,ASIC芯片在计算效能、体积、成本等方面都有着极大优势[12]。以基于ASIC的AI芯片构建智能信号处理平台,在功耗和体积上具备一定优势。

我国从国家战略高度为人工智能芯片行业建立了优良的政策环境,催生了大量AI芯片初创企业[25]。但是由于AI芯片厂商的商业利益保护、产品推广模式等原因,在缺乏AI芯片的完整设计开发资料和技术支持的背景下,以AI芯片为核心并配合周边电路进行智能信号处理平台设计的技术难度很大,开发周期较长。

而基于AI芯片的边缘推理模组可构建完整的AI推理计算平台。该平台具备通用的板间互联接口,通过板间接口对插可实现与现有处理平台的数据传输与控制,快速实现AI模型算法的部署与加速计算。表3列出了国内基于AISC的AI芯片的应用场景及性能。

表3 国内基于AISC的AI芯片的应用场景及性能[8]

华为公司提供全栈式AI计算基础设施,包括昇腾系列处理器、AI计算框架和开发工具链,开发便利度较高,国内研究人员较多。文献[26]选用华为Atlas200的AI模组对机载平台智能化检测部署进行了性能评估。该加速模组是一款高性能的AI智能计算模块,内置了2个AI核。模拟构建了空对地敌方目标识别典型机载任务场景,搭载YOLOV3神经网络,并配合基于流水线的智能算法运行程序,识别地面坦克与战车。结果表明,Atlas 200模组在1 k Hz以下分辨率典型计算速度能达到(45~55)fps,验证了智能化的嵌入式计算模组用于机载设备的可行性。文献[27]采用Atlas 200模组构建智能化变电站电力设备巡检系统,在Atlas 200嵌入式平台上部署YOLOV4算法,单帧检测图像处理时间能够控制在28 ms内,能够满足系统的实时性要求,算法处理的准确度达到85%,召回率保持在82%左右。

2.4 类脑芯片智能计算加速

类脑计算架构是模仿生物大脑神经网络特点构建的,由神经元、突触以及网络互联组成,采用存算一体化芯片技术,突破了冯·诺依曼架构的“存储墙”限制。同时生物神经网络并行结构能够适应高速并行数据传输需求,其超低功耗、大规模并行计算以及实时处理的特点,与军事场景应用所需的性能、速度、功耗要求十分吻合,具有明显的应用优势[28-31]。

国外类脑芯片的典型代表为“真北(True North)”。IBM公司于2014年发布的第二代“TrueNorth”类脑芯片,每秒可执行460亿次突触运算,支持脉冲神经网络,总功耗仅为70 m W。2014年IBM公司采用“TrueNorth”芯片实现卫星、高空飞机和小型无人机自动识别坦克、防空系统等目标,功耗降低80%[30]。

国内类脑芯片近年取得了突破性成就。2019年清华大学施路平团队发布研究成果——类脑计算芯片“天机芯”。该芯片是世界首款异构融合类脑芯片,也是世界上第一个既可支持脉冲神经网络又可支持人工神经网路的人工智能芯片。该成果已在《自然》杂志上作为封面文章发表,实现了中国在芯片和人工智能两大领域在《自然》杂志发表论文零的突破。

国内类脑芯片领先企业北京灵汐科技有限公司基于“天机芯”推出HM100模组,单芯片集成25万神经元、2 500万突触。该模组支持各类深度学习神经网络、事件驱动的生物神经网络和脉冲类神经网络的实现和加速,可以提供32 TOPS@INT8的算力,功耗为(8~15)W[32]。HM100模组实物如图3所示。

图3 HM100模组实物图

文献[33]应用“天机芯”系列类脑芯片,采用区域卷积神经网络(R-CNN)、连续吸引子神经网络(CANN)、多层感知(MLP)等三种网络,分别实现了无人驾驶智能自行车系统中的目标探测、目标追踪、平衡控制的实时处理,实现了大规模CNN网络,验证了“天机芯”类脑芯片能够为大规模神经网络实时运行提供有效解决方案。

从算力、工具链与开发环境、部署实现方式及功耗等方面对各类AI芯片/模组的性能进行分析,为导弹、无人机等嵌入式边缘推理应用的智能信号处理平台提供人工智能芯片选型依据。

(1)算力对比

GPU方面,英伟达边缘端推理AI模组的功耗为(15~40)W,可以提供(20~200)TOPS的算力。FPGA方面,赛灵思的Zynq-7000系列、国内自主研制的FPGA集成AI引擎模块可以提供(1~2)TOPS的算力,与赛灵思Versal ACAP系列的算力存在较大差距。ASIC方面,华为的昇腾系列AI模组与英伟达的NX系列算力水平相当,商用规模在国内也较为广泛。其他厂商的AI芯片主要应用于云端加速、PCI-E接口加速,难以满足嵌入式应用的定制化需求。类脑芯片方面,灵汐科技HM100模组算力与功耗表现出色,并且芯片架构最适应神经网络计算方式,未来发展潜力较大。

(2)工具链与开发环境对比

便利的开发环境可以极大提高算法迭代设计及部署实现效率,对主流AI框架的支持程度与兼容性也至关重要。AI框架+算力芯片的组合在一定程度上决定了人工智能产业应用的主体技术路线[34]。英伟达的CUDA开发平台提供了丰富的开发软件工具,支持现有的大部分机器学习、深度学习开发框架,并提供云端、边缘端软硬件一体化服务。开源社区中大部分网络模型代码都支持GPU加速,在前期网络模型构建、训练、验证方面优势明显,并且后期嵌入式模组实物验证可统一构建方案。赛灵思公司的Vitis AI受到Versal ACAP系列渠道限制,目前国内应用不多。华为公司的MindSpore是国内活跃度最高的AI框架,可提供全流程开发工具链MindStudio。灵汐科技提供的LynSDK开发包,开发过程中技术支撑较好,并可根据用户反馈不断完善开发工具链。

(3)部署实现方式对比

GPU、ASIC及类脑芯片的厂商,均提供以AI芯片构建的计算加速模组。AI加速模组安装如图4所示。

图4 AI加速模组安装[35]

AI模组通过标准电气接口与原嵌入式系统进行互联,可加快智能信号处理机的处理速度。该部署方式中的AI模组一般均配备ARM处理器,配合开源操作系统(例如Ubuntu)和AI芯片,可实现边缘端部署。其部署方式与前期AI算法开发设计阶段使用的软件开发环境较为接近,对算法开发人员实现硬件部署非常便利。利用FPGA内部AI硬核进行计算加速,可与当前以FPGA+DSP构建的信号处理平台统一进行硬件设计,常规雷达信号处理与AI计算可以共享FPGA资源,其主要缺点是对系统开发人员的硬件知识要求较高,需要有一定的FPGA开发经验。同时国内FPGA厂商在人工智能加速领域存在一定的技术滞后,导致以FPGA构建的智能信号处理平台的生态规模较小,支撑算力性能有限。

(4)功耗对比

类脑芯片在功耗方面具备架构优势。例如灵汐HM100模组的AI芯片采用存算一体、众核并行的架构,功耗15 W条件下可以提供8 TOPS@INT8/16 TOPS@FP16的计算能力。

本文调研了当前国内AI芯片发展与应用情况,对比智能信号处理平台中不同类型AI芯片的算力、工具链开发环境、部署方式、功耗等方面的优缺点,总结弹载智能信号处理平台技术的发展方向。

算法与部署双统筹。在弹载智能化算法设计验证阶段,主要考虑模型实现与验证的便利性。首先重点考虑AI开发工具链与生态环境这两方面的优势。选择兼顾推理和边缘部署的AI芯片,可在产品实际工作环境中快速搭建设计与验证平台。在网络模型部署实现阶段,应重点考虑自主可控与低功耗。目前在国家政策的支持下,国内人工智能专用ASIC芯片、类脑芯片都可以适用于弹载平台,开发过程中的技术支持也更为全面。

综合与智能双驱动。综合一体化与智能化的弹载电子设备是驱动未来装备集成化、智能化的硬件载体。应统筹考虑导弹制导、链路、飞控一体化设计,将综合电子与智能处理需求相融合,构建弹载电子设备各领域的综合处理平台和人工智能处理平台,共同驱动我国导弹装备水平提升。

性能与功能双提升。复杂电磁环境电子对抗下的智能决策,智能算法是中心,对抗措施是基础。时域对抗能力需要大带宽提高距离分辨率,空域对抗能力需要多通道支撑数字波束赋形、角度超分辨,频域对抗能力需要超宽带及多模复合制导的支撑。智能信号处理平台在收发通道数、传输带宽、实时处理能力、瞬时动态特性等方面的提升同等重要。在性能要求不断提升的背景下,传统分立式处理芯片构建的弹载处理平台在功耗与体积方面难以适应新需求,应深入研究并采用微系统、异构SOC等措施逐步集成的高性能AI芯片、数模/模数(AD/DA)转换芯片、数据处理芯片,同步探索常规雷达数据处理与AI处理的融合,提升智能信号处理平台的能耗比。

猜你喜欢算力模组信号处理卫星通信在算力网络中的应用研究卫星应用(2023年1期)2023-02-21算力网络中基于算力标识的算力服务需求匹配数据与计算发展前沿(2022年6期)2022-12-22中国电信董事长柯瑞文:算力成为数字经济的主要生产力现代经济信息(2022年22期)2022-11-13基于SiteAI算力终端的交通态势感知系统中国交通信息化(2021年7期)2021-11-02光学薄膜技术及在背光模组中的应用研究电子制作(2019年12期)2019-07-16《信号处理》征稿简则信号处理(2018年5期)2018-08-20《信号处理》第九届编委会信号处理(2018年5期)2018-08-20《信号处理》征稿简则信号处理(2018年8期)2018-07-25《信号处理》第九届编委会信号处理(2018年8期)2018-07-25浅谈石墨烯材料在LED路灯模组中的应用及该模组的设计电子制作(2018年8期)2018-06-26

推荐访问:综述 信号处理 智能

本文来源:http://www.zhangdahai.com/shiyongfanwen/qitafanwen/2023/0921/657616.html

  • 相关内容
  • 热门专题
  • 网站地图- 手机版
  • Copyright @ www.zhangdahai.com 大海范文网 All Rights Reserved 黔ICP备2021006551号
  • 免责声明:大海范文网部分信息来自互联网,并不带表本站观点!若侵害了您的利益,请联系我们,我们将在48小时内删除!