基于c66x+国产fpga高速数据处理板架构

信迈科技DSP+ARM+FPGA 信迈科技DSP+ARM+FPGA     2022-12-02     512

关键词:

目录
概述
C66x处理器内核
C66x流水线结构
概述
C66X DSP是最新一代定点和浮点DSP,由4个乘法器组成,以实施单精度浮点运算。C66X DSP内核可同时运行多大8项浮点乘法运算,加之高达1.4GHz的时钟频率,使其具有很高的浮点处理性能。将多个C66x DSP内核与其他内核融合,即可创建出具有初中性能的多核片上系统器件。本文以TMS320C6678为例,介绍C66x内核。

TMS320C6678具有8个C66x内核,内核工作主频最高可达1.4GHz,理论上具有179.2(22.4x8)GFLOP和358.4(44.8x8)GMAC的处理性能。每个处理器内部有多级存储器:C66x内核中有L1P、L1D、L2SRAM;多核共享存储器为MSM SRAM。处理器具有多核导航器、网络协处理器、数据包加速器、信号量、PLL等多核共享的一些外部资源,同时提供如SRIO、PCIE、EMIF等多种外部接口。C6678的处理器架构如下图所示:


C66x处理器内核
C66x内核是C6678处理器的核心,用于完成高性能处理任务。

 

C66x内核由以下组件组成:C66xDSP、一级程序存储器控制器(L1P)、一级数据存储器控制器(L1D)、二级存储器控制(L2)、外部存储器控制器(EMC)、扩展存储器控制器(XMC)、带宽管理(BWM)、中断控制器和休眠控制器(PDC)组成。内核结构如下:

C66xDSP由8个功能单元,2个寄存器组和2条数据通路组成,结构如下图所示。两个寄存器组共有64个寄存器,分为A和B两组,每组由32个32-bit寄存器组成。通用寄存器可以用来存放数据,也可以当作地址指针。所支持的类型有8-bit打包数据,16-bit打包数据,32-bit数据,40-bit数据和64-bit数据,乘法支持128-bit数据。

8个功能存储单元(.L1 .S1 .M1 .D1 .L2 .S2 .D2 .S2),每个功能单元的每个时钟周期都能够执行一条指令。.S单元执行通常的移位、分支及比较程序,.L单元执行通常的算数及逻辑程序;所有乘法指令都在.M单元执行(一个.M单元包含16组16x16bit乘法器,1个周期内可执行一次单精度浮点乘法运算,4个周期可执行一次双精度浮点乘法运算)。.D单元主要完成从存储器加载(load)数据到寄存器堆(register file),并从寄存器堆保存(store)结果到存储器。

C66x流水线结构
计算机流水线(Pipeline)是Intel首次在486芯片中开始使用的。在CPU中把指令的执行分成若干个不同的功能单元来实现,由若干个不同功能的电路单元组成一条指令处理流水线,然后将一条X86指令分成若干步后再由这些电路单元分别执行,这样就能实现在一个CPU时钟周期完成一条指令,因此提高CPU的运算速度。

C66x DSP的流水结构共分三个阶段:指令预取(Fetch)、指令解码(Decode)、指令执行(Execute)。各阶段的详细流水线结构如下:


阶段    流水名称    含义
Fetch    PG    Program address generate:产生程序地址
PS    Program address send:发送程序地址
PW    Program (memory) access ready wait:等待程序内存响应
PR    Program fetch packet receive:接收从内存传回的指令包
Decode    DP    Instruction dispatch:将指令分配到相应的功能单元
DC    Instruction decode:将指令在相应的功能单元进行译码
Execute    E1    执行指令,不同指令拥有不同的执行流水操作
...
E5
Fetch阶段的流水操作图示:

Decode 阶段的流水操作图示:

Execute 阶段的流水操作图示:

创龙基于c66x平台dsp与fpga通信测试

本文为基于创龙TL665xF-EasyEVM开发板的DSP与FPGA通信测试。TL665xF-EasyEV开发板的简介绍如下:由核心板+底板构成。核心板DSP端采用单核TMS320C6655或双核TMS320C6657处理器,FPGA端采用XilinxArtix-7处理器,实现异构多核处理器架构,DSP与FPGA... 查看详情

国产arm+fpga+ad低成本高性能数据采集卡方案

前言近年来,随着中国新基建、中国制造2025的持续推进,单ARM处理器越来越难胜任工业现场的功能要求,特别是能源电力、工业控制、智慧医疗等行业通常需要ARM+FPGA架构的处理器平台来实现特定的功能,例如... 查看详情

375-基于tidsptms320c6657xc7k325t的高速数据处理核心板

基于TIDSPTMS320C6657、XC7K325T的高速数据处理核心板一、板卡概述      该DSP+FPGA高速信号采集处理板由我公司自主研发,包含一片TI DSP TMS320C6657和一片Xilinx K7 FPGA XC7K325T-1FFG900。包含1个千兆网口,1... 查看详情

204-基于xilinxvirtex-6xc6vlx240t和tidsptms320c6678的信号处理板

基于XilinxVirtex-6XC6VLX240T和TIDSPTMS320C6678的信号处理板 1、板卡概述    板卡由我公司自主研发,基于VPX架构,主体芯片为两片TIDSPTMS320C6678,两片Virtex-6XC6VLX240T-ff1156FPGA,1个RapidIOSwitch。FPGA连接FMC子卡。FPGA片外挂接2簇32bitDD... 查看详情

基于龙芯+国产fpga的vpx以太网交换板设计

3.1板卡技术要求3.1.1主要性能指标本着向下兼容的原则,以太网交换板的设计尽量保留传统信息处理平台的基本功能和接口,重点考虑提升设备的性能和扩展性。本课题以太网交换板的主要性能指标如下:(1)... 查看详情

fpga案例开发手册——基于全志t3+logosfpga核心板

...法,适用的开发环境为Windows764bit和Windows1064bit。本文案例基于创龙科技的全志T3+LogosFPGA核心板,它是一款基于全志科技T3四核ARMCortex-A7处理器+紫光同创LogosPGL25G/PGL50GFPGA设计的异构多核全国产工业核心板,ARMCortex-A7处理单元主频... 查看详情

基于fpga的高速图像处理平台设计_爱学术

...处理速度慢,显示分辨率低,不方便携带等问题,设计了一个基于FPGA的高速图像处理平台,包含高速图像的采集、处理、及显示。图像采集通过CameraLink接口采集图像,图像处理部分利用乒乓操作对图像数据进行高速存储,FPGA完成图像预... 查看详情

基于龙芯+国产fpga的vpx以太网交换板设计

        调试与测试是本系统设计实现的重要环节。单板调试主要包括各单元电路和接口的调试,主要通过查看信号波形和运行软件对每个功能进行测试。本章将设计一系列的调试和测试方案来验证电路设计的正确性。6.1... 查看详情

基于国产arm+fpga+codesys运动控制平台的智能人机交互系统设计

...保护领域智能保护装置显示系统的需求,提出了一种基于国产ARM处理器和FPGA的智能人机交互系统的设计方案。该方案重点阐述了智能人机交互系统的功能架构及硬件设计方案,并介绍了数据交换和人机交互的软件设... 查看详情

基于国产arm+fpga+codesys运动控制平台的智能人机交互系统设计

...保护领域智能保护装置显示系统的需求,提出了一种基于国产ARM处理器和FPGA的智能人机交互系统的设计方案。该方案重点阐述了智能人机交互系统的功能架构及硬件设计方案,并介绍了数据交换和人机交互的软件设... 查看详情

xm6748f-idktms320c6748+fpga高速数据采集处理平台

...板简介    深圳信迈设计的XM6748F-IDK-V3是一款DSP+FPGA高速数据采集处理开发板,适用于电力、通信、工控、医疗和音视频等数据采集处理领域。此设计采用OMAP-L138+Spartan-6平台,其中OMAP-L138是德州仪器(TI)... 查看详情

基于2片xilinxkintex-7系列fpga高性能vpx存储板

VPX611是北京青翼科技的一款基于6UVPX总线架构的高性能数据存储板,该板卡采用2片XilinxKintex-7系列FPGA作为主控单元,FPGA内嵌RAID控制器,最大支持8个mSATA盘,最大存储容量可以达到8TByte,持续数据写入带宽可以达到3.2GByte/s。板卡... 查看详情

基于fpga的高速数据采集系统实现(代码片段)

欢迎订阅《FPGA学习入门100例教程》、《MATLAB学习入门100例教程》目录一、理论基础二、核心程序2.1锁存器模块2.2双口地址计数器模块2.3双口RAM模块2.4时钟分频模块三、测试结果一、理论基础    高速数据采集在军用民用领域都... 查看详情

飞腾ft-2000/4处理器+复旦微fpga+国产操作系统解决方案

...高度集成,具有丰富的接口和电磁兼容性能.XM-1203-FPGA基于飞腾4核CPUFT-2000/4的处理器板,非标定制主板,主频2.2、2.6GHz, 查看详情

am5728+xilinxartix7三核高速图像和数据信号采集处理平台

...变■ ARM核负责HMI界面+DSP核处理复杂数据计算+FPGA高速运动控制■ 支持多种电机驱动: 查看详情

fpga学习-2:开发板及verilog介绍(代码片段)

...司设计的tangpermier开发板进行开发学习这款开发板使用了国产EG4S20芯片拥有2万多个逻辑门单元价格仅100多,极具性价比可以在上面跑riscv开源架构cpu核心完全够用IDE我们使用官方的安路TD软件详细安装过程可去sipeed文档上查看与... 查看详情

fpga和dsp间基于srio的高速通信系统设计

作者:陈婷,岳强,汪洋解放军信息工程大学摘要:现代信号处理系统通常需要在不同处理器之间实现高速数据通信,SRIO协议由于高效率、低延时的特性被广泛使用。本文研究了在FPGA和DSP两种处理器之间实现SRIO协议的方法,并... 查看详情

信迈tms320c6655+xilinxartix7评估板dsp+fpga音视频数据采集

...变■ ARM核负责HMI界面+DSP核处理复杂数据计算+FPGA高速运动控制■ 支持多种电机驱动:脉冲电机,变频电机,安川电机■ 多达3个网口,支持ETHERCAT工业总线设备■ ECNC运动控制SDK软件包,轻松实现工业... 查看详情