百度大脑加持,完美体育·(中国)手机网页版科技FZ3深度学习计算卡评测
文章来源: 发布日期:2020.9.14 浏览次数:5897 次 |
如果你要问我现在电子产业什么最热,那无疑是AI,而基于大数据训练的深度学习技术可以说是目前AI应用的最广,最成功的产品形态了,覆盖我们生活的方方面面,诸如购物、看病、新闻编辑等,在这高深技术的背后少不了最前沿的硬件技术支持。今天笔者就拿到了完美体育·(中国)手机网页版科技与百度合作推出的一款深度学习计算卡MYS-ZU3EG-8E4D-EDGE-K1(从官方资料来看,这个版本表示搭载4GB DDR4的调试阶段的板卡,以下都将简称FZ3 EdgeBoard),我们来看看深度学习背后到底需要什么样的硬件支持。
- 开箱
- 硬件介绍
开发板正面
开发板背面
FZ3的硬件资源分布图如下:
. XCZU3EG,Zynq UltraScale + MPSoC SoC
. 4GB DDR4 SDRAM(64bit 2400Mbps)
. 8GB eMMC
. 32MB QSPI
. 10/100/1000Mb/s 千兆以太网 PHY
. RS485 * 1,CAN * 1
. 1 路 TF 卡接口
. 1 路 USB2.0 物理接口,1 路 USB3.0 物理接口
. 1 路千兆 RJ45 以太网接口
. 1 路 Mini Displayport 接口
. 1 路 PCIe x1 接口
. 1 个系统复位按键,1 个 FPGA 复位按键
. 1 路 MIPI-CSI 接口,1 路 BT1120 接口
. 1 路 JTAG 接口,1 路 USB 转 UART 调试接口
. 2 个 40PIN 2.54mm 间距 IO 扩展接口
. 四个板载 LED 状态指示
可以看到,虽然FZ3很小巧,但是该有的外设资源一点也不少,而且很多外设是有别于传统嵌入式开发板的,比如搭载了4GB的DDR4 SDRAM ,USB3.0接口,mini Displayport接口,PCIe接口等,这些更像是作为生产力工具的计算机才有的,看到这些配置,是不是对这个板子更加感兴趣了?再来看下各部分接口的细节图,彻底体验下将消费电子做成工业级产品的奢侈感。
PS单元接口
mini Displayport接口:1 路 Mini DisplayPort 接口,2lane,支持 DP1.2a 4K/30fps 分辨率输出。
PCIe 1x 接口:1 路 PCIe 1x 接口,从 PS 端引出,支持 PCIe 2.1。
PS 端以太网:1 路 10/100/1000Mbps 以太网 RJ45 接口。
USB Host :1 路 USB 2.0 接口,1 路 USB3.0 接口(含 USB2.0),一起经由底板上的双层 USB3.0TYPE-A 接口引出,作为 HOST,接口为 J2,上层仅支持 USB2.0,下层支持 UBS3.0 和USB2.0。
TF 卡接口:1 路 TF 卡接口,用于启动或者存储。
MicroUSB to UART 接口:1 路 MicroUSB to UART 接口,用于调试开发板。
PL 单元接口
1 MIPI-CSI 摄像头接口:MIPI 信号直接通过 PL 端的 IO,进入 FPGA 内部进行解码。
BT1120 视频输入接口:PL 端留有 BT1120 视频输入接口,BT1120 视频信号直接通过 PL 端的 IO,进入 FPGA 内部进行解码。详细 IO 细节请参考 PINMAP。
IO 扩展接口
本开发板通过 2 个 2x20PIN 的 2.54 排针进行 IO 扩展,其中包含 12V,5V,3.3V,1.8V 等电源输出,CAN,RS485,USB2.0x2,4xPSMIO,40PIN PL 端 IO 等信号。
电源输入接口,默认为 12V 输入,过流保护为 2A
RTC 电池接口,可使用 1.5V 的 AG3/LR41 型号电池
风扇接口,默认为 12V 供电,可以通过 PL 端 IO 探测风扇转速
CAN 接口、RS485 接口
当然,这么多外设的扩展还是离不开板子的核心重点,赛灵思Zynq UltraScale + MPSoC SoC XCZU3EG-SFVC784。
集成了ARM 四核 Cortex-A53(PS),双核 Cortex-R5(PS),Mali-400 MP2 图形处理单元和Kintex Ultrascale + FPGA(PL)。四核 Cortex-A53 具有强大的计算能力,双核 Cortex-R5可用于实时处理应用,Mali-400 MP2 可用于加速图形处理,而 FPGA 具有完全可编程性。配合丰富的常用接口以及可扩展接口,可适应各种应用场景。
XCZU3EG-SFVC784 支持 1.5GHz(最大-1)的 APU 速度,600MHz(最大-1)的 RPU速度,667MHz(最大-1)的 GPU 速度,以及高达 2400Mbps 的 DDR4 速度。
基于赛灵思的XCZU3EG SoC,内部集成了4核ARM A53处理器+GPU+FPGA的架构,具有多核心处理能力、FPGA可编程能力以及视频流硬件解码能力等特点;内置了基于Linux操作系统+百度深度学习平台-飞桨(Paddle)定制的深度学习软核,深度兼容百度大脑模型资源与工具平台(EasyDL/AIStudio),可高效、快速的实现模型的训练-部署-推理等一系列流程,极大降低了开发验证、产品集成、科研教学、项目部署的门槛。
- 上电使用
FZ3 计算卡内部搭载Linux系统,开发者可以基于Linux系统进行应用程序进行开发。(主要调用流程:1.应用程序获取视频输入->2.调用预测库加载模型->3.调度模型和底层驱动加速模块进行计算->4.获得运行结果)
因为没有这个比较先进的miniDP接口转接线,所以无奈只能通过最原始的网口访问,通过SSH连接,官方出厂默认的静态IP为:192.168.1.254,所以我配置在相应的网段内。
然后通过putty的ssh功能访问,初始的用户名和密码都是root。
登录成功后,我们可以直接通过文件管理的ftp方式访问开发板上的文件。
据官方介绍开发板有默认的深度学习示例,不过既然是和百度大脑联合的一个开发平台,我们怎么也要用自己训练的模型,所以当可以连接上FZ3后,我们就向“百度大脑”开炮。
运行EasyDL平台模型预测
EasyDL是一站式的深度学习模型训练和服务平台,提供可视化的操作界面,只需上传少量图片就可以获得高精度模型。
当然,首先我们得注册个账号,然后通过场景可以选择“图像分类”或者“物体检测”。
……