龙芯首款 GPGPU 芯片 9A1000 预计在三季度内交付流片

  龙芯科技 9A1000 显卡于 2023 年开始研发,如今距离最终定稿又近了一步。龙芯中科近日在互动平台回复称,龙芯首款 GPGPU 芯片 9A1000 的研发基本完成,三季度内会交付流片。成功与否需待流片回来后的测试结果。

  9A1000 是龙芯的首款显卡,对于这家此前主要专注于处理器的中国制造商来说,这是一个重要的里程碑。该公司将 9A1000 定位为支持 AI 加速的入门级显卡。因此,它与另一款据称可与 GeForce RTX 4060 匹敌的中国显卡 Lisuan G100 并不在同一细分市场竞争。

  依据此前的官方资料报道,龙芯 9A1000 显卡芯片的一大亮点在于对 PCIe 4.0 系统总线的支持,并且适配 128-bit LPDDR4X 高速显存。尽管具体的计算核数、显存规模、运作频率及功耗数据尚未公布,但从已曝光的结构图中可窥见其布局了八大计算集群,辅以片上互联网络与二级缓存机制,预示着不俗的内部架构设计。

  在软件兼容层面,龙芯 9A1000 全面拥抱 OpenGL 4.0、OpenCL 3.0 等行业主流图形与计算 API,内置专业级视频处理组件,硬解码能力覆盖 H.264、H.265 编解码标准,同时支持 HDMI 2.1、DisplayPort 1.4 以及经典的 VGA 等多种显示输出协议。

  深入剖析其性能规格,龙芯 9A1000 拥有高达 16GP/s(每秒 160 亿个像素点)的像素填充速率,纹理填充速率为 32GT/s(每秒 320 亿个纹理元素),浮点运算能力可达 FP32 精度下 1TFLOPS(每秒 1 万亿次)、FP64 精度下 64GFLOPs(每秒 640 亿次),而在 INT8 整数运算环境下则飙升至 32TFLOPS(每秒 32 万亿次)。这些指标共同描绘了一个兼顾图形渲染与深度学习加速的强大计算平台轮廓。

  9A1000 的最新更新表明,龙芯已将流处理器的面积缩小了 20%。制造商还声称,9A1000 的工作频率提高了 25%,同时轻负载下的功耗优化了 70%。在功能方面,9A1000 支持 OpenGL 4.0 和 OpenCL ES 3.2 API。

  龙芯表示,9A1000 的速度比 2K3000 处理器内置的集成显卡 LG200 快 4 倍。9A1000 还提供高达 40 TOPS 的 AI 计算能力,略低于 AMD Ryzen AI Max+(代号 Strix Halo)芯片内置的 XDNA 2 NPU(高达 50 TOPS)。

  9A1000 并非龙芯唯一的显卡产品。该公司还在研发 9A2000,据称其速度比 9A1000 快 10 倍,性能水平堪比 GeForce RTX 2080。此外,龙芯还计划推出 9A3000,作为 9A2000 的后续产品,但目前尚不清楚具体规格。