Chiphell - 分享与交流用户体验

 找回密码
 加入我们
搜索
      
查看: 28718|回复: 181

[其他] 国产AI芯片CAISA诞生!性能超英伟达同类产品3.9倍!

  [复制链接]
发表于 2020-6-26 23:44 | 显示全部楼层 |阅读模式
http://m.elecfans.com/article/1234618.html
2020年6月23日,鲲云科技在深圳举行产品发布会,发布全球首款数据流AI芯片CAISA,定位于高性能AI推理,已完成量产。鲲云通过自主研发的数据流技术在芯片实测算力上实现了技术突破,较同类产品在芯片利用率上提升了最高11.6倍。第三方测试数据显示仅用1/3的峰值算力,CAISA芯片可以实现英伟达T4最高3.91倍的实测性能鲲云科技的定制数据流技术不依靠更大的芯片面积和制程工艺,通过数据流动控制计算顺序来提升实测性能,为用户提供了更高的算力性价比。

深圳市人民政府副市长、党组成员聂新平,福田区委副书记、区长黄伟,市科技创新委员会副主任钟海、市工信局副局长徐志斌、市科协党组成员、常务委员孙楠和福田区委常委、副区长舒毓民、原政协深圳市委员会副主席、党组成员、深圳市源创力离岸创新中心理事长王学为等政府领导及山东产业技术研究院副院长雷斌,深圳市源创力离岸创新中心总裁周路明,英特尔PSG中国区总经理、销售总监Tiffany Xia夏迎丽等合作伙伴出席发布会。聂新平、舒毓民同志分别为活动致辞。中国科协党组成员、书记处书记宋军,鲲云科技联合创始人兼首席科学家、英国皇家工程院院士、美国电子电气工程师学会(IEEE)会士、英国计算机学会(BCS)会士Wayne Luk陆永青院士,浪潮信息副总裁、浪潮AI & HPC总经理刘军,清华大学信息科学技术学院副院长、电子工程系主任、深鉴科技联合创始人汪玉教授,戴尔科技集团全球资深副总裁、大中华区企业解决方案总经理曹志平,鹏城实验室高级顾问、党委书记、清华大学计算机系教授、学位委员会主席、CCF会士杨士强,Intel Tiffany Xia夏迎丽,中国信息通信研究院云大所人工智能部主任、工信部人工智能技术和应用评测实验室常务副主任、中国人工智能产业发展联盟(AIIA)总体组组长、南京新一代人工智能研究院院长孙明俊等嘉宾为鲲云成功实现全球首款数据流AI芯片量产送上了祝福和寄语。

超高芯片利用率,定制数据流芯片架构完成3.0升级
此次发布的CAISA芯片采用鲲云自研的定制数据流芯片架构CAISA 3.0,相较于上一代芯片架构,CAISA3.0在架构效率和实测性能方面有了大幅的提升,并在算子支持上更加通用,支持绝大多数神经网络模型快速实现检测、分类和语义分割部署。CAISA3.0在多引擎支持上提供了4倍更高的并行度选择,架构的可拓展性大大提高,在AI芯片内,每一个CAISA都可以同时处理AI工作负载,进一步提升了CAISA架构的性能,在峰值算力提升6倍的同时保持了高达95.4%的芯片利用率,实测性能线性提升。同时新一代CAISA架构对编译器RainBuilder的支持更加友好,软硬件协作进一步优化,在系统级别上为用户提供更好的端到端性能。



CAISA3.0架构图

CAISA3.0架构继续保持在数据流技术路线的全球领先地位,指令集架构采用冯诺依曼计算方式,通过指令执行次序控制计算顺序,并通过分离数据搬运与数据计算提供计算通用性。CAISA架构依托数据流流动次序控制计算次序,采用计算流和数据流重叠运行方式消除空闲计算单元,并采用动态配置方式保证对于人工智能算法的通用支持,突破指令集技术对于芯片算力的限制。此次升级,CAISA架构解决了数据流架构作为人工智能计算平台的三大核心挑战:

1. 高算力性价比:在保持计算正确前提下,通过不断压缩每个空闲时钟推高芯片实测性能以接近芯片物理极限,让芯片内的每个时钟、每个计算单元都在执行有效计算;

2.高架构通用性:在保证每个算法在CAISA上运行能够实现高芯片利用率的同时,CAISA3.0架构通用支持所有主流CNN算法;

3. 高软件易用性:通过专为CAISA定制的编译工具链实现算法端到端自动部署,用户无需底层数据流架构背景知识,简单两步即可实现算法迁移和部署,降低使用门槛。

具体来讲,鲲云CAISA3.0架构的三大技术突破主要通过以下的技术方式实现:

1. 高算力性价比:时钟级准确的计算

CAISA3.0架构由数据流来驱动计算过程,无指令操作,可以实现时钟级准确的计算,最大限度的减少硬件计算资源的空闲时间。CAISA3.0架构通过数据计算与数据流动的重叠,压缩计算资源的每一个空闲时钟;通过算力资源的动态平衡,消除流水线的性能瓶颈;通过数据流的时空映射,最大化复用芯片内的数据流带宽,减少对外部存储带宽的需求。上述设计使CNN算法的计算数据在CAISA3.0内可以实现不间断的持续运算,最高可实现95.4%的芯片利用率,在同等峰值算力条件下,可获得相对于GPU 3倍以上的实测算力,从而为用户提供更高的算力性价比。

2. 高架构通用性:流水线动态重组

CAISA3.0架构可以通过流水线动态重组实现对不同深度学习算法的高性能支持。通过CAISA架构层的数据流引擎、全局数据流网、全局数据流缓存,以及数据流引擎内部的人工智能算子模块、局部数据流网、局部数据流缓存的分层设计,在数据流配置器控制下,CAISA架构中的数据流连接关系和运行状态都可以被自动化动态配置,从而生成面向不同AI算法的高性能定制化流水线。在保证高性能的前提下,支持用户使用基于CAISA3.0架构的计算平台实现如目标检测、分类及语义分割等广泛的人工智能算法应用。

3. 高软件易用性:算法端到端自动化部署

专为CAISA3.0架构配备的RainBuilder编译工具链支持从算法到芯片的端到端自动化部署,用户和开发者无需了解架构的底层硬件配置,简单两步即可实现算法快速迁移和部署。RainBuilder编译器可自动提取主流AI开发框架(TensorFlow,Caffe,Pytorch,ONNX等)中开发的深度学习算法的网络结构和参数信息,并面向CAISA结构进行优化;工具链中的运行时(Runtime)和驱动(Driver)模块负责硬件管理并为用户提供标准的API接口,运行时可以基于精确的CAISA性能模型,实现算法向CAISA架构的自动化映射,同时提供可以被高级语言直接调用的API接口;最底层的驱动可以实现对用户透明的硬件控制。RainBuilder工具链使用简单,部署方便,通用性强,可以让用户快速和低成本的部署和迁移已有算法到CAISA硬件平台上。

首款量产数据流AI芯片,CAISA带来AI芯片研发新方向

作为全球首款采用数据流技术的AI芯片,CAISA搭载了四个CAISA 3.0引擎,具有超过1.6万个MAC(乘累加)单元,峰值性能可达10.9TOPs。该芯片采用28nm工艺,通过PCIe 3.0×4接口与主处理器通信,同时具有双DDR通道,可为每个CAISA引擎提供超过340Gbps的带宽。
作为一款面向边缘和云端推理的人工智能芯片,CAISA可实现最高95.4%的芯片利用率,为客户提供更高的算力性价比。CAISA芯片具有良好的通用性,可支持所有常用AI算子,通过数据流网络中算子的不同配置和组合,CAISA芯片可支持绝大多数的CNN算法。针对CAISA芯片,鲲云提供RainBuilder 3.0工具链,可实现推理模型在芯片上的端到端部署,使软件工程师可以方便的完成CAISA芯片在AI应用系统中的集成。

发布会上,鲲云科技创始人和CEO牛昕宇博士还发布了基于CAISA芯片的星空系列边缘和数据中心计算平台,X3加速卡和X9加速卡,并公布了由人工智能产业技术联盟(AIIA)测试的包括ResNet-50, YOLO v3等在内的主流深度学习网络的实测性能。

星空X3加速卡发布

星空X3加速卡是搭载单颗CAISA 芯片的数据流架构深度学习推断计算平台,为工业级半高半长单槽规格的PCIe板卡。得益于其轻量化的规格特点,X3加速卡可以与不同类型的计算机设备进行适配,包括个人电脑、工业计算机、网络视频录像机、工作站、服务器等,满足边缘和高性能场景中的AI计算需求。相较于英伟达边缘端旗舰产品Xavier,X3可实现1.48-4.12倍的实测性能提升。



*模型参考:https://github.com/pushyami/yolo ... ter/deploy.prototxt



星空X9加速卡为搭载4颗CAISA 芯片的深度学习推断板卡,峰值性能43.6TOPS,主要满足高性能场景下的AI计算需求。同英伟达旗舰产品T4相对,X9在ResNet-50, YOLO v3等模型上的芯片利用率提升2.84-11.64倍。在实测性能方面,X9在ResNet50可达5240FPS,与T4性能接近,在YOLO v3、UNet Industrial等检测分割网络,实测性能相较T4有1.83-3.91倍性能提升。在达到最优实测性能下,X9处理延时相比于T4降低1.83-32倍。实测性能以及处理延时的大幅领先,让数据流架构为AI芯片的发展提供了提升峰值性能之外的另一条技术路线。


*模型参考:https://github.com/pushyami/yolo ... ter/deploy.prototxt

深圳鲲云信息科技有限公司CEO牛昕宇个人简介

深圳鲲云信息科技有限公司创始人兼 CEO,
鲲云人工智能应用创新研究院执行院长,
全国输配电技术协作网技术专家,
深圳市人工智能行业协会专家委成员。
曾任中国航天-帝国理工中英人工智能联合实验室常务副主任、帝国理工人工智能定制计算研究组负责人。
欧盟FP7 和英国 EPSRC 等专项负责人中国电机工程学会人工智能专委会委员。
获欧盟科研影响力奖、帝国理工杰出成就奖、桑坦德银行奖,并获得FCCM、ASAP最佳论文提名2项,欧盟 HiPEAC 委员会最佳论文两项,国际核心期刊和会议论文发表 30 余篇,发明专利 7 项,国际专利1项。
荣获中国商业最具创意人物,年度商业影响力新锐人物,2018新经济年度人物,中国科学技术协会创新创业科技先锋等认可。
牛昕宇博士带领鲲云研发的高性能AI加速卡已成功应用到航天、航空、电力、智慧城市、工业等多个领域,并推出了全球首款自研定制数据流 CAISA 芯片架构和 RainBuilder 端到端自动编译工具链,为边缘和后端服务器设备提供高性能、低延时的人工智能计算加速方案。



评分

1

查看全部评分

发表于 2020-6-26 23:53 | 显示全部楼层
不懂,等吃瓜,,,
发表于 2020-6-26 23:55 | 显示全部楼层
本来还觉的很牛批,但是看到这位CEO之后我感觉是骗子??

希望是我的错觉吧!
发表于 2020-6-27 00:04 | 显示全部楼层
国内芯片厂商现在都搁着嗑ai芯片,因为柿子软好捏么
发表于 2020-6-27 00:12 | 显示全部楼层
发表于 2020-6-27 00:13 | 显示全部楼层
自古二楼出真相。动不动就超,
其实,抄都都抄不对。
发表于 2020-6-27 00:15 | 显示全部楼层
相当于什么 A卡?
发表于 2020-6-27 00:16 | 显示全部楼层
问题不在于做芯片,问题在于你在做芯片途中用来设计芯片的软件以及生产芯片的机器都是谁的,这些东西没有自己的东西早晚还是会被掐脖子。
发表于 2020-6-27 00:25 | 显示全部楼层
看后继吧,见多了麻木了......
当初为陈进站台的大佬比这一帮人的官职高多了,吹得更响亮,PPT做的也更漂亮.....
发表于 2020-6-27 00:38 | 显示全部楼层
ZhLe1991 发表于 2020-6-26 23:55
本来还觉的很牛批,但是看到这位CEO之后我感觉是骗子??

希望是我的错觉吧! ...

我也是看到照片总感觉似曾相识, 然后默默的给他P上了眼镜 ...... 感觉和王迅好像
发表于 2020-6-27 00:41 | 显示全部楼层
看了下基本面,没啥出彩的地方。
发表于 2020-6-27 00:46 | 显示全部楼层
诧音速 发表于 2020-6-27 00:25
看后继吧,见多了麻木了......
当初为陈进站台的大佬比这一帮人的官职高多了,吹得更响亮,PPT做的也更漂亮 ...

陈进不是已经被钉进耻辱柱了么?
发表于 2020-6-27 00:53 | 显示全部楼层
看这篇文给人的感觉真像骗子,但是上网查一下,又不大像。
scholar上找到的资料,陆永青这俩师徒是帝国理工学院的,之前都是研究FPGA方向,确实出过一些相关论文。17年9月创的公司,但让人疑惑的是之前几年,基本没这家公司的什么信息,也查不到CAISA1.0,2.0的信息。希望是真正的三年不鸣,一鸣惊人吧。

发表于 2020-6-27 00:55 | 显示全部楼层
LMFxLMF 发表于 2020-6-27 00:46
陈进不是已经被钉进耻辱柱了么?

你看着帮站台的官僚,有几个懂这个行业的?我严重怀疑这是陈进2.0版!
发表于 2020-6-27 00:58 | 显示全部楼层
他的1.0、2.0谁听说过?一出台就直奔3.0,串天猴啊?
发表于 2020-6-27 01:05 | 显示全部楼层
反正是怀疑态度的,骗子太多了
发表于 2020-6-27 01:19 | 显示全部楼层
且不说这是真是假,什么时候这种专用芯片秒不了老黄的gpu再出新闻吧
发表于 2020-6-27 01:27 | 显示全部楼层
本帖最后由 阿格纳斯 于 2020-6-27 01:49 编辑

个人认为国内打着AI旗号骗经费的企业和个人太多了,只能观望,不能深信,而且AI这个东西(当然,文中是用于AI推算的计算芯片,但目的终究是殊途同归的),我个人认为,拿《疑犯追踪》来做参考的话,虽然人家电视剧是有不科学的地方,但人家宅总有一段话是这样说的::“我当初创造“机器”时,没有用任何已知和已存的代码语言和操作系统,代码是我独创的,“机器”的系统是独一无二的。”
反过来看我们目前的任何代码语言或操作系统,都无法完美的表现和识别人类自然语言和思维逻辑,退一万步说,即便可以,用目前已存的代码语言来编写出一套真正的AI核心简直是工作量爆炸的工程,就是上面那个人发的,英特尔大拿教你AI创业:写代码——赚经费——招人——写代码....无限循环,所以从这点来看其实还真得就是等那天有人创造出新的语言和系统来,才能真正创造AI。(PS:我个人是AI灭世论的支持者)
而且国内的情况目前都是拿芯片说事,啊~我这边今天开发出了一款芯片,可以用于AI推算或是什么什么,性能爆炸怎样怎样,而X86级别或是ARM移动平台的民用芯片除了华为以外,好象没有看到几家企业发出什么声音!(而且华为现在也是举步维艰了)开发AI开发到最后重点开发到计算芯片上去了,这算怎么回事?虽然《疑犯追踪》这部电视剧是虚构的,但是人家的思路是我创造出了一款软件,这个软件叫“机器”,他是一款功能全面的AI,且能够在现有的硬件上运行,难道这不才是AI的核心吗?AI不就是软件吗?怎么现在对AI的研究和发展动不动全跑硬件上去了?而且既然你都有能力开发这样的芯片怎么不回过头来开发我们真正急缺的东西呢?感觉就是舍本逐末,一切为了经费而开发,真的无解了。
以上纯属个人浅见,不喜可喷!


发表于 2020-6-27 01:58 | 显示全部楼层
ZhLe1991 发表于 2020-6-26 23:55
本来还觉的很牛批,但是看到这位CEO之后我感觉是骗子??

希望是我的错觉吧! ...

同感,前面看觉得蛮有意思的,看到照片,这面相感觉有点浮且小。
发表于 2020-6-27 02:09 | 显示全部楼层
本帖最后由 eleICoto 于 2020-6-27 02:11 编辑

八成是不靠谱 你一个pcie的加速卡跑来和一个SOC比性能不丢人吗
而且AI用芯片看OPS是最没用的 得看内部微架构能否做到很高的资料复用率
发表于 2020-6-27 02:23 | 显示全部楼层
本帖最后由 Flanker 于 2020-6-27 02:24 编辑
阿格纳斯 发表于 2020-6-27 01:27
个人认为国内打着AI旗号骗经费的企业和个人太多了,只能观望,不能深信,而且AI这个东西(当然,文中是用于 ...

做个可能不太准确的类比吧,顶楼新闻里的就像是当初做专用矿机的,宣传“我们的机器挖矿(ai推理)速度吊打显卡”
发表于 2020-6-27 03:52 | 显示全部楼层
曾任中国航天-帝国理工中英人工智能联合实验室常务副主任、帝国理工人工智能定制计算研究组负责人。
欧盟FP7 和英国 EPSRC 等专项负责人中国电机工程学会人工智能专委会委员。


这种好像我玩游戏充值获得的称号一样~
发表于 2020-6-27 04:30 | 显示全部楼层
    前面看了还觉得挺有趣的,结果这CEO一出来,加上一堆称号.....确定这不是骗子?
发表于 2020-6-27 07:37 | 显示全部楼层
TIM截图20200626193315.jpg

好奇之下去搜了下他的领英,学历还挺不错的,不过英国的博士3年就能读完?另外,他是如何一边在英国当研究助理一边在深圳创业的?

中国马斯克?

评分

1

查看全部评分

发表于 2020-6-27 08:10 | 显示全部楼层
碰到这种新闻,只需要问,谁代工生产就可以了
发表于 2020-6-27 08:13 | 显示全部楼层
ZhLe1991 发表于 2020-6-26 23:55
本来还觉的很牛批,但是看到这位CEO之后我感觉是骗子??

希望是我的错觉吧! ...

同感,但愿东西是真的吧
发表于 2020-6-27 08:34 | 显示全部楼层
能少吹点牛吗。
发表于 2020-6-27 08:38 | 显示全部楼层
不怎么想评论
像是芯片和OS这类的玩意在国内造假骗国家财政支持的太多了
大多数还是不了了之,比如前几年上央视很火的cos手机系统
还是等反转吧
发表于 2020-6-27 08:40 | 显示全部楼层
总会有人信,因为韭菜怎么割它还是有的。
发表于 2020-6-27 08:41 | 显示全部楼层
上次看黑洞发布会,全球各个地点的发布会,都是一群科学家在演讲,普及知识,以及相关行业人员讲述如何发现黑洞的。
反观我国科学家欢聚一堂,握手,拍照,合影。

点评

你确定你看的是上海的那场发布会???  发表于 2020-6-29 08:25
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

小黑屋|手机版|Archiver|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806

GMT+8, 2020-7-5 13:01 , Processed in 0.014237 second(s), 21 queries , Gzip On, Redis On.

Powered by Discuz! X3.2

© 2007-2019 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表