7月20日,有着“AI芯片第一股”之称的中科寒武纪科技(以下简称“寒武纪”)正式登陆科创盘。从股票发行至今的数据来看,寒武纪在股市的表现相当亮眼,至7月22日收盘,市值已经达到1124.28亿元。相比257.62亿元的发行市值,寒武纪的市值在三天时间里增长了336%。近年来,我国AI芯片市场加速成长,赛迪顾问预测,2019—2021年,我国AI芯片市场规模将保持50%以上的增速,到2021年将达到305.7亿元。但是,当前AI芯片处于产业化早期,企业大多面临盈利难的问题,如何加快技术成果转化,仍然是AI芯片企业面临的关键课题。
“AI芯片第一股”备受期待
市值的大小、股价的高低,在一定程度上反映出资本市场对上市企业及其所在产业发展水平和未来前景的判断。芯谋研究首席分析师顾文军向《中国电子报》记者表示,寒武纪在股市的活跃表现,一方面是因为科创板正处于被资本高度关注的时刻,资金流动较为活跃;另一方面,寒武纪的主营业务是AI芯片,目前来看,AI芯片的前景被各方看好,是资本市场非常注重的方向。
从诞生之初,寒武纪就备受各方期待。2017年,寒武纪科技完成1亿美元A轮融资,估值达到10亿美元,成为AI芯片领域首个“独角兽企业”。同年,华为推出的全球首款内置独立NPU麒麟970搭载寒武纪1A模块,寒武纪一战成名,打响了市场知名度。目前,寒武纪形成了面向云、边、端的系列化智能芯片产品和平台化基础系统软件。其智能终端IP模块已集成于超过1亿台智能手机及其他智能终端设备中,面向云端、边缘端的思元系列产品也已应用于浪潮、联想等多家服务器厂商的产品中。
半导体属于资金、技术、人才密集型产业。研发资金、专利技术和人才储备,通常是市场衡量半导体企业实力的关键因素。研发投入方面,在2017、2018、2019三个年度,寒武纪研发投入占营业收入的比例分别为380.73%、205.18%、122.32%,三年累计研发投入8.13亿元。专利技术方面,寒武纪主要面向智能芯片及相关领域进行布局,截至2020年2月29日,已获授权的境内外专利达65项,PCT专利申请120项。人才储备方面,截至2019年年底,寒武纪研发人员占总体员工人数的79.25%,硕士及以上学历的员工占比超过63%。
赛迪智库集成电路企业战略研究室副主任葛婕向《中国电子报》记者指出,寒武纪通过与华为手机AI芯片的合作,打开了市场知名度。相对目前国内其他AI芯片公司,寒武纪已经有落地应用的场景和实例,得到了部分用户的认可。同时,创始人陈云霁、陈天石出身中科大“天才少年班”的履历光环,也增强了资本市场对公司后续发展的信心。不过寒武纪目前仍处于亏损状态,需要更充足的应用落地和客户来支撑公司的良性发展。
寒武纪本次募集资金的主要用途是云端和边缘端智能芯片的研发,投入方向与公司目前的业务转型方向相符。2018年起,华为海思选择自行研发智能芯片,不再使用寒武纪的IP,导致寒武纪终端智能处理器IP业务营收骤减,云端智能芯片及加速卡转而成为营收最高的业务。寒武纪通过发行股票募集的资金,将用于新一代云端训练芯片及系统、云端推理芯片及系统、边缘端AI芯片及系统3个项目。寒武纪表示,云端智能芯片的升级换代将有利于公司更好地为云计算时代提供高性能、高安全的服务器加速芯片及其平台产品;边缘端芯片的研发项目将完善公司云边端一体化的发展战略,弥补市场上边缘加速方案的空白,为公司储备新的业务增长点。
国内外企业抢滩AI芯片
有别于CPU、GPU、FPGA、DSP等通用芯片,AI芯片通常指专门针对AI领域设计的芯片。葛婕表示,AI芯片通常指针对特定应用需求而专门设计,可扩展性不及GPU等通用芯片,但在性能、面积、功耗上一般可以进行针对性的优化,算法更加高效,对互联网公司等某些需求可以实现定制化加速。
目前,AI芯片已成为国内外科技巨头的抢滩之地。集邦咨询(TrendForce)分析师姚嘉洋向《中国电子报》记者表示,AI芯片的发展,会面临不同精度运算的工作负载,对FP32(单精度)、FP16(半精度)以及INT8(8位定点运算)与INT4(4位定点运算)的支持已经是AI芯片的必备条件。同时,AI芯片的竞争指标还包括AI运算效能的展现、功耗的多少以及芯片本身的面积与成本等。发展趋势方面,除了运算架构仍要持续优化外,采用先进制程也是助力AI芯片整体表现的关键要素。此外,若投入加速卡产品的发展,存储器的搭配与选用也是关键。
谷歌的TPU是AI芯片的代表作。TPU是为谷歌Tensorflow深度学习框架打造的AI芯片,通过谷歌云平台开放给客户使用,目前云TPU 3.0版本算力达到420TFLOPS,基于云TPU集群打造的TPU Pod可提供每秒超过100千万亿次浮点运算。天风证券分析师指出,谷歌将TPU开放给客户是为了提供差异化的云计算服务,提升谷歌云的机器学习服务的易用性。通过Cloud TPU和TensorFlow的软硬结合,以及TPU Pod的加持,可进一步激活中小企业以及科研单位的云计算需求,构建差异化竞争优势。
长期占据云服务头把交椅的亚马逊也不甘示弱,推出了高性能机器学习加速芯片Inferentia,能够提供128TFLOPS的算力,并支持INT8和BF16(混合精度)/FP16计算类型。移动通信芯片龙头高通推出了面向边缘侧的专用AI芯片Cloud 100,采用7nm制程,运算速度超过100TFLOPS。
我国企业也在AI芯片积极布局,并在部分算力参数上接近甚至领先国际一流水平。
寒武纪于2018年推出了中国首款高峰值云端智能芯片思元100,2019年推出了第二代产品思元270,均采用台积电16nm制程。思元270理论峰值性能达到256TFLOPS(INT4)、128TFLOPS(INT8)、64TFLOPS(INT16)。从招股书披露的信息来看,寒武纪下一代云端智能芯片思元290采用了台积电7nm制程,已处于内测阶段。
姚嘉洋表示,在2019年,思元270相关产品线便已经支持INT4规格。在2018年下半年左右,英伟达的Turing架构确定支持INT4。以整体AI芯片市场来看,寒武纪在这方面的布署可谓超前。
华为、阿里巴巴的AI处理器,也在衡量AI计算能力的ResNet-50模型训练中有着可圈可点的表现。华为的昇腾910 AI处理器在INT8下的性能达到512TFLOPS,FP16下的性能达到256TFLOPS。在ResNet-50模型训练中,由1024颗昇腾910组成的AI训练集群Atlas900,只用了59.8秒就完成了训练,比原先的世界纪录快了10秒。阿里巴巴的NPU AI芯片含光800采用12nm工艺,支持INT8/INT16量化加速,以及FP16/BFP16向量计算。据阿里达摩院院长张建锋介绍,在ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍。
此外,腾讯领投的AI芯片企业燧原科技推出了面向云端的云燧系列;地平线推出了面向自动驾驶的征程系列和面向智能摄像头的旭日系列处理器。同时,越来越多的初创企业进军智能语音等特定AI场景的芯片研发,我国AI芯片初步呈现出多点开花的发展态势。
如何推动商业落地,仍是关键问题
虽然社会各界高度关注AI芯片的发展,但盈利难仍然是AI企业普遍面临的难题。招股书披露,寒武纪2017、2018和2019年度,公司净利润分别为-38070万元、-4104万元和-117912万元,仍处于亏损状态。如何推动技术成果转化,实现商业模式落地,是考验AI企业生存能力的关键课题。
葛婕表示,AI芯片需要与算法和特定应用场景深度结合,针对语音识别、计算机视觉、机器学习等不同的算法,均需要专用芯片进行适配以实现相应功能,同时随着算法的迭代进化,需要芯片同步优化以发挥算法的最佳性能。目前较大的市场包括云端服务器、智能驾驶、安防等,但是市场还没有完全放量,无法支撑企业的盈利表现。
顾文军指出,国内AI的研发投入是分散式的,集中在单一应用,面临着投入高市场小的问题。形成平台化的服务能力,走产品化路线,是AI企业提升营收能力的关键。
“我国AI企业在算法和IP上投入了很多精力,但是靠算法和IP还是很难盈利的,还是要把芯片做出来,走产品化路线,进而和终端应用等下游需求结合起来。”顾文军说。
随着5G、物联网时代来临,下游应用场景对AI的需求将进一步释放,为AI芯片企业带来更多成长机遇。同时,更加细分的应用市场,也对AI企业能否紧跟市场形势,借助场景实现规模化发展提出要求。
燧原科技CEO赵立东表示,与国外大厂相比,国内AI芯片企业与本土客户和应用开发商接触更多,紧跟国内AI应用变化趋势,反应更及时。同时,要吸纳高端人才,开发高端芯片。
集邦咨询分析师姚嘉洋向记者表示,中国众多互联网企业或是网络服务从业者越来越倾向于通过AI助力自身服务。本土AI芯片公司能更快根据当地客户的需求做出反应,这是一种“地利”优势。现在需要关注的是,如何