面对芯片封锁应该怎么办

原创 2019-10-11 话题分类:AI
摘要: 第一颗自研芯片——含光800,号称全球最高性能AI推理芯片正式问世!

9月25日,阿里巴巴在全球互联网行业释放了一颗核弹惊醒了世界,这颗核弹就是阿里巴巴旗下平头哥半导体公司的第一颗自研芯片——含光800,号称全球最高性能AI推理芯片正式问世!


得“算力”者得天下

提到芯片,大家几乎都把希望寄托在华为身上,没想到阿里抢先一步,很多网友表示没想到这一刻来得如此之快,阿里在芯片领域除了有惊人的发展速度外,处理能力也愈加丰富,真的是令人意外!

淘宝芯片疾走先得,7月25日发布“玄铁”,接着8月29日发布“无剑”;紧接着9月25日发布“含光”。回顾去年的云栖大会,阿里巴巴旗下“平头哥半导体有限公司”亮相的场景仿佛还在昨天,仅仅一年多的时间里,平头哥凭借着一股狠劲,在最近90天内接连发布了3款芯片系列产品,真是正如“平头哥”这个名字——“人狠话不多”、“生死看淡,不服就干”。

平头哥不服就干是因为手里有牌,底气十足。什么牌?“算力”之牌。

关注芯片的朋友都知道,传统芯片之所以难制造是因为受限于摩尔定律,简单的说就是当价格不变时,集成电路面积有限,可容纳的元器件的数目几乎每隔18——24个月便会增加1倍,性能也将提升1倍。难就难在如何在相同的面积内放入更多的元器件,超越莫定律?这对于制作工艺而言难度可想而知,所以这一工艺的提升速度是非常缓慢而且相当费劲。

与此同时,随着人工智能的逐步发展,面对海量数据的实时采集和处理,“算力”成为了一项至关重要的必备条件,可谓得“算力”者得天下。然而,当前的人工智能算法训练、推理等,还是依赖于高通、英伟达等提供的传统芯片。可问题就在于,无论是高通骁龙还是英伟达GPU等传统芯片,其当初被研发出来的目的并不是针对人工智能的算法,说白了,这些芯片在人工智能的算法加速方面,是“心有余而力不足”的。目前,它们所做的基本就是在自己原有产品上加上人工智能算法,经过包装升级后化身为“通用AI芯片”。但本质上,它们仍然是“传统芯片”的DNA。


平头哥的“算力”法则

平头哥的算力从哪里来?从淘宝海量的业务数据所锻造的能力中来。

类似于淘宝的花名文化,每个名字都是深刻的寓意。提到算力,单从名字就很明显。“含光”是《列子·汤问》篇“上古三剑”中的一个名词,比喻光而不耀,含而不露,用它来形象的说明含光800爆炸的算力。

含光800爆炸的算力其实得益于阿里巴巴多年来的数据处理能力,这个数据有多少?根据阿里云副总裁、产品与解决方案管理部总经理马劲介绍,阿里巴巴的AI每天要调用1万亿次,每天要处理超过10亿张图像、120万小时的视频、55万小时的语音、5千亿句的自然语言。阿里把文字的算法、语音的算法、视频的算法、分析的算法、自动驾驶的算法训练出来,变成原子化的服务,便可以在产业实践当中快速组合成新的应用。在产业应用方面,达摩院一手强化阿里巴巴自身的应用场景,另一手紧握行业客户,创造新能力,解决新问题。与此同时,阿里内部和外部的产业之间,都致力于相互交织融合,形成合力推动人工智能迅速落地。阿里依靠服务全球10亿用户所积累下来的大数据,不知不觉中一步一步成为了最大的AI企业,凸显着阿里日新月异的蝶变。

有了“算法”这张牌,阿里巴巴研发芯片便与其他公司走的路就不同了。如果阿里思维仅仅停留在传统的CPU和GPU上追赶芯片厂商,那么阿里一时半会很难追赶上。

然而人工智能时代给了阿里进军芯片领域一个“芯”的机遇,就像当年PC时代成就了英特尔,移动互联网时代成就了苹果和高通。人工智能时代需要全新的架构和硬件——软硬一体、高度垂直。说白了,阿里的芯片就是专注于自身业务最优化,这却跟国家安全和芯片关键领域自主可控关系并不大。

举个例子,华为的人工智能芯片更多的是用于摄像头拍出更好的图片,华为海斯芯片让美国感到压力山大,很重要的一点就是全球约60%的摄像头芯片是由华为制造。这些相机中的海斯处理器是由华为独立研发的,是目前所有相机中最好的芯片。目前,华为海斯在摄像头领域独树一帜,还没有其他芯片在这个方向能够超过华为海斯的性能。苹果的人工智能是为了更好的图像处理,刚刚发布的苹果A13芯片在图像处理器以及用于机器智能功能的八核神经引擎,每秒能够运行5万亿次操作,并且A13 Bionic的NPU还支持iPhone 11 Pro的Deep Fusion图像处理,并使用AI改善了暗光的摄影。Google的TPU是为了配合其神经网络算法平台,能提升神经网路运算效能达10倍。而阿里做芯片,是服务自己客制化场景业务,而不是致力于突破芯片的7nm 、5nm等尖端技术。

阿里有算法和实际场景的支持,这对阿里在芯片战场上优势重重,就是通过与现有的场景、业务和算法相结合。比如电商搜索推荐、新零售、视频、图像分析、阿里云等众多业务场景。这就避免了其他公司做芯片没有经历过市场的考验的情况,一两年时间,就倒下了。

天下武功,唯快不破。正如张剑锋所言,含光800的诞生可谓“互联网速度”。他表示,含光800芯片的研发并非从“0”开始,依托阿里达摩院的算法以及阿团硬件基础设施多年技术,通过这两个有力因素重构了含光800芯片的软硬件技术栈。有了王牌,平头哥才能“不服就干”,7个月完成前端设计,随后仅3个月就成功流片,用最短的时间完成了芯片的设计、流片的整个过程。

其实,提到含光800流片时间的问题,还涉及到一个关键细节,那就是台积电。

这款含光800芯片采用当前业界最先进的台积电7nm工艺制造。鲜为人知的是,台积电7nm产能已经满载,满载到什么程度?新订单交付期从之前2个月延长到6个月。这么紧张供货的情况下,平头哥是怎样拿到产能的呢?

原来,在含光800成功取得产能过程中,台积电投资的特殊应用IC业者“创意”成了关键的一个环节。平头哥高层曾赴台访问“创意”公司,通过努力,由平头哥采用“创意”的硅智材(IP),进一步卡位台积电产能,这才让含光800芯片迅速问世。“创意”是台积电在硅智材方面的重要投资,与台积电关系很好,通过“创意”的平台,能更快进入台积电晶圆厂生产。在缺乏IC设计人才及硅智材的情况下,与“创意”公司合作也是此次阿里芯片能够抢先问世的环节之一。


号称全球最高性能AI推理芯片,算力到底有多强?

含光800主要用于云端视觉处理场景,并且已经开始服务于阿里巴巴内部核心业务中。关于算力的问题,根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms ,换算一下可以得出:1颗含光800的算力相当于10颗GPU。形象地说,拿拍立淘(手机淘宝的图片搜索功能,可实现拍照购物)功能来说,商品库每天新增10亿商品图像,使用传统的GPU算力识别需要1个小时,而含光800只需要5分钟就搞定,工作效率太快了。并且,根据阿里测试,含光800在业界标准的ResNet-50测试中其推理性能的算力达到78563IPS,比目前业界最好的人工智能芯片性能高4倍;能效比500IPS/W,是第二名的3.3倍,完胜行业其他芯片。

算力这么强,会不会很贵?提到含光800的性价比,就让大家想起张建锋一年前的承诺。一年前,张建锋在介绍达摩院一年来的成绩表示,达摩院已经开发两类芯片,一是嵌入式神经网络处理器(NPU)芯片,该芯片的性价比将是同类产品的40倍,此款芯片将在明年4月份流片。现在看来,就是现在的含光800, 性能是应用最广的英伟达P4芯片的46倍,“40倍于同类”目标已经实现。另一类是嵌入式芯片,当时张建锋介绍说达摩院还将建立量子实验室,未来2-3年内将开发一款量子芯片,让我们明年拭目以待。

本文为“知顿(http://www.qingfengm.com)”的原创稿件, 作者:青峰君, 责编:青青, 欢迎转载,转载请注明原文出处。如有疑问,请您联系我们。

0
好文章,需要你的鼓励
知顿slogan
参与评论
请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。
最新评论