什么是AI芯片
AI芯片分为训练和推理芯片
- 训练:就是给模型投喂大量的数据,让他不断学习,不断优化,形成一个更完善的模型,训练更考验计算性能。
- 推理:就是用已经优化好的模型,进行推理运算。推理对计算性能的要求相对较低,更看重能耗,延时,成本等指标。
下图是AI模型训练与推理示意图:
2023年英伟达 GTC
2023年英伟达 GTC提到了如下更新。
训练芯片:H100
H100主要用于模型训练领域,相比之前的A100,训练速度提升了10倍。
目前全球最先进的计算芯片,就是英伟达的A100和H100,以及AMD的MI250,这些芯片主打高端和高性能。英伟达目前在游戏领域最高端的显卡是4090,A100的性能要比4090要强,而现在要出的H100,比A100还要强十倍。
推理芯片:L4和L40
L4和L40是最新的推理芯片,其中L40的推理能力也是之前版本的10倍。国内的寒武纪就是做这个训练和推理芯片的。
DGX超级计算机
DGX超级计算机的初始形态就是H100芯片。8个H100芯片组成一个巨型GPU。数台巨型GPU组装成一个超级计算机组。DGX超级计算机主要是用于服务器,满足云计算的需求。
云服务 – AI模型代工厂
英伟达还推出了云服务,相当于英伟达从卖产品的公司转型为卖服务的公司。
其中DGX云服务就是运用DGX超级计算机进行云计算,客户只要花一些钱就能享受已经搭建好的服务器,这些服务器有专人维护,并且只要在网站上点一下就能调整服务器使用量,非常的灵活便捷。
AI云服务比较新颖,是客户通过付费的形势进行一些特有模型训练,这个过程中,英伟达可以辅导/帮助你用自己公司的数据,训练出自己的专有模型,相当于英伟达扮演AI模型代工厂的角色。