DPU创业,至少死掉九成?( 二 )


2013年,享誉虚拟化开源社区的极客安东尼加入了AWS,2014年,另一位令虚拟化开源玩家们仰止的大神张献涛加入阿里云 。
两位虚拟化领域的关键人物加入两大公有云公司之后,相继开始尝试用软硬件融合的方式去解决大规模云计算面临的虚拟化资源损耗、大量数据与延迟的剪刀差等问题 。
DPU的雏形,就在这些实际诉求下,孕育而出 。
它诞生于创业公司Fungible之手,成名于英伟达CEO黄仁勋之口 。
2019年,英伟达斥资69亿美元收购Mellanox,这是当时英伟达史上最大规模的收购案 。完成收购后,英伟达很快就基于Mellanox的成果,在2020年推出两款DPU 。

DPU创业,至少死掉九成?

文章插图
黄仁勋发布DPU时说,当下的数据中心是由软件定义,这使得数据中心更加灵活的同时也产生了巨大的负担,数据中心基础架构的运行消耗20%-30%的CPU核心,因此需要新的处理器——DPU 。
英伟达迅速带火的DPU概念,也成为了提供DPU的业界标杆,却没能迅速获得大量订单 。
“英伟达第一代BlueField DPU几乎没有客户,到第二代的时候,我判断应该也不太会有人会买单 。到了第三代,性能参数看起来很厉害,应该能吸引一些云厂商 。“李明说道 。
“设计一款DPU如果不懂软件和业务需求,很容易把DPU做成一个大而全的产品,但即便如此,也很难做一个通用DPU 。”
李明的经验表明,在一些极简的场景中,参数强大的DPU可以发挥作用,但云计算是一个复杂的系统,没有与软件充分融合,看起来强大的性能很难发挥出来,实际场景中的性能可能会不到宣称性能的25%,这就很难在拥有独特软硬件架构的云计算系统中大规模应用 。
多位芯片专家证实:"英伟达前两代DPU几乎不能用 。"面对这个挑战,英伟达在迭代DPU的过程中找云厂商进行了很多深入沟通 。但深入沟通也没办法完全了解云计算厂商的需求,这也导致了英伟达DPU目前还只有少量客户,没有标杆性大客户 。
在英伟达加速迭代DPU之时,AWS的Nitro系统和阿里云神龙架构进阶的产物CIPU(Cloud infrastructure Processing Units),已经在其各自的系统中展现出优势 。
DPU创业,至少死掉九成?

文章插图
但摆在以英伟达为代表的DPU提供者们面前的挑战,除了Nitro和CIPU是系统级的优化,不是单纯的硬件加速之外,还有难以破解的稳定性问题 。
DPU创业,至少死掉九成?

文章插图
李明指出,“当出现异常的时候,如果是购买的DPU,首先要排除并非软件问题,才能联系芯片提供商进一步解决问题,这不仅会拉长解决问题的周期,还可能为了解决1个问题制造出8个新问题 。另外,购买来的DPU是一个黑盒子,很难满足不断迭代的软件需求 。”
但云计算巨头与大部分公司情况并不相同 。在通信和HPC领域拥有丰富经验的边缘智芯首席架构师李甫表示:“云计算大厂IT成本占比非常高,对数据和基础设施的把控非常严格,再考虑到数据中心架构变革等因素,所以头部厂家一定会坚定地自研DPU;但大部分企业市场,IT建设成本不到公司支出10%,对基础设施需求更多的转向软件定义和稳定性,交付趋于一体化交付,所以企业市场将是DPU和数据芯片的一个核心机会 。“
“博通收购VMware就是为了进一步加强该领域的领先优势 。接着可能就是HCI公司对DPU公司的收购 。”李甫判断 。
投资人艾伦说,“我们投资DPU公司时还没有DPU的概念,但我们判断数据中心的流量越来越大,需要智能网卡缓解数据中心的压力,再加上看好创始团队,没有犹豫就进行了投资 。”