“云计算解放终端的思想,将改变整个产业的思维方式,因为这一思想彻底摆脱了摩尔定律的束缚!”
—— 郭涛,中国互联网协会专家委员
芯片上云的动力
目前国内半导体行业如火如荼,新的芯片设计公司如雨后春笋般出现,在这个欣欣向荣发展的背后,我们也看到了这些芯片设计公司面临的诸多问题,主要包括:
芯片设计环境启动门槛高
EDA 工具繁多,版本众多,许可昂贵
IP 市场庞大,很难找到性价比最优的 IP
Foundry 的 PDK 及服务很难获取
很难获取 EDA 工具、IP、PDK 、IT/CAD 的专业技术支持
安全、高效的 EDA 系统架构搭建困难
复杂的设计环境运维困难
项目设计的峰值资源需求
项目周期内非线性的算力需求和成本优化的需求很难兼顾
项目后期存储需求暴涨
用户申请和管理资源流程复杂
传统算力和存储资源采购和配置周期较长
机房的物理条件(电力、制冷、空间等)限制
项目多站点协同需求
快速整合分布在全球的专业人才
多站点协同研发的模式
统一、标准化的中央集成 EDA 环境
频繁的站点间数据同步
复杂的灾备策略
这些问题往往会影响芯片设计效率从而增加芯片产品上市时间,对于很多 startup 的芯片公司来说,这可能会影响整个公司的成败。因此,如何解决上面的问题,为芯片设计提供一个高效安全的设计环境成为芯片设计公司必须首先考虑的问题。
半导体行业和其他行业一样,正处在“数字化转型”的浪潮中,加之中国半导体行业所面临的历史机遇与挑战,通过“芯片设计上云”的方式,获得更多、更集中、更专业的资源和技术,降低芯片团队的起步门槛,缩短产品上市周期,加速产品迭代,从而加快中国半导体行业的追赶之路,无疑是最为有效的方式。
对传统芯片行业来说,芯片上云的步伐是缓慢的、迟疑的;虽然欧美顶级半导体公司在2016就开始做战略部署“芯片设计上云”,Cadence、Synoposys、Mentor 等 EDA 厂商也在努力推动他们的云方案,众多的芯片设计公司热情并不高涨。但是2019年开始,变化开始明显起来,越来越多的成功案例在诸多媒体中开始聚焦。例如:TSMC 2019年6月在微软的 Azure 云上在 10 小时内验证了 AMD EPYC 上的大尺寸 Radeon Instinct Vega20 集成电路设计;AMD 在微软的 Azure 云上19个小时内完成了台积电7nm工艺的大型电路的2次物理验证。Startup 的“上云”成功也在年度的DAC(Design Automation Conference,www.dac.com )大会被提及,读者可以在附录参考更多详细案例介绍。
相比较而言,国内的“芯片设计上云”还在非常初期阶段,但是越来越多的行业人士已经认识到了“芯片设计上云”是解决传统环境下诸多“病症”的最佳“良方”;是急速提高效率、解决弹性地平衡解决需求和计算资源供、资产减负、优化成本、提高公司各区域项目协同合作等行之有效的解决方案。
芯片上云
最有吸引力的几点优势
弹性算力:
无疑芯片上云的最大好处之一是在于的云的高弹性能力。我们引自 Cadence 发布的下图来阐述。
▲图二:云的高弹性能力说明
(来源:Cadence 官方发布)
大家知道,芯片客户的需求永远是动态的,而传统数据中心的提供的资源是相对固定的,预算模型不能提前精确预估研发部门高峰期所需的资源,在流片前的签核(signoff)期间的需求有时会增加一倍以上,如果要扩容,则要经过相当长的时间和流程,而导致流片时间延长;而反之在非高峰期则计算资源处于闲置状态,导致实际生产效率低下。
云全面自动化的高弹性能力不仅突破了传统机房的局限性,而且能提供丰富的、包括最新硬件配置的算例,其迭代更新的速度传统数据中心无法匹及。
下图说明,通过线下+公有云的混合云模式,当项目需求高峰期的到来的时候,线下数据中心来受制于扩容局限性的时候,通过扩展部署云弹性方案,可以轻松解决需求问题。
云的高弹性优势可以总结为:
高效的申请和管理资源流程,快速完成计算和存储资源的扩容和回收
公有云可以提供各种计算和存储资源,用户可以选择性价比最高的资源,即开即所用
公有云理论“无限”资源可以大大算短芯片设计周期
“弹性算力”快速无感的扩展计算集群,及时释放闲置资源优化成本
公有云丰富的硬件资源和服务,提供了芯片设计利用 AI 和 ML 技术的可能
芯片设计云 SaaS :
相信业界对 SaaS 已经耳熟能详了,针对芯片行业的 SaaS 其目的和明显优势在于:
提供标准管理 IT 基础架构、EDA 工具、IP、PDK 的工具
自助搭建和维护 IT 基础架构
提供标准数据结构管理工具
提供各种资源监控和调度功能,实现可视化
提供更加有弹性的收费模式,例如:按时收费
提高生产效率的高级目标就是实现服务自动化,摩尔的理念就是充分利用云的强大优势结合行业经验和专业知识逐渐打造一个从虚拟化资源池、到云管理平台、再到无缝集成的设计管理平台(CMP+DMP),从而全面实现安全设计服务自动化。
▲图六:设计管理平台(CMP+DMP)
为了便于理解,我们将 Iaas、PaaS 和 SaaS 的服务及相关平台模型和使用者的关系用下图抽象说明。
可以看到,从 Infra 的 IaaS ,到云平台的 PaaS ,再到服务级别的 SaaS ,客户会越来越轻松,效率越来越高,无需介入设计环境底层、中间层、甚至是环境的配置和维护,如网上购物,几步点击所需菜单,即可进行相关研发;从而有更多精力专注管理研发人员和企业数据来保护和维护知识产权的高度安全。
多站点协同中心
避免建设多个数据中心,实现成本优化
搭统一、高效和安全的设计环境确保各站点工程师看到的设计环境一致
减少站点间数据交换和同步,避免了数据差异造成的设计失败
简化数据灾备策略,减少重复的 IT 基础建设
结语
除了上面提到的优势之外,“芯片设计上云”提供的新的收费模式,也使得传统的 EDA 环境投资从资本性支出变为运营成本,对于很多 Startup 公司来说前期支出会大大降低,从而保证了公司资金最优化。
同时,“芯片设计上云”将会完整整合上述五大资源,这对国内 IP 和 EDA 发展来说提供了更多的发展和使用机会,对这些产品的国产化有极大的推动作用,从而加速国产半导体的生态平台基础优化。
更能增添信心的是,云厂商一直在以加速度发展云平台,通过技术不断推陈出新,其产品和服务不断丰富和成熟,安全可靠性也越来越提高和全面;EDA 和 IP 厂商也从商务和技术上努力支持向云的迁移。我们深信通过云的“所有(数据、服务)都被加密”的技术,我们芯片客户所担心的云安全的问题将不再是一个“大”问号!
当然,“芯片设计上云”在初期阶段也会存在不少挑战,我们将会在后继的文章中一一阐述。
参考文献:
《计算未来-人工智能及其社会角色》--- Harry Shum & Brad Smith
https://www.educba.com/history-of-cloud-computing
相关案例:
1. 2019年,微软& Mentor Graphics & TSMC & AMD ,在 Azure 上验证了 7nm 的芯片设计。
2. 2020年,Mentor 的 AMS 使用了 Azure 专门针对 HPC 开发的虚拟机类型 HC44rs ,每个核心有 8GB 的内存来调用,大幅度缩短 EDA 的过程,提升效率加速产品上市。
3. 2020年, Synopsys 使用 Azure 运行 IC Validator 物理验证解决方案,在不到9小时的时间内完成了对 AMD Radeon Pro VII GPU (包括超过130亿个晶体管)的验证,大幅缩短了验证时间。
4. 2020年,摩尔精英支持一家台湾设计服务公司在 Azure 上完成了全云设计项目。
5. 2020年,摩尔精英支持一家国内知名芯片设计公司在 Azure 上的部署。
*本文转自半导体行业观察,文章内容仅代表作者观点。微软科技转载仅为了传达一种观点。
扫描二维码即可领取
《面向半导体行业的微软云 Azure 》白皮书
推荐阅读
精彩活动