在支持人工智能的领域扩大规模:半导体设备制造商的经验教训
  • 发布机构:麦肯锡
  • 发布人:麦肯锡
  • 发布时间:2022-04
  • 报告类型: 其他
  • 关键词:人工智能,机器学习,半导体设备
  • 起始页码:1
  • 结束页码:10
  • 页码:1-10
  • 总页数:10
  • 报告摘要:

    人工智能/机器学习(AI/ML)有可能在半导体公司运营的每一步(从研究和芯片设计到生产再到销售)产生巨大的商业价值。但我们最近对半导体设备制造商的调查显示,只有约30%的受访者表示他们已经通过AI/ML创造价值。值得注意的是,这些公司在AI/ML人才以及数据基础设施、技术和其他推动因素方面进行了大量投资,并且已经完全扩展了其初始用例。其他受访者(约70%)仍处于AI/ML试点阶段,他们的进展停滞不前。

    我们相信,未来几年人工智能/机器学习在半导体行业的应用将大幅加速。现在采取措施扩大规模将使公司能够充分利用这些技术的好处。本文重点关注设备制造商,包括集成设备制造商(IDM)、无晶圆厂供应商、代工厂和半导体组装和测试服务。

    一、人工智能在应对未来挑战中的作用

    由于其高资本要求,半导体公司在赢家通吃的环境中运营。因此,他们不断尝试缩短产品生命周期并积极追求创新,以更快地推出产品并保持竞争力。但赌注越来越高。随着每个新技术节点的出现,研究和设计投资以及生产设备的资本支出随着结构变小而急剧增加,因此费用会增加。例如,芯片开发的研究和设计成本从65纳米节点的约2800万美元增加到前沿5纳米节点的约5.4亿美元(图1)。与此同时,相同节点的晶圆厂建设成本从4亿美元增加到54亿美元。

    随着公司试图提高研究、芯片设计和制造的生产力,同时加快上市时间,AI/ML正成为整个价值链中越来越重要的工具。我们的研究表明,AI/ML现在每年为半导体公司的息税前利润贡献50亿至80亿美元(图表2)。这令人印象深刻,但它仅反映了AI/ML在行业内的全部潜力的10%左右。在接下来的两到三年内,AI/ML每年可能产生350亿至400亿美元的价值。在更长的时间范围内(未来四年或更长时间实现的收益)这个数字可能会上升到每年850亿至950亿美元之间。这一数额相当于该行业目前5000亿美元年收入的20%左右,几乎等于其2019年1100亿美元的资本支出。虽然这一价值的很大一部分将不可避免地传递给客户,但获取它的竞争优势,尤其是对于先行者而言,是不容忽视的。

    二、半导体行业中的AI/ML用例

    我们的AI/ML用例域(包含多个特定用例的领域)的综合地图涵盖了半导体设备制造商的整个价值链(图3)。用例域还可以扩展到多个价值链活动。例如,需求预测和库存优化领域与制造、采购、销售和运营计划相关。

    在整个行业范围内,制造业将从AI/ML中获得最大价值(图4)。考虑到半导体制造中涉及的资本支出、运营支出和材料成本,这并不奇怪。最大的相对支出减少将发生在研究和设计中,主要是由于芯片设计和验证的自动化。

    三、制造业中的AI/ML用例

    制造业是半导体行业最大的成本驱动因素,AI/ML用例将在这一领域提供最大的价值,约占总数的40%。它们可以降低成本、提高产量或增加晶圆厂的产量。从长远来看,我们估计它们将使制造成本(销售成本和折旧成本)降低多达17%。考虑几个例子:

    1.调整刀具参数。在定义工艺配方中的步骤时,半导体公司通常为每个步骤指定一个固定的时间范围。但是,某些单个晶圆所需的时间范围可能会出现统计或系统波动,因此工艺在产生所需结果(例如,特定蚀刻深度)后可能会继续运行。这会增加时间,浪费甚至损坏芯片。

    为了获得更高的准确性,半导体公司可以使用来自先前工艺步骤的实时工具传感器数据、计量读数和工具传感器读数,允许机器学习模型捕捉工艺时间和结果之间的非线性关系,例如蚀刻深度。收集的数据可能包括蚀刻过程中的电流、光刻中的光强度和烘烤中的温度。使用这些模型,可以在每个晶片或每个批次的基础上实施最佳工艺时间,以缩短处理时间、提高产量或两者兼而有之,从而降低销售成本并提高产量。

    2.晶片的目视检查。这一步通过在前端和后端生产过程的早期检测缺陷来帮助确保质量,在生产过程中经常进行,例如,使用相机、显微镜或扫描电子显微镜。这些图像仍然通常由操作员手动评估潜在缺陷,但是,使它们容易出错和积压并增加成本。

    由于计算机视觉深度学习的进步,现代晶圆检测系统可以通过训练自动检测并分类晶圆上的缺陷,其准确性与人工检测员相当,甚至更好。专用硬件(例如张量处理单元)和云产品可实现计算机视觉算法的自动训练。反过来,这允许更快的试验、实时推理和可扩展的部署。

    通过这种方法,公司可以及早获得有关潜在流程或工具偏差的见解,从而使他们能够更早地发现问题并提高产量,同时降低成本。

    四、研究和芯片设计中的AI/ML用例

    AI/ML用例可以帮助半导体公司在研究和芯片设计阶段优化其产品组合并提高效率。通过消除缺陷和超出公差的工艺步骤,公司可以避免耗时的迭代、加速良率提升并降低维持良率所需的成本。他们还可以自动化与物理布局设计和验证过程相关的耗时过程。

    尽管我们还没有达到可以将AI/ML加速应用于所有设计和芯片设计的所有阶段的地步,但我们没有看到它不能随着时间的推移进一步渗透的根本原因。因此,AI/ML最终可能会将当前的研发成本基础降低28%至32%,这甚至高于制造业的预期收益。

    集成电路设计中的自动化良率学习。如果在集成电路(IC)设计过程中出现失误,半导体公司必须根据制造商的反馈进行多次成本高昂且复杂的迭代。半导体公司可以通过部署ML算法来识别组件故障模式、预测新设计中可能出现的故障并提出优化布局以提高良率来避免这个问题。在此过程中,IC设计在基于AI的分析的支持下被分解为关键组件。然后,算法将这些组件结构与现有设计进行比较,以确定单个微芯片布局中的问题位置并改进设计。因此,人工智能和机器学习辅助设计可以显着降低销售成本,提高终端产量,并缩短新产品的上市时间。它还可以减少维持终端产量所需的工作量。

    此外,规划、采购、销售和定价等方面,都将从AI/ML用例中受益。通常,这些用例并非特定于半导体行业,而是部分地建立在其他行业中,因此可以更快地实施。总体而言,将AI/ML用例应用于附加功能每年可产生高达200亿美元的价值。

    五、成功大规模实施AI/ML的六个关键推动因素

    为了协助半导体公司进行AI/ML转型并大规模部署用例,我们专注于麦肯锡数字和分析转型手册中的六个推动因素:战略路线图的创建、人才战略、敏捷交付、技术、数据,以及采用和扩展(图5)。

    1.制定战略路线图

    最重要的是,扩大AI/ML工作必须成为公司的战略重点。最初的努力包括协调数据、就优先用例达成一致以及鼓励合适的业务、数据科学和工程人才之间的合作。

    理想情况下,AI/ML工作将与明确的业务目标相关联,让业务部门和业务职能部门共同关注使转型成功。例如,公司可以确定预测性维护的成本节约,并为适当的AI/ML用例提供资源。由此产生的节省将有助于支持用例并提供适当资源的功能,使其能够实现其业务目标。这些收益将给功能强大的动力来支持AI/ML的实施。设定明确的业务目标还将帮助公司衡量每个用例的收益。

    根据其既定目标,公司应确定将成为其重点的特定业务领域和价值杠杆。然后,他们可以选择允许他们应用这些杠杆的相关用例。

    在战略路线图中优先考虑用例时,公司应强调其总价值、可行性和价值实现时间。随着他们的经验和能力的增长,他们可以承担更难实施或需要更长时间才能实现的其他用例。在确定潜在用例的价值时,公司应该检查经常被忽视的杠杆,例如与缩短上市时间和提高质量相关的竞争优势。这些细节将使他们能够准确地确定计划的大小和优先级。

    在确定优先事项后,半导体公司必须为其AI/ML计划分配足够的资源,并调查与具有互补技能的第三方的支持性合作伙伴关系。潜在合作伙伴的示例包括其他半导体设备制造商、参与电子设计自动化的公司、超大规模云提供商或设备OEM。

    2.人才战略

    大多数成功实施AI/ML的公司都会创建一个集中式组织,例如卓越中心(COE),专注于此类计划。该小组是所需新人才的明确家园,负责定义通用标准并为最佳实践和知识建立中央存储库。一些领先的半导体公司已经对包含数百名工程师的AI/ML卓越中心进行了大量投资。

    在为中央团队招聘技术人员时,半导体公司应仔细平衡角色构成,以确保其具有从用例的试点到全面扩展的正确能力。例如,试点AI/ML用例需要数据科学家和数据工程师,但需要ML工程师、基础架构架构师或全栈开发人员来推动扩展。通常,半导体公司没有具备这些特征的员工,必须从外部招聘。

    集中式AI/ML功能不能与其将部署用例的业务和功能隔离开来。为了建立联系,具有业务/运营领域专业知识的人员,例如研发设计师、流程工程师和设备工程师,应包括在AI/ML功能中。这些团队成员在识别AI/ML用例方面发挥着关键作用,并且还充当组织内AI/ML解决方案的大使。

    同样,成功的公司将确保本地站点(包括晶圆厂或职能部门)向其AI/ML团队添加数据科学专业知识。经过培训成为“数据公民”的员工可以与来自AI/ML卓越中心的专家角色合作,领导跨职能团队的用例选择和支持实施。

    3.敏捷交付

    为避免AI/ML用例陷入使用或规模有限的“概念验证”螺旋中的情况,团队应专注于实现业务价值,并重点强调迭代改进。

    作为软件开发核心的敏捷方法可以帮助半导体公司实现这一目标。尽管AI/ML开发涉及大量的发现和探索,但半导体公司应该不断收到使用其模型洞察力的人的反馈。许多敏捷团队通过利用垂直条带方法取得了成功,该方法涉及创建端到端分析管道。垂直细分方法可能与许多既定做法背道而驰,因为半导体公司通常仅在完全确定这种转变将带来完美结果时才会在制造工程中进行更改。

    从运营的角度来看,敏捷团队是有益的,因为它们减少了对团队外部人员的依赖。向敏捷AI/ML交付的转变应该尽快发生,并且如果高层领导给予支持并且公司试图改变思维方式和流程,则更有可能获得牵引力。

    4.技术

    在晶圆厂内,成功的公司建立了一个连接层,用于实时访问相关数据源,包括生产和测量工具、辅助设备、设施等。工具OEM可以帮助确保这种连接性,这对于制造用例尤其重要。

    半导体公司还需要一个通用的数据集成层。在开发环境中部署分析引擎和用例之前,该层首先组合数据。为获得最佳结果,半导体公司必须找到方法将来自不同工具供应商的数据和用例结合起来,以限制复杂性并防止多个物联网堆栈并行孤岛。

    成功的公司将利用边缘计算和云计算来支持他们的AI/ML用例。由于某些工具会生成大量数据,因此实时应用程序通常需要边缘计算功能(在工具内或工具附近部署AI/ML用例)。云解决方案可提供规模经济并支持不同晶圆厂之间的链接,从而增加用例的训练数据池。(半导体公司历来对数据安全持谨慎态度,因此他们可能会将敏感数据的部署限制在本地解决方案中。)

    5.数据

    半导体公司在每个晶圆厂都有数百个工具,其中一些会生成数TB的数据,而且不可能检查每条信息。为了确保最大的有效性和效率,参与者必须优先考虑可能支持多个用例的数据,因为这将比单个计划产生更大的影响。

    即使玩家限制了分析的信息量,他们的AI/ML计划仍然需要大量的时间和资源,例如AI/ML团队中有足够数量的数据工程师。需要制定严格的数据治理政策,以确保现有数据和新生成的数据可立即使用、质量始终如一且值得信赖。成功的公司通常有一个专门的数据治理团队来确保数据的一致性以及新数据和现有数据的质量。

    6.采用和扩展

    从设计阶段开始,半导体公司应严格关注优先用例的可扩展性。必须尽早包括来自多个站点或晶圆厂的专家,以确保以后可以跨位置部署用例。一些半导体公司正在晶圆厂领域内建立焦点小组,以计划扩大规模。对于特定领域,他们选择一个晶圆厂作为主导站点,然后确定用例,从其他晶圆厂收集需求,创建实施计划,并确保知识的转移。如前所述,半导体公司将需要根据其在全面扩展后的价值来优先部署用例。

    其次,半导体公司应确保整个组织在开发和扩展用例时遵循标准和最著名的方法(BKM)。在整个组织中编纂和强制使用BKM可以确保解决方案随着时间的推移得到持续和改进,从而使机器学习能够跨站点获得最大规模。通常,中央AI/ML团队负责监督这项关键任务。

    最后,半导体公司必须将用例无缝集成到最终用户的数字化工作流程中,以确保采用。许多公司忽略了这一步,但这种疏忽会产生重大后果。在我们的调查中,近一半的半导体设备制造商表示,缺乏集成是扩展AI/ML用例的第二大问题。如果组织在AI/ML功能和业务方面之间形成紧密的联系,那么在最初设计用例时从用户的角度考虑就会容易得多。

    半导体行业正处于转折点,没有为AI/ML战略投入大量资源的公司可能会被抛在后面。尽管半导体公司可能会根据商业模式、AI/ML经验和战略重点采取不同的方法,但目标是相同的,那就是,将生产力和创新提升到新的水平。


  • 原文连接:
  • 附件下载:
    Scaling AI in the sector that enables it:Lessons for semiconductor-device makers.pdf 点击下载