12 月 29 日消息,Aitomatic 及其“AI 联盟”(AI Alliance)合作伙伴推出了全球首个专为半导体业需求而设计的开源大型语言模型(LLM)——SemiKong,旨在成为半导体设计公司工作流程的一部分,可以充当老专家,加速新芯片的研发和上市进程。
负责开发 SemiKong 的 Aitomatic 公司指出,半导体业迫切需要收集专家信息,许多年迈的老专家陆续退休加剧了知识断层,几家公司正饱受专业知识严重不足之苦。针对产业需求量身打造的大语言模型 SemiKong 有望成为新晋工程师维持竞争力、快速获得专业知识的可靠途径。
据介绍,SemiKong 是基于 Meta 的 Llama 3.1 平台利用大量半导体行业知识训练的 700 亿参数的大模型版本。该大模型由 Aitomatic 与“AI 联盟”成员共同开发,包括 Meta、AMD 和 IBM 等科技企业以及耶鲁大学和东京大学等学术机构。其中,Aitomatic 的 DXA 系统成为 SemiKong 部署的核心构架。
DXA(领域专家代理)将较小的大语言模型与 SemiKong 70B 的核心功能整合,通过对客户公司技术库及专家工程师提供的项目进行训练,可以有效地捕获和构建了资深工程师的知识,确保关键专业知识得到保留和扩展以备将来使用,并且可根据公司需求进行调整。经过训练的 DXA 能进一步整合到核心 SemiKong 部署中,自动执行开发任务,或充当工程师与员工间的互动界面。
在目前 700 亿参数版本中,加上基于 SemiKong 的小型 DXA 使用,该大语言模型在半导体领域的应用价值已远远超越通用 AI 模型。
Aitomatic 宣称,SemiKong 在生成半导体特定内容和理解复杂过程方面的表现优于多个闭源语言模型。这带来了实实在在的好处,包括将新芯片设计的上市时间缩短 20-30%,以及将一次流片成功率提高 15-25%。这些工具还改善了新工程师的入职流程,将他们的学习曲线加快了 40-50%。例如,支持 SemiKong 的 DXA 减少了蚀刻配方所需的时间,从通常需要的数小时缩短到只要几分钟。
总结来说,通过引入 SemiKong 和 DXA,为半导体研究人员提供了一个全面的框架,可以保存知识并提高生产力和创新。这些进步可能会重塑半导体制造,提供可扩展、经济高效的解决方案来解决该领域的复杂性。集成像 SemiKong 这样的 AI 工具对于更高效、更有弹性的半导体行业至关重要。