专栏名称: 半导体行业联盟
半导体行业联盟(icunion)属半导体产业链俱乐部, 分享半导体行业资讯动态,半导体企业名录,半导体行业协会报告,半导体行业论坛研究报告等信息
目录
相关文章推荐
半导体行业联盟  ·  中微、新声半导体等5家半导体企业荣获中国专利 ... ·  3 天前  
半导体行业联盟  ·  昔日“彩电大王”拟收购,准IPO,宏晶微! ·  2 天前  
半导体行业联盟  ·  突发,闻泰科技,出售9家公司股权等! ·  3 天前  
半导体行业联盟  ·  余承东谈自己小时候:吃不饱穿不暖,有钱都拿去买书 ·  4 天前  
半导体行业联盟  ·  无锡经开区,集成电路产业链企业家沙龙举行 ·  6 天前  
51好读  ›  专栏  ›  半导体行业联盟

全球首个,半导体专用大模型,SemiKong 问世

半导体行业联盟  · 公众号  · 半导体  · 2024-12-29 17:07

正文


芯榜消息:SemiKong 是 Aitomatic 与 AI 联盟伙伴共同训练的大型语言模型,专为半导体行业打造。它基于 Meta 的 Llama 3.1 开发,是新兴 AI 联盟首批合作项目,意在抗衡英伟达主导地位。

其旨在加速新芯片上市、提升制造合格率,还能加快新晋工程师学习,有望改变半导体行业格局,为行业发展提供有力智能支撑。

Aitomatic 公司负责开发 SemiKong 大型语言模型(LLM)。该公司指出,半导体行业现在急需收集专家知识,原因是很多资深专家都快退休了,他们所掌握的知识也会随之带走,这就使得不少公司都陷入了专业知识严重不足的困境。而专门针对半导体行业需求设立的 LLM 课程,看起来是一种能让新工程师获取保持竞争力所需知识的可行办法。

下为芯榜(icrankcn)综合整理,仅供参考

问:请介绍一下 SemiKong,它是一款怎样的模型?
答:SemiKong 是由 Aitomatic 及其 “AI 联盟” 中的合作伙伴共同训练的新型大型语言模型(LLM),是全球首个专为满足半导体行业需求打造的 LLM,有 8B 和 70B 两个版本,基于 Meta 的 Llama 3.1 LLM 平台开发,最近发布了 700 亿参数版本。它旨在成为半导体设计公司工作流程的一部分,充当该领域的数字专家,助力新芯片更快推向市场。


问:开发 SemiKong 的背景是什么?
答:半导体行业资深专家即将退休,知识流失,许多公司面临严重专业知识缺口,迫切需要收集专家信息,而通用 AI 模型无法解决行业独特复杂性,难以满足需求,所以催生了 SemiKong。


问:SemiKong 有哪些优势?
答:在其 700 亿参数形式下,借助基于它的较小 DXA 代理,实用性远超通用 AI 模型。宣称新芯片设计上市时间可缩短 20%-30%,首次制造合格率提高 20%,还能将新晋工程师学习曲线加速高达 50%。


问:DXA 是什么,在 SemiKong 中起到什么作用?
答:DXA 即领域专家代理,是 Aitomatic 连接较小 LLM 代理与 SemiKong 70B 中央智慧集群的方式。通过训练客户公司技术库或专家工程师条目,能针对公司需求定制,训练后的 DXA 由核心 SemiKong 部署利用,可自动化开发任务或提供聊天机器人式沟通。


问:SemiKong 的开发涉及哪些合作方?
答:Aitomatic 与 Meta、AMD、IBM 等 “AI 联盟” 合作伙伴共同协作开发,这个 AI 联盟是 2023 年 12 月宣布成立的新兴联盟,成员还包括耶鲁大学、东京大学等研究机构,旨在抗衡英伟达在科技行业的主导地位。


问:有意使用 SemiKong 70B 模型的用户该如何操作?
答:用户可从其网站下载。


问:SemiKong 未来还有哪些发展方向?
答:基于提出的本体,可进一步开发除蚀刻之外的其他工艺,使半导体人工智能更全面,适用于半导体制造各阶段;其管道还能适应和扩展到其他行业,增强多部门工业运营。


问:SemiKong模型的训练数据有哪些?

:SemiKong模型的训练数据主要包括以下几类: 

1 技术书籍、论文和专利:从半导体领域的专业技术书籍、学术论文以及专利文献中收集的数据,这些数据涵盖了半导体器件和工艺的复杂物理和化学特性、芯片设计、制造工艺、封装测试、材料科学、设备工程等多方面的知识,帮助模型学习半导体行业的基础理论和前沿技术.

2、五万条问答数据:包含了50,000个与半导体领域相关的问题及对应的答案,这些问题和答案经过精心整理和标注,用于训练模型回答问题和进行推理的能力,使模型能够更好地理解和生成与半导体行业相关的自然语言文本.

3、半导体公司的技术库和专家经验:借助AI联盟中半导体公司的行业专业知识,包括其内部的技术文档、工程案例、专家的实践经验等,对模型进行训练,从而使模型能够深入了解半导体行业的实际工作流程和特定问题的解决方法,更好地适应不同公司的特定需求.