目前,GPU芯片紧缺成为AI行业面临的问题,另一方面,因为传统云服务计算架构与AI计算负载的不匹配,大量GPU计算资源没有被充分利用。
为了解决这些问题,Foundry应运而生,它希望最大化AI计算能力与AI计算效用的匹配。近期,它获得了Lightspeed Venture Partners、Sequoia Capital领投,Conviction VC、 M12、NEA、Redpoint参投的8000万美元种子+A轮合并融资,投后估值达3.5亿美元。
它的天使投资人和顾问还包括:Jeff Dean(谷歌首席科学家)、Eric Schmidt(谷歌前CEO)、George Roberts(KKR联合创始人)、Paul Milgrom(诺贝尔奖得主)、Matei Zaharia(加州伯克利教授和Databricks联合创始人)、Jure Leskovec(斯坦福大学教授和图神经网络先驱)、Alexandr Wang(Scale AI的创始人)、Liam Fedus(ChatGPT创造者)Mario Gabriele(The Generalist)、David Vélez(Nubank CEO)等。
Foundry表示,其收入已超过八位数,客户包括LG、KKR、斯坦福大学、麻省理工学院、卡内基梅隆大学,以及Arc Institute、Poolside和Captions等。
如果您对人工智能的新浪潮有兴趣,有见解,有创业意愿,欢迎扫码添加“阿尔法小助理”,备注您的“姓名+职位”,与我们深度连接。
懂商业的科学家,从自身痛点出发创业
Foundry成立于2022年,它的创始人Jared Quincy Davis在创立Foundry之前,是DeepMind的研究科学家,管理着核心深度学习的50人团队,这个团队专注于ML理论和分布式系统挑战,例如把深度学习扩展并应用于如数据中心设计和打包、工业HVAC、机器人导航和控制等复杂应用问题。
他还获得了ML/STEM领域获得顶级奖项:
Open Phil AI奖学金、赫兹奖,是可扩展深度学习创新方法的先锋。
在攻读斯坦福大学计算机科学博士之前,他曾在波士顿咨询、KKR等咨询或金融机构就职;他还担任过Khosla Ventures和Sequoia Capital等风投基金的顾问与观察员。Jared既具有学术和技术背景,也懂得商业和风险投资,是典型的Alpha Founder。
Foundry的团队具有跨学科背景,其专业知识涵盖AI/ML、分布式系统设计、硬件、传统软件、产品、财务和业务。很多成员来自DeepMind、Microsoft,OpenAI和Meta的基础设施团队以及斯坦福大学未来数据系统小组。
在斯坦福大学攻读机器学习博士学位期间,Jared Quincy Davis遇到了一个问题:获取他需要训练模型的GPU计算时间非常困难。他和其他需要硬件访问的学生必须在Google表格上预订一个时间段,才能独占地使用一块硬件,然后在下一个学生的时间窗口到来之前完成使用。
当时,Jared与多位学者合作,每位学者都有自己的GPU集群,他认为,如果他能同时使用这些各不相同且分散的集群,并有效地协调计算资源和分配工作负载,就能更快地训练模型。但当时没有可行的技术方法能够做到这一点。
Jared在BCG和KKR工作时,工作内容包括数据中心项目,因此他不仅懂得AI模型训练,还理解传统云环境下分布式系统与AI所需之间的差异,以及AI计算范式在硬件方面的变化。
2022年9月,Jared创立了Foundry,获得红杉资本的种子轮融资,2个月后,OpenAI推出了ChatGPT,AI计算需求爆炸式增长。Foundry在恰当的时间进入了市场。
更符合AI计算范式,更高性价比的云平台
当前的公有云基础设施的一个主要挑战是,无论是软件还是硬件都是为web时代的应用和服务构建的,它没有很好的为AI/ML的负载进行重构和优化,它仍然是以CPU为核心组建,配套的软件堆栈也没有考虑到SLO(服务等级目标)、工作负载结构、基础设施异质性、集群多租户性、容错性和弹性,也没有很好的满足AI工作的需求(节点到节点、数据和用户本地性)。
所以现在很多AI公司自己购买GPU芯片来搭建自己的AI基础设施,这需要专门的团队和人才,他们要花时间进行能力规划,思考哪些芯片适用于哪些工作负载。
另外,由于持续的芯片短缺,企业被迫从超大规模云提供商那里预留GPU容量,有时长达数年之久,有时花费高达数亿美元。对于技术先进的AI公司来说,计算能力的成本现在是他们最大的运营开销,超过了人力资源。
Foundry意识到AI计算生态系统的瓶颈不在于供应不足,而在于利用不足。Foundry的目标是建造一种新型的公共云,通过一个协调平台,使访问AI计算资源像开灯一样简单。