专栏名称: 南亚研究通讯
从专业研究视角,紧扣时政热点,深度聚焦南亚相关问题,欢迎各位专家学者批判指正。联系ID:dwrsissi2011
目录
相关文章推荐
西安头条  ·  正式揭牌!陕西新添一家省管国企 ·  20 小时前  
西安头条  ·  正式揭牌!陕西新添一家省管国企 ·  20 小时前  
陕西高院  ·  获奖+1! ·  2 天前  
陕西高院  ·  获奖+1! ·  2 天前  
51好读  ›  专栏  ›  南亚研究通讯

重磅 | 喻琬淋:印拟研发本土大语言模型,背后还有更宏大的AI战略!

南亚研究通讯  · 公众号  ·  · 2025-02-14 22:47

正文

图片


本文共 3102
阅读预计 8 分钟


作者 | 喻琬淋
本期编辑 | 宋可馨
本期审核 | 江怡



图片

图源:Shutterstock


Deepseek自推出以来,迅速攀升至140个国家的苹果App Store下载排行榜榜首。其中,印度用户在新用户中占比最大,占所有平台下载量的15.6%。Deepseek给全球人工智能市场带来的震荡还在持续,受中国“较低成本开发”“开源”等因素激励,印度也跃跃欲试,宣布入局。 莫迪政府宣称计划在本土服务器上部署DeepSeek,并在未来10个月内开发本土大型语言模型(LLM)以媲美DeepSeek和ChatGPT, 当前已经有6家开发机构及企业在此方面取得进展。

一、本土大型语言模型的研发之争


在印政府最终公布研发LLM的路径之前,印人工智能业界曾就“是否开发本土大型语言模型”展开广泛讨论。 部分商业人士认为, 用本土语言构建大型语言模型值得称赞,但研发自身LLM将耗费大量资源,印应集中精力利用现有开源LLM数据创建并训练能应对医疗保健、教育等全球和新兴市场挑战的小型模型。而更多专家和业界人士则表示,印度投资建立本土LLM后获利良多,当前的阻碍根本不值一提。 第一, 可借机弥合沟通鸿沟。本土LLM可囊括印度多种种官方语言,实现不同语言间无缝切换,这将便利不同地区民众交流及获取资讯。 第二, 可更好服务印度特色经济、社会。本土LLM直击印度医疗保健改革、农业、教育等痛点,可为印度民众提供更个性化问题解决方案,赋权弱势群体。 第三, 可培养核心竞争力,减少外部依赖。在中美领跑的人工智能革命中,印度不甘落后,它努力保证信息安全,降低技术供应中断风险。

当前印度开发本土LLM面临两个主要挑战: 一是如何获得高质量数据集,二是如何提升算力。 印度庞大的人口规模及语言等多样性使其具备天然的数据优势,但这也为其获取标注良好、功能丰富的数据集增加了难度。可用的数据零散分布在不同机构中,且这些数据标准和形式各异,在正式启用前需投入大量收集、审查和预处理成本,这阻碍数据集间构建互操作性以及大规模解决方案。为解决该问题,印度政府牵头组建开放数据平台以供不同机构和部门访问。印度科学技术国务部长吉滕德拉·辛格(Jitendra Singh)2024年11月在印度工商联合会(ASSOCHAM)“2024年人工智能领导力会议”上宣布,印度推出首个实用型人工智能数据库,旨在为研究人员、初创企业和开发人员提供高质量、多样化数据集。2025年1月,印度人工智能数据集平台(IndiaAI Datasets Platform)正式上线,这个类似于美国协作开源论坛Hugging Face的数据集平台,将能托管不同的数据集和AI模型,为创作者们提供资源和灵感。在建立数据库、数据集平台后,也还需要制定明确的治理框架、数据标准和格式,制定数据访问相关措施以维护数据安全和隐私。当前,印度堆栈(India Stack)中的“数字赋权和保护架构”(Digital Empowerment and Protection Architecture)力求保证个人和机构以安全、标准化方式共享数据,印度电子和信息技术部(MeitY)2022年5月26日发布的《国家数据治理框架政策草案》(Draft National Data Governance Framework Policy)也旨在为安全访问政府及私企的非个人及匿名数据提供参考。

在政府统筹管理、加速数据共享的同时,企业和科研团队正探索其他数据收集方式。 印度理工学院海德拉巴分校研究团队和创建印度第一个泰卢固小型语言模型(SML)Chandamama Kathalu的“斯维查”(Swecha)相关团队表示计划以社区为单位来收集数据,目前志愿者已经成功收集多达5000万个代币(50 million tokens)数据集。

以Transformer架构为核心的LLM通常依靠重要图形处理器(GPU)来训练或部署,建立LLM对GPU的算力、显存要求高。 而印度当前已释放出“印度在GPU上取得进展”的乐观信息。 印度电子和信息技术部部长阿什维尼·维什瑙(Ashwini Vaishnaw)表示,印度政府已选定Jio Platforms、Tata Communications、Yotta等10家公司提供18693个GPU,其中15000个属功能强大的GPU包括Nvidia H100、H200等。此外,他表示,印度还正研究如何利用开源或授权产品中可获得的芯片组在此基础上构建自己的GPU,“利用这种方法印度将能在3-5年研发自己的GPU”。

怎样理解“印度效仿Deepseek的做法”这样的表态? 这表明中国开发低成本LLM给印度研发本土LLM莫大的信心。 印度电子和信息技术部部长维什瑙已表示,“美国OpenAI依靠10万块GPU、耗资1亿美元建立LLM,而中国Deepseek仅花费600万美元、使用2000块Nvidia H800GPU就建立了LLM,印度将效仿Deepseek的做法,所花费成本将是世界上最低的”。印度相信其不仅能够像中国一样冲破美国对AI硬件出口的封锁,还能够通过借鉴及工程创新减少资源投入。OpenAI目前采用的方法主要涉及需要大量GPU集群的蛮力方法,但这并不是构建人工智能技术的唯一方法。印度研究人员认为“更智能的算法可以大大减少对高计算能力的追求”。 首先, 强化学习、优化动量机制等创新正逐步减少算力需求及资源消耗。其中,自适应梯度裁剪(AGC)可稳定梯度更新并减少在杂乱数据集上训练失败的可能性,这对于处理多语言、数据质量参差的印度语料库尤其有利。 其次, 结构化修剪既可保证准确性,又可在短时间内显著减小LLM规模和计算成本,这逐渐更正人们以模型尺寸为导向的原始想法。

印度已经有印度理工学院马德拉斯分校“AI4婆罗多(AI4Bharat)”实验室研发的IndicBERT、初创公司Sarvam AI研发的Sarvam1、“泰卢固LLM实验室(Telugu LLM Labs)”研发的Navarasa 等多语言LLM,可支持十几种印度语言。这些都将为印度研发涵盖更多种语言、覆盖领域更全面的LLM提供宝贵经验。

图片

图源:“南亚评论”微信公众号


二、人工智能生态系统的未尽之路


印度理工学院马德拉斯分校人工智能中心主任巴拉拉曼·拉文德兰(Balaraman Ravindran)教授认为,印度需要更强大的人工智能研究生态系统,并激励基础研究。 “印度确实有高质量研究,但只在印度理工学院(IIT)、印度科学研究所(IISC)、印度信息技术学院(IIIT)少数几所大学开展,中国一些顶尖大学在基础研究上获得的资金远高于想象”。 此外,尽管印提供补助金、贷款、免税、专利相关的激励措施,但这些措施尚未产生如中美韩等国那样的私人研发投资水平。

2024年3月7日,印度政府斥资1337亿卢比(Rs 13,370 crore)推出“印度人工智能计划”(IndiaAI Mission),旨在建立一个全面的生态系统,通过民主化计算访问、提高数据质量、开发本土AI能力、吸引顶尖AI人才、促进行业合作、提供初创企业风险资本、确保具有社会影响力的AI项目以及推广合乎道德的AI,以促进AI创新。

此次宣告研发LLM对印度而言是构建人工智能生态系统的关键契机。 建立LLM不能只靠一些团队研发,还需要人才、资金、政策、市场等支持。印度政府完全可以以此为突破口,完善政府主导政策、法规、公共支出,企业主导关键人工智能资源,学界主导研究和创新,市场驱动研究成果商业化等的人工智能生态系统。

从2025-26财年财政预算可以发现印度的决心。 印财长尼尔玛拉·西塔拉曼 (Nirmala Sitharaman)在预算案中拨付200亿卢比(Rs 2,000 crore)推动印度人工智能计划,近总计划金额的五分之一,远高于2024-25财年批准的17.3亿卢比(Rs 173 crore)。莫迪2月4日表示,印度拥有双重“AI”:第一个AI代表“人工智能”(Artificial Intelligence),另一个代表“雄心壮志的印度”(Aspirational India),印度不仅正在适应AI,还在为更广泛的创业生态系统奠定基础。

但“罗马非一日建成”,印度在短期内无法填补人工智能制造业产业链体系薄弱环节。 硬件方面, 芯片、GPU等关键部件对于发展人工智能至关重要,印度在相关硬件研制上处于大量投资的初级阶段。 基础设施方面, 当前印度已经着手打破缺乏数据中心和大规模人工智能应用等限制,但突破深度技术需要更长融资周期,也需要更多私营企业参与。面对大量投资撤离印度市场的情况,印度想要解决资金问题变得棘手。同时,要在短期内扭转人才储备不足的现状也极为困难。虽然印度人工智能人才绝对数量在世界上位居前列,但在市场规模庞大、高质量专业人才需求巨大的背景下,印度在人工智能领域的高端和专业技术人才储备仍然相对不足,更何况此类人才从印度外流的情况也颇为严重。尽管此前不看好印度大规模人工智能的OpenAI首席执行官山姆·奥尔特曼(Sam Altman)近期向印“示好”,但“打铁还需自身硬”,印度人工智能生态系统的建构之路似乎还得走上相当长的一段时间。

本文转载自“南亚评论”微信公众号2025年2月10日文章,原标题为《 南亚热评 | 印度宣告研发LLM:一场更宏大的人工智能布局


本期编辑:宋可馨

本期审核:江怡


*前往公众号后台发送“编译”,即可查看往期编译合集



往期推荐↓

图片

▲政报·102期 | 为保2024大选,印人党打算收割这个群体的选票了.....

图片







请到「今天看啥」查看全文