专栏名称: 科学未来人
科学科普博主 2023微博年度新知博主 韩非,博士,助理研究员,医疗社会史博士后,科技战略与政策、科技外交、毒品与生物安全青年研究员,科普作者,连续4年十大影响力科普大V/新知博主
目录
相关文章推荐
史事挖掘机  ·  伊朗往事:伊朗民众的“怒吼”,巴列维王朝倒台 ·  21 小时前  
重庆之声  ·  今天,送别黄旭华院士! ·  昨天  
重庆之声  ·  今天,送别黄旭华院士! ·  昨天  
上下五千年故事  ·  新鲜!艾灸做成了液体!轻轻一抹,无烟无火,逼 ... ·  2 天前  
鱼羊史记  ·  和生理性喜欢的人在一起,才会有的6个感觉 ·  2 天前  
51好读  ›  专栏  ›  科学未来人

真正的我劝天公重抖擞,不拘一格降人才,然后社会体制能不拘一格用人-20250129081408

科学未来人  · 微博  ·  · 2025-01-29 08:14

正文

2025-01-29 08:14

真正的我劝天公重抖擞,不拘一格降人才,然后社会体制能不拘一格用人才!// @万策尽矣 :居然还集体看甄嬛传
#谷爱凌祝大家蛇年快乐# 谷爱凌和Deepseek的巨大成功,让我们发现优秀的中国人、海外华人都在中国工作多么强大。图1:这个西北大学博士生在Deepseek短暂实习工作过,他的感触就是这样。

“那里的文化,一个真正创新蓬勃发展的空间”,

“1. 善待人才 - 招聘团队从中国和全球寻找顶尖人才。许多是来自中国排名前 10 的大学的博士/研究生/本科生,例如清华大学/北京大学。
- 招聘是极简主义的: 我的面试只进行了几轮。他们基本上检查两个标准:你真的想推动基本的 AI 问题向前发展吗?你能做到吗(至少一项出色的技能 + 完成工作的扎实技能)?
- 角色似乎是围绕人才塑造的,而不是相反。不是“我们需要一个角色,所以我们找到一个人才”,他们基本上会问:“这是一个杰出的人才;他们怎么能做出贡献呢?这可能会导致一些非常规的事情:他们可以聘请具有 MBTI 专业知识的人,最终专注于创建更加个性化/角色扮演的模型。

- 基本福利: 中国的顶级福利,包括实习生,使他们能够专注于工作事务,减少对物质问题的担忧。

2. 个性化的人力资源文化 - 在上述人才优先的招聘后勤工作中,即使规模只有 200 人,我仍然觉得每个人都是独一无二的,没有像齿轮机一样可以被替换的标准化。
- 没有压力或强制性的 KPI。我几乎没有从我的导师/前辈/同事那里感受到“这必须在本周四之前完成”的任何意义。
- 合作。DeepSeek 尽力禁止公司内部的种族行为。这就像每个人都用自己的想法为最终模型做出贡献,每个人都希望他们的想法有用。如果一个想法被证明是有用的,每个人都会庆祝,每个人都会为此感到高兴。

3. 兼容的开发系统 - Deepseek 涵盖了高度多样化的人才方向。这就像他们的 MoE 模型中的“专家专业化”是如何发生的。人们专注于他们最擅长的事情,根据他们的专业知识向别人询问事情是很自然的。用自己的专业知识帮助他人并不是人们只有在完成自己的工作后才会做的事情。
- 有一个共享的基本管道,对每个人都很好用。当一个小组向系统添加新内容时,他们会做非常好的文档,这样其他人就可以知道一分钟内发生了什么,以及它如何影响他们自己的角色(大多数时候,这不会影响他们的工作;他们只是觉得事情会自动改善)。 - 反馈循环是快速的:验证想法是否可行,基本上就是测试它是否可以在超级最新的简化基线上工作。我强烈感觉到,每当我早上有一个想法时,我就能意识到它在下午是否有效——没有组织批准,没有硬性 GPU 使用限制,很少调试(多亏了严格调试的基线),只需尝试将我自己的想法无缝添加到模型中。这使得在想法开始时在那里工作具有超级反射性和丰富的反馈,即使以后需要多次消融才能最终将想法合并到巨型模型中。 因此,以上所有内容使该组织超级 Spontaneous-person-friendly,也许这就是为什么即使每个模型发布中都应用了许多改进/想法,您也可以始终信任他们的技术路径。我非常欣赏这种解开的组织方式,它可以在模型中的不同角度进行快速而扎实的迭代。






请到「今天看啥」查看全文