专注大数据,移动/互联网,IT科技,电子商务,数据分析/挖掘等领域的综合信息服务与分享平台。合作|约稿请加qq:365242293 |
|
数据派THU · 大语言模型的解码策略与关键优化总结 · 昨天 |
|
软件定义世界(SDX) · 腾讯:23张PPT搞懂DeepSeek核心技术! · 3 天前 |
|
天池大数据科研平台 · DeepSeek前实习生魔改MoE,用迭代机 ... · 昨天 |
|
数据派THU · 2024年十大人工智能研究论文:收获与应用 · 4 天前 |
|
数据派THU · 哪些特征导致过拟合?使用ParShap ... · 4 天前 |
|
数据派THU · 大语言模型的解码策略与关键优化总结 昨天 |
|
软件定义世界(SDX) · 腾讯:23张PPT搞懂DeepSeek核心技术! 3 天前 |
|
天池大数据科研平台 · DeepSeek前实习生魔改MoE,用迭代机制把内存需求砍了42%,团队:“免费午餐”优化方法 昨天 |
|
数据派THU · 2024年十大人工智能研究论文:收获与应用 4 天前 |
|
数据派THU · 哪些特征导致过拟合?使用ParShap 方法精准定位导致模型泛化能力下降的关键特征 4 天前 |
|
河北卫视 · 【最美全家福】待春暖花开时,吹起一股好家风! 8 年前 |
|
体育蓝皮书 · 中国国家冰球队首批名单公布 主力队员月薪达4万 7 年前 |
|
生物制药小编 · 生物医药的专利江湖之:类克 7 年前 |
|
1981外贸男装微店 · “微”B9755 17年的秋款,专柜有售! 环保胶印立体印花 毛圈棉插肩袖圆领 儿童休闲两件套套装 7 年前 |
|
接招 · 王兴的进化 7 年前 |