|
内容超级硬核,近一年内持续分享170+篇超高质量原创干货! 深度学习与图网络 · 公众号 · · 7 月前 · |
|
|
超越Transformer和Mamba的新架构! 深度学习与图网络 · 公众号 · · 7 月前 · |
|
|
Adam有了mini版:内存占用少一半,吞吐量提升50% 深度学习与图网络 · 公众号 · · 7 月前 · |
|
|
KDD2024 | GCOPE:港科广联合港中文提出首个跨域图预训练框架 深度学习与图网络 · 公众号 · · 7 月前 · |
|
|
ICML 2024 || IR-QLoRA: 大模型量化新方法 深度学习与图网络 · 公众号 · · 7 月前 · |
|
|
2024图学习理论综述: 关注表达力、泛化性和优化等方面的理论, 涵盖273篇参考文献 深度学习与图网络 · 公众号 · · 7 月前 · |
|
|
ICML 2024 Oral || DaLore: 大模型加速优化新策略 深度学习与图网络 · 公众号 · · 7 月前 · |
|
|
MolecularGPT: 用于少样本分子性质预测的大模型 深度学习与图网络 · 公众号 · · 7 月前 · |
|
|
ICML 2024 || 黎曼预处理器增强LoRA 深度学习与图网络 · 公众号 · · 7 月前 · |
|
|
ICLR 2022 || Transformer 与 海马体神经表征 深度学习与图网络 · 公众号 · · 7 月前 · |
|
|
ICML 2024 || “星巴羊”?多解码头加速大模型推理 深度学习与图网络 · 公众号 · · 7 月前 · |
|
|
LOGS第2024/06/29期 || 复旦大学张晟中:基于结构化压缩的图对比学习训练框架(ICLR'24) 深度学习与图网络 · 公众号 · · 7 月前 · |
|
|
ICML 2024 || 多token预测的训练显著提高大模型性能和推理速度 深度学习与图网络 · 公众号 · · 7 月前 · |
|
|
GraphBridge: 通过局部文本信息和全局结构信息,引入图感知的token减少模块来解决效率和可扩展性问题! 深度学习与图网络 · 公众号 · · 7 月前 · |
|
|
ICML 2024 || LoRA+: 提升模型微调效率的秘诀 深度学习与图网络 · 公众号 · · 7 月前 · |
|
|
LOGS第2024/06/15期 || 香港科技大学(广州)高子琪:基于离散傅立叶变换的大模型高效微调 深度学习与图网络 · 公众号 · · 8 月前 · |
|
|
ICML 2024 || 大模型偏好微调:关键策略与原因解析 深度学习与图网络 · 公众号 · · 8 月前 · |
|
|
2024 || QuanTA: 一种新的高秩高效微调范式 深度学习与图网络 · 公众号 · · 8 月前 · |
|
|
图神经网络与大模型的结合可以做那些有趣的研究? 深度学习与图网络 · 公众号 · · 8 月前 · |
|
|
LLMs可以进行任务规划吗?如果不行,LLMs+GNN可以吗? 深度学习与图网络 · 公众号 · · 8 月前 · |
|