|
小学数学GSM8k很可能不再足以作为评估 LLM 性能的有效基准 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
全新神经网络架构KAN一夜爆火!200参数顶30万,轻松复现Nature封面AI数学研究 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
魔改Transformer!9种提速又提效的模型优化方案 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
拒稿4次,终获顶会!ICML 2024放榜:投稿量近万篇,审稿意见下滑严重? 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
重磅!视觉Mamba正式收录顶会ICML 2024! 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
国内引进的一批国际正教授几乎被“清零”!西湖大学国际正教授已超北大清华,除浙大外,大部分国内大学都接近放弃招聘国际正教授 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
Mamba360:状态空间模型研究综述 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
LLM&GNN: GPEFT: 一种基于参数高效微调(PEFT)的图表示学习方法 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
LLM&Graph || Graph Chain-of-Thought: 增强大模型在图数据上进行推理的能力 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
仅需Llama3 1/17的训练成本,Snowflake开源128x3B MoE模型 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
2024 || 一种基于结构信息论的无监督Social Bot检测框架 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
“海优最初弄出来可并不是为了给大佬弟子开后门的, 学术界现在几乎不存在任何套利空间,不要相信有什么办法可以投机取巧” 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
GraphRAG: 结合知识图谱、RAG和QFS技术,来提高模型对全局含义的理解 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
ACL 2023 || 利用预训练语言模型来推断知识图谱,并在发现的图上引入随机游走过程进行推理 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
首批中文版Llama3模型来了,解释成语、答弱智吧问题 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
图神经网络还能崛起吗?还有什么方向值得探索! 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
ICLR 2024 || 图学习领域,注意力IS OFTEN NOT ALL YOU NEED!!! 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
2024 || KTO:无须偏好数据的模型对齐 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
JCIM || 基于微环境感知图神经网络构建指导蛋白质定向进化的通用人工智能 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
ReFT: 微调表征而不是微调权重代替LoRA 深度学习与图网络 · 公众号 · · 9 月前 · |
|