|
2024 图神经网络+LLM有什么值得探索的方向? 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
Mamba架构第一次做大!混合Transformer,打败Transformer 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
港科大(广州)开源智慧交通新成果,用AI大模型控制红绿灯 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
2024 || Call Me When Necessary:大模型在结构化环境中(KG+Table)的推理 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
2024 图神经网络+LLM有什么值得探索的方向? 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
研究生一周5次组会,资本家看了都流泪... 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
2024 || 探索大型语言模型在图生成中的潜力 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
我们还需要Transformer中的注意力吗? 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
我们真的需要把训练集的损失降到零吗? 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
一个收入被严重低估的方向,96w稳了!! 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
Kimi连续宕机打醒巨头!阿里通义千问1000万字,不用等,当场就开始 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
大模型提示学习样本量有玄机,自适应调节方法好 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
一文详解深度学习模型推理加速方法(文心大模型方向) 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
LOGS第2024/03/23期 ||中国科学技术大学 王泓:利用Krylov recycling算法加速PDE数据集生成 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
比惨现场:博士读着读着导师变后妈,毕业还延期了…还有更离谱的吗? 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
“语言模型就是一个压缩器”, 没有思考过 Embedding,不足以谈 AI 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
ChatGPT参数规模被扒:只有7B 深度学习与图网络 · 公众号 · · 11 月前 · |
|
|
LLaMA-2-7B数学能力上限已达97.7%?Xwin-Math利用合成数据解锁潜力 深度学习与图网络 · 公众号 · · 11 月前 · |
|
|
EMNLP2023 || 从向量中恢复原始的文本: 模型甚至能够从临床记录数据集中恢复个人信息 深度学习与图网络 · 公众号 · · 11 月前 · |
|
|
通用图基座模型OpenGraph,从LLM中蒸馏零样本图泛化能力 深度学习与图网络 · 公众号 · · 11 月前 · |
|