|
Llama 3每秒输出800个token逼宫openAI!下周奥特曼生日或放出GPT-5? 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
2024 || 将任何Decoder-only的大模型(LLM)转换为文本Embedding编码器 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
融合RL与LLM思想,探寻世界模型以迈向AGI「中·下篇」 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
Llama 3才刚刚发布没几小时,就破纪录地登顶了Hugging Face排行榜 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
总结!大模型微调(Tuning)的常见方法 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
NeurIPS 2024还有一个月截稿?有哪些值得关注的研究方向? 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
2024 || 状态空间模型(State Space Model, SSM)的综述论文 深度学习与图网络 · 公众号 · · 9 月前 · |
|
|
AAAI24 | 关于曲率多样性的探索和研究——结合motif的多曲率图卷积网络 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
2024 图神经网络+LLM有什么值得探索的方向? 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
多篇顶会一作却申博失败?斯坦福博士生亲述:AI领域太卷 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
炸裂!最新CVPR2024、ACL2024、AAAI2024、ICML2023论文+Code大合集! 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
一文解析大模型算法知识体系:LoRA、QLoRA、RLHF,PPO,DPO,Flash Attention及增量学习 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
LOGS四月特辑:Let's Talk In AI 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
谷歌更新Transformer架构,更节省计算资源!50%性能提升 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
网友讨论:博士的年薪一般是多少万?“我哥们,某部委公务员,一个月7k”,“证券行业,税前120+” 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
ICLR 2024 || VCR-Graphormer:通过虚拟连接的小批量图形转换器 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
重新聚焦Attention在微调大模型中的重要性 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
CVPR2024满分论文出炉!这些方向爆火! 深度学习与图网络 · 公众号 · · 10 月前 · |
|
|
吵翻!导师确认录取后被学生「删除拉黑」,导学双方“互放鸽子”太伤了.. 深度学习与图网络 · 公众号 · · 10 月前 · |
|