|
ChatGPT的数据集: 训练并优化自己的ChatGPT模型 || Awesome ChatGPT Dataset!!! 深度学习与图网络 · 公众号 · · 1 年前 · |
|
|
KDD'23 Tutorial: 大规模 GNN 的过去和未来 深度学习与图网络 · 公众号 · · 1 年前 · |
|
|
650亿参数,8块RTX 3090 GPU就能全参数微调 深度学习与图网络 · 公众号 · · 1 年前 · |
|
|
小羊驼背后的英雄,伯克利开源LLM推理与服务库:GPU减半、吞吐数十倍猛增 深度学习与图网络 · 公众号 · · 1 年前 · |
|
|
基于Transformer的大模型是如何运行的?Meta从全局和上下文学习揭秘 深度学习与图网络 · 公众号 · · 1 年前 · |
|
|
NeurIPS 2022 || GraphGPS:比以前的Graph Transformer快 4倍,多达 1w 节点的批量图 深度学习与图网络 · 公众号 · · 1 年前 · |
|
|
LLM+Graph系列 || 图感知语言模型预训练框架GaLM 深度学习与图网络 · 公众号 · · 1 年前 · |
|
|
LLM+Graph系列 || PiVe:通过迭代验证提高大型语言模型的图生成能力 深度学习与图网络 · 公众号 · · 1 年前 · |
|
|
AAAI 2023 || PDFormer:基于传播延迟的动态长距离Transformer用于交通流预测 深度学习与图网络 · 公众号 · · 1 年前 · |
|
|
CVPR 2023 | 清华大学提出LiVT,用视觉Transformer学习长尾数据 深度学习与图网络 · 公众号 · · 1 年前 · |
|
|
LOGS第2023/06/17期 || 北京航空航天大学孙庆赟:图学习里的拓扑不均衡问题初探 深度学习与图网络 · 公众号 · · 1 年前 · |
|
|
将Mask AutoEncoder用在Graph Transformer进行预训练,效果怎么样? 深度学习与图网络 · 公众号 · · 1 年前 · |
|
|
ICML 2023 || EXPHORMER:用于Graph的稀疏Transformer 深度学习与图网络 · 公众号 · · 1 年前 · |
|
|
首周下载量碾压ChatGPT!谷歌20年老员工叛逃,创立第二个OpenAI? 深度学习与图网络 · 公众号 · · 1 年前 · |
|
|
OpenAI更新GPT-4等模型,新增API函数调用,价格最高降75% 深度学习与图网络 · 公众号 · · 1 年前 · |
|
|
Transformer在大型预训练语言模型的应用 深度学习与图网络 · 公众号 · · 1 年前 · |
|
|
ICML2023 || 把ViT/MLP-Mixer模型推广到Graph上,你会怎么做? 深度学习与图网络 · 公众号 · · 1 年前 · |
|
|
Transformer六周年:八位作者,人生各自精彩 深度学习与图网络 · 公众号 · · 1 年前 · |
|
|
微调LLaMA类模型的关键技术: LoRA 深度学习与图网络 · 公众号 · · 1 年前 · |
|