|
NeurIPS2024 | OCR-Omni来了,字节&华师提出统一的多模态文字理解与生成大模型 AI算法与图像处理 · 公众号 · 科技自媒体 · 4 月前 · |
|
|
25家互联网大厂,历年薪资变化 AI算法与图像处理 · 公众号 · · 4 月前 · |
|
|
MOD-YOLO:裂缝检测新突破!全局感受野,让裂缝无处遁形! AI算法与图像处理 · 公众号 · · 4 月前 · |
|
|
Animate-X,拟人角色跳舞!游戏制作新革命! AI算法与图像处理 · 公众号 · · 4 月前 · |
|
|
智源 Emu3 证明多模态模型新范式:只需基于下一个 token 预测 AI算法与图像处理 · 公众号 · · 4 月前 · |
|
|
为什么要做特征的归一化/标准化? AI算法与图像处理 · 公众号 · · 4 月前 · |
|
|
语义分割25种损失函数综述和展望 AI算法与图像处理 · 公众号 · · 4 月前 · |
|
|
新晋诺奖得主致谢自己的研究生:“活都是他们干的” AI算法与图像处理 · 公众号 · · 4 月前 · |
|
|
美团不同职级 薪资待遇一览表。。。看傻眼了 AI算法与图像处理 · 公众号 · · 4 月前 · |
|
|
使用Yolov10和Ollama(Llama 3)增强OCR AI算法与图像处理 · 公众号 · · 4 月前 · |
|
|
[ACM MM2024] CREAM: 文档 VQA 的粗到细检索和多模态高效调整 AI算法与图像处理 · 公众号 · · 4 月前 · |
|
|
Apple提出MM1.5:多模态大型语言模型微调的方法、分析和见解 AI算法与图像处理 · 公众号 · · 4 月前 · |
|
|
视觉算法工程师就业,Kaggle金牌和CCF A一作哪个更有用? AI算法与图像处理 · 公众号 · · 4 月前 · |
|
|
DPO的局限性讨论:理论和实践 AI算法与图像处理 · 公众号 · · 4 月前 · |
|
|
[通用的视觉Backbone] TransXNet: 全局动态性+局部动态性=性能强大,代码已开源! AI算法与图像处理 · 公众号 · · 4 月前 · |
|
|
统一的多模态文字理解与生成大模型 AI算法与图像处理 · 公众号 · · 4 月前 · |
|
|
R-Bench | 多模态大模型是否在真实世界中鲁棒? AI算法与图像处理 · 公众号 · · 5 月前 · |
|
|
OpenAI终于开源了一次!但被曝剽窃! AI算法与图像处理 · 公众号 · · 5 月前 · |
|
|
剧情反转!95后学术天才的逆天简历?! AI算法与图像处理 · 公众号 · · 5 月前 · |
|
|
效果逼真!视频编辑新玩法!角色、动作、背景都能控制! AI算法与图像处理 · 公众号 · · 5 月前 · |
|