Open AI 的拉跨发布会甚至都不如谷歌开源的多模态 Gemma 2 模型来的实际。
PaliGemma2 : Gemma 2 微调的多模态 LLM。 #ai#
有3B、10B、28B 参数,支持224px、448px、896px图片。
PaliGemma 2 为图像生成详细的、上下文相关的提示。
而且可以进行化学式识别、乐谱识别、空间推理和胸部 X 光报告生成。
模型下载: 网页链接
PaliGemma2 : Gemma 2 微调的多模态 LLM。 #ai#
有3B、10B、28B 参数,支持224px、448px、896px图片。
PaliGemma 2 为图像生成详细的、上下文相关的提示。
而且可以进行化学式识别、乐谱识别、空间推理和胸部 X 光报告生成。
模型下载: 网页链接