挑选衣物时,是否曾因为无法仅通过图片准确识别面料而感到困扰?是否希望在无法直接接触物品的情况下,能够迅速了解其材质类型?在信息技术飞速发展的今天,我们每天都在与各种类型的数据打交道——从文字到图片,从音频到视频。数据的获取与处理变得愈发重要,但如何有效提取这些不同类型数据中的有用信息呢?这正是多模态文件信息抽取技术大显身手的地方。多模态文件信息抽取是一种利用人工智能自动挖掘包含多种数据类型(如文本、图像、音频、视频等)文件中隐藏价值的技术。它不仅能够显著减少繁琐的人工处理过程,还能大幅提升信息处理的效率和准确性。这也正是为什么AI工具可以打破信息模态壁垒,成功识别图片中物品材质。具体来说,材质识别依赖于深度学习算法和大量的训练数据,使模型能够精确区分不同材料的纹理、颜色及其他视觉特征。无论是在电子商务中确保商品描述的真实性和一致性,还是在室内设计领域辅助设计师快速选材,亦或是在文物保护方面提供非接触式的材料分析,这种技术都展现出了巨大的潜力和广泛应用前景。本文是一个图片中物品的材质的实战教程,跟随我们的步骤实践起来,人人都是鉴宝大师!点击文末阅读原文,直通搭建页面,参与还有惊喜礼物赠送~该教程以提取图片信息为例,准备好要进行信息提取的图片和关键词,就可以开始我们的信息提取之旅啦。在图片信息提取的流程中,使用计算资源构建的 Web 服务来接收用户的请求,然后将图片地址和提示词发送至百炼模型服务,由其调用qwen-vl-max视觉模型处理后,最终将返回提取结果。- 开通百炼模型服务:前往百炼控制台,获得免费额度。在控制台的右上角选择API-KEY,然后创建API Key,用于通过API调用大模型;
创建对象存储OSS:登录OSS管理控制台,创建Bucket,参数配置可参考下表;
- 创建并部署默认环境:部署函数计算应用模板,参考下表进行参数配置;
1. 应用部署完成后,您可以在环境详情的环境信息中找到示例网站的访问域名。如下图所示:
使用官方示例,进行信息提取
- 在信息提取时,使用默认填写的关键词,模型会根据给出的关键词提取出对应的信息。
- 在信息提取时,不使用关键词,模型会自动分析理解,可能会出现每次返回的差异性。
b. 删除关键词描述内容。
c. 单击提取信息,等待片刻查看结果。
若想用于生产环境,请点击链接下载源码,可以进行二次开发:
https://atomgit.com/aliyun_solution/image-attr-information-extraction.git点击阅读原文,体验通过图片视觉理解,结构化提取属性信息~
https://developer.aliyun.com/topic/dec/cv?utm_content=g_1000400290