专栏名称: AI科技评论
「AI科技评论」是国内顶尖人工智能媒体和产业服务平台,专注全球 AI 业界、学术和开发三大方向的深度报道。
目录
相关文章推荐
爱可可-爱生活  ·  【[476星]Volcengine ... ·  3 天前  
宝玉xp  ·  这两天国内 AI 圈最火的非 Manus ... ·  3 天前  
宝玉xp  ·  转发微博-20250307131223 ·  3 天前  
爱可可-爱生活  ·  //@爱可可-爱生活:欢迎参与!//@爱可可 ... ·  3 天前  
51好读  ›  专栏  ›  AI科技评论

今日 Paper | 旋转不变混合图形模型网络;人体移动轨迹;行人再识别;基准成像系统等

AI科技评论  · 公众号  · AI  · 2020-02-18 12:30

正文

目录

  • 用于二维手势估计的旋转不变混合图形模型网络

  • 从人体移动轨迹中学习具有空间层次的细粒度位置嵌入

  • 中等服装变化下基于轮廓草图的行人再识别

  • 基准成像系统的综合数据库

  • 基于双向语言模型的半监督序列标注

用于二维手势估计的旋转不变混合图形模型网络

论文名称:Rotation-invariant Mixed Graphical Model Network for 2D Hand Pose Estimation

作者:Kong Deying /Ma Haoyu /Chen Yifei /Xie Xiaohui

发表时间:2020/2/5

论文链接:https://arxiv.org/abs/2002.02033v1

推荐原因

这篇论文发表于WACV 2020,考虑的是二维手姿势估计问题。

这篇论文提出了一种名为旋转不变混合图形模型网络(R-MGMN)的网络架构,用来解决单摄像头采集的RGB图像中的二维手姿势估计问题。通过集成一个旋转网络,R-MGMN可以应对图像中手的旋转。R-MGMN还具有一个图形模型库,可以根据输入图像来选择图形模型的组合。R-MGMN通过在每个图形模型上执行置信传播来生成一组边际分布,然后将这些边际分布作为手部关键点位置的置信度映射,最终所有的置信度映射合在一起得到最终的置信度映射。这篇论文在两个公共手势数据集上评估了R-MGMN,实验结果表明R-MGMN明显优于其他的算法。

从人体移动轨迹中学习具有空间层次的细粒度位置嵌入

论文名称:Learning Fine Grained Place Embeddings with Spatial Hierarchy from Human Mobility Trajectories

作者:Shimizu Toru /Yabe Takahiro /Tsubouchi Kota

发表时间:2020/2/6

论文链接:https://arxiv.org/abs/2002.02058v1

推荐原因

这篇论文考虑的是位置嵌入问题。

以往的研究通过人员流动轨迹来生成位置嵌入,而实际应用需要具有高空间分辨率的位置嵌入。由于数据稀疏性,许多应用不得不降低空间分辨率,从而导致位置嵌入质量的降低。为了解决这个问题,这篇论文提出了一种生成细粒度位置嵌入的方法,根据观察到的数据点的局部密度来利用空间层次信息。基于日本3个城市的真实世界轨迹数据,这篇论文实验了下一个位置的预测任务,验证了所提的位置嵌入方法的有效性。

中等服装变化下基于轮廓草图的行人再识别

论文名称:Person Re-identification by Contour Sketch under Moderate Clothing Change

作者:Yang Qize /Wu Ancong /Zheng Wei-Shi

发表时间:2020/2/6

论文链接:https://arxiv.org/abs/2002.02295v1

推荐原因

这篇论文要解决的是行人重识别问题。

与以往只考虑同一个着装的行人重识别问题不同,这篇论文定义了跨服饰行人重识别问题,即在不同着装下的行人重识别任务。这篇论文考虑的是在短时间内,天气没有变化,因此行人穿着的衣服的厚度没有大的变化,从而通过处理行人图像的轮廓草图,而不是通过衣服的颜色信息,来提取特征。这种方式可以对于服饰的变化更加鲁棒。这篇论文还为了这个问题建了一个来自221个行人的包含33698张图像的数据集。通过在新数据集上的实验,这篇论文验证了所提方法的有效性。

基准成像系统的综合数据库

论文名称:A Comprehensive Database for Benchmarking Imaging Systems

作者:Karen Panetta /Qianwen Wan /Sos Agaian /Srijith Rajeev /Shreyas Kamath /Rahul Rajendran /Shishir Paramathma Rao /Aleksandra Kaszowska /Holly A. Taylor / Arash Samani /Xin Yuan

发表时间:2018/11/30

论文链接:https://ieeexplore.ieee.org/document/8554155

推荐原因

这篇论文贡献了Tufts大学收集的人脸数据库,包含了来自15个以上国家/地区的113位个人的10,000多张图像,包含了不同的性别身份、年龄和种族背景。这些人脸图像是从Tufts大学的学生、教职员工及其家属那里采集的,能够为人脸识别相关的研究提供更加鲁棒的算法测试。同时这篇论文也回顾了目前已有的其他人脸识别相关的数据集。

基于双向语言模型的半监督序列标注

论文名称:Semi-supervised sequence tagging with bidirectional language models

作者:Matthew E. Peters /Waleed Ammar /Chandra Bhagavatula /Russell Power







请到「今天看啥」查看全文