2018ofo月卡买不了

编程笔记 • 2024-08-14 15:12 • 阅读 17

论文标题：AVA: A Video Dataset of Spatio-temporally Localized Atomic Visual Actions 来源/作者机构情况：谷歌，http://www.cs.toronto.edu/~dross/ UC Berkeley 解决问题/主要思想贡献：贡献了一个新的动作分类的数据集

论文标题：AVA: A Video Dataset of Spatio-temporally Localized Atomic Visual Actions

来源/作者机构情况：

谷歌，http://www.cs.toronto.edu/~dross/

UC Berkeley

解决问题/主要思想贡献：

贡献了一个新的动作分类的数据集

成果/优点：

分类更加多，单人，多人，人和物体的动作三大类。还有时间和空间上更加精确的标定

人类动作识别数据集AVA（atomic visual actions，原子视觉动作），提供扩展视频序列中每个人的多个动作标签，精确标注多人动作，我们将动作标签限制在固定的3s时间内。
[电影」和「电视」类别，选择来自不同国家的专业演员。我们对每个视频抽取 15 分钟进行分析，并统一将 15 分钟视频分割成 300 个非重叠的 3 秒片段。采样遵循保持动作序列的时间顺序这一策略。

数据集地址：https://research.google.com/ava/ 需要科学链接

缺点：

反思改进/灵感：

#############################################################

论文主要内容与关键点：

论文主要部分：

1. Introduction

数据集的基本参数：连续三秒长，80种不同的动作类型

2. Related work 动作类数据集

静态动作数据集，以及这些数据记的缺点：失去了时间的特征

3. Data collection：

4. Characteristics of the AVA dataset

5. Experiments

6. Conclusion

目前的研究方法，在AVA数据集都还没有取得SOFA的结果，说明视频动作分类还需要研究出更好的算法出来。

代码实现：

https://github.com/tensorflow/models/tree/master/research/object_detection

知秋君

知秋君

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请关注公众号“全栈程序员社区”联系小编举报，一经查实，本站将立刻删除。

城堡保卫游戏

上一篇 2024-08-14 15:36

SLAM--VICP(Velocity Updating Iterative Closest Point Algorithm)学习笔记

下一篇 2024-08-14 15:02

城堡保卫游戏 1723620966
sketchware源码 1723621688
插入人 1723622526
深入浅出ssd 1723623126
共识机制poa 1723624566
快递查询快递api接口是什么 1723625287
golang实现单链表 1723626126
远程桌面连接设置方法步骤 1723626726
国外破解网站 games 1723628166
SLAM--VICP(Velocity Updating Iterative Closest Point Algorithm)学习笔记 1723618926
iso2685解析 1723618086
倒装句英语语法详细解说 1723617366
greendao数据库位置 1723615926
组播vlan -1 1723615327
ocr文字识别控件 1723614486
10款设计师常用的app页面设计软件 1723613766
html5中template用法 1723612326
电容直流偏压特性 1723611726