首页
用于视频中人体动作检测的时频网络
返回

用于视频中人体动作检测的时频网络

2022-12-19 科技信息 By:佚名
最佳答案视频中的人体动作检测可应用于视频监控、人机交互和设备控制等领域。该任务需要一个具有 3D 形状的图像序列作为输入,以检测诸如跑步或接球之类的动作。通常,卷积神经网络 (CNN) 用于此任务。然而,他们只考虑时空特征,而使用频率特征会促进学习。最近 arXiv.org 上的一篇论文提出了一种时频域中...

视频中的人体动作检测可应用于视频监控、人机交互和设备控制等领域。该任务需要一个具有 3D 形状的图像序列作为输入,以检测诸如跑步或接球之类的动作。

通常,卷积神经网络 (CNN) 用于此任务。然而,他们只考虑时空特征,而使用频率特征会促进学习。最近 arXiv.org 上的一篇论文提出了一种时频域中的端到端单级网络。

3D-CNN 和 2D-​​CNN 分别用于提取时间和频率特征。然后,将它们与注意力机制融合以获得检测模式。实验证明了所建议的方法相对于其他最先进的模型的优越性。证明了利用频率特征进行动作检测的可行性。

目前,大多数用于视频中人体动作检测的深度学习方法都采用时空特征,然而,它们忽略了频域中的重要特征。在这项工作中,我们提出了一个同时考虑时间和频率特征的端到端网络,称为 TFNet。TFNet有两个分支,一个是由三维卷积神经网络(3D-CNN)构成的时间分支,以图像序列为输入提取时间特征;另一个是频率分支,通过二维卷积神经网络(2D-CNN)从DCT系数中提取频率特征。最后,为了获得动作模式,这两个特征在注意力机制下深度融合。

猜你喜欢
一心无挂四大皆空是什么意思(四大皆空是什么意思)

一心无挂四大皆空是什么意思(四大皆空是什么意思)

12-18 0 阅读
LG开始安装透明的OLED显示器 而不是地铁窗口

LG开始安装透明的OLED显示器 而不是地铁窗口

12-18 0 阅读
好看的喜剧电视剧推荐几部(好看的喜剧电视剧)

好看的喜剧电视剧推荐几部(好看的喜剧电视剧)

12-18 0 阅读
苹果手机掉水里面了怎么办(苹果iphone手机掉水里怎么办)

苹果手机掉水里面了怎么办(苹果iphone手机掉水里怎么办)

12-18 0 阅读
Galaxy S20活动将使您的S10或Note 10的价格降低三分之?

Galaxy S20活动将使您的S10或Note 10的价格降低三分之?

12-18 0 阅读
给老师的祝福语四个字(给老师的祝福语)

给老师的祝福语四个字(给老师的祝福语)

12-18 0 阅读
热门推荐
党团工作(关于党团工作的介绍)

党团工作(关于党团工作的介绍)

12-18 0 阅读
脑垂体瘤能治好吗治愈率是多少(脑垂体瘤能治好吗)

脑垂体瘤能治好吗治愈率是多少(脑垂体瘤能治好吗)

12-19 0 阅读
微信静音能听到吗(微信静音是谁听不到)

微信静音能听到吗(微信静音是谁听不到)

12-18 0 阅读
hp1008打印机驱动下载(hp1008打印机驱动怎么下载)

hp1008打印机驱动下载(hp1008打印机驱动怎么下载)

12-18 0 阅读
LG V40 ThinQ现以前所未有的低价出售 保修一年

LG V40 ThinQ现以前所未有的低价出售 保修一年

12-18 0 阅读
董明珠是谁的情人(董明珠是谁的小三)

董明珠是谁的情人(董明珠是谁的小三)

12-19 0 阅读
丰田7座商务车有哪些(丰田7座商务车有哪几款?)

丰田7座商务车有哪些(丰田7座商务车有哪几款?)

12-19 0 阅读
大学英语四级听力训练电子版(大学英语四级听力训练)

大学英语四级听力训练电子版(大学英语四级听力训练)

12-19 0 阅读
男式服装

男式服装

12-18 0 阅读
百分九每个人的应援口号(百分九少年应援口号)

百分九每个人的应援口号(百分九少年应援口号)

12-18 0 阅读