• 当前频道:学习笔记

人工智能 视频行为识别(一)——综述

  Deep Neural Networks in Video Human Action Recognition: A Review 本次分享的文章是2023年收录在计算机视觉领域的顶刊“CVPR”(级别:视觉类TOP)期刊上。该期刊详细信息可关注公众号 AI八倍镜 点击菜单项查询。 论文地址:https:/

2023-07-09 00:30:58 321 2 1
阅读详情

人工智能 因果学习篇(1)-后门准则

  后门准则 本次分享的知识来源于《Causal Inference in Statistics:A Primer》的翻译版本《统计因果推理入门》,该书由杨娇云等人翻译,主要包括因果学习的基础知识。 电子图书获取方法: 关注公众号“AI八倍镜”并回复“因果学习”。 知识回顾 在上一小节“校正公式”当中,学习到

2023-07-06 10:18:30 397 2 1
阅读详情

人工智能 异常处理:pyemd或PyEMD找不到

前言 在不同的程序中通常会使用不同的导包方式,如 from pyemd import emd from PyEMD import EMD 错误 如果按照网上的办法 什么pip install PyEMD或者pip install EMD-signal等。只会造成各式各样的错误,如找不到pyemd、找不到PyEMD、找不

2022-07-26 08:59:48 1516 4 7
阅读详情

人工智能 浅析Swin transformer模型(通俗易懂版)

  Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 1. 论文信息 原文地址:https://arxiv.org/abs/2103.14030 官网地址:https://github.com/microsoft/S

2022-07-06 11:19:07 1016 0 4
阅读详情

人工智能 循环神经网络(RNN)详解-计算公式推导

  RNN计算公式 RNN结构图结构 图中变量名介绍 a:上一个时间步的激活值(activate value) x :第x个输入(一句话中第x个字) y:第y个输出(预测值) Waa:与激活值进行计算的参数。其中第一个a是指当前参数是计算a(激活值)的,第二个a是指当前参数与激活值进行乘运算 Wax:与输入进

2022-02-15 22:14:54 2293 0 2
阅读详情

人工智能 SEnet 通道注意力模块

开篇一张图: 变量和图片解释: 三个正方体:特征向量,比如说图像的特征,H表示图片高度、W表示图片宽、C表示通道(黑白1通道、彩色3通道) 字母: X表示输入特征; Ftr表示的是对X进行一次卷积,也就是对特征进行一系列的操作之后的结果,表示为U; Fsq(.)表示的是对U进行压缩; Fex(.)表示的是对U进行激活(

2021-12-30 21:20:04 1502 0 7
阅读详情

人工智能 论文阅读–Semantic Grouping Network for Video Captioning

  Semantic Grouping Network for Video Captioning abstract 提出了Semantic Grouping Network(SGN)网络: 用部分已经解码的字幕中,选择可可以区分的单词短语对视频帧进行分组,也就是将表达不同意思的帧分组(与聚类相似); 对语义对

2021-12-28 20:24:50 1381 0 4
阅读详情
  • 1
  • 2
  • 3
  • 4
  • 5
前往