建站者
建站者
前端开发工程师
2026/5/4 23:05:28
15分钟阅读
1,245 次浏览
React 18 新特性
前端开发 React TypeScript

文章摘要

一、开篇:YOLO11的Neck,真的够用了吗? 2024年9月30日,Ultralytics在YOLO Vision 2024(YV24)活动上正式发布了YOLO11模型。根据Ultralytics官方介绍,YOLO11引入了C3K2模块、增强版SPPF快速空间金字塔池化和C2PSA空间注意力机制三大核心创新,以更少的参数实现了更高的精…

文章不存在

相关文章

如何在OpenClaw Agent工作流中接入Taotoken的多模型服务
前端
如何在OpenClaw Agent工作流中接入Taotoken的多模型服务 2026/5/5 0:23:21

如何在OpenClaw Agent工作流中接入Taotoken的多模型服务

如何在OpenClaw Agent工作流中接入Taotoken的多模型服务 1. 准备工作 在开始配置之前,请确保您已经拥有一个有效的Taotoken API Key。您可以在Taotoken控制台的API Key管理页面创建新的密钥。同时,建议提前在模型广场查看可用的模型ID,例如…

视觉MoE框架ProMoE:高效图像生成与显存优化方案
前端
视觉MoE框架ProMoE:高效图像生成与显存优化方案 2026/5/5 0:19:40

视觉MoE框架ProMoE:高效图像生成与显存优化方案

1. 项目背景与核心价值视觉MoE(Mixture of Experts)框架是当前多模态大模型领域的重要研究方向。传统视觉Transformer模型在处理高分辨率图像时往往面临计算复杂度激增的问题,而ProMoE通过引入原型路由机制,在保持模型容量的同时显…

MA-EgoQA:多智能体第一视角视频问答基准解析
前端
MA-EgoQA:多智能体第一视角视频问答基准解析 2026/5/4 1:04:20

MA-EgoQA:多智能体第一视角视频问答基准解析

1. 项目背景与核心价值在计算机视觉与自然语言处理的交叉领域,视频问答(VideoQA)一直是极具挑战性的研究方向。而当我们把视角聚焦在第一人称视频(Egocentric Video)时,问题会变得更加复杂——这类视频通常…

首页 博客 项目 关于我