建站者的编程笔记

专注于前端开发、React、Vue 和现代 Web 技术的个人博客。分享我的学习心得、项目经验和技术见解。

我的技术栈

博客文章

大模型可靠性评估:从事实验证到安全测试
前端
大模型可靠性评估:从事实验证到安全测试 2026/5/4 4:01:33

大模型可靠性评估:从事实验证到安全测试

1. 基础模型可靠性研究的时代背景2023年,当某个开源大模型在医疗问答测试中给出"每天服用200mg布洛芬可预防心脏病"的错误建议时,这个案例迅速在AI伦理委员会内部引发震动。这并非孤例——斯坦福大学的基础模型透明度指数显示,主流…

MA-EgoQA:多智能体第一视角视频问答基准解析
前端
MA-EgoQA:多智能体第一视角视频问答基准解析 2026/5/4 1:04:20

MA-EgoQA:多智能体第一视角视频问答基准解析

1. 项目背景与核心价值在计算机视觉与自然语言处理的交叉领域,视频问答(VideoQA)一直是极具挑战性的研究方向。而当我们把视角聚焦在第一人称视频(Egocentric Video)时,问题会变得更加复杂——这类视频通常…

订阅我的博客更新

第一时间获取我的最新文章、技术分享和项目更新。你的邮箱将受到保护。

我尊重你的隐私,绝不会向第三方分享你的信息。

首页 博客 项目 关于我 联系