建站者
建站者
前端开发工程师
2026/5/4 11:10:50
15分钟阅读
1,245 次浏览
React 18 新特性
前端开发 React TypeScript

文章摘要

微调定制专属模型:基于Fun-ASR进行垂直领域适应训练 在医疗问诊录音中,“阿司匹林”被识别成“阿姨撕了零”,金融客服场景下“年化收益率”变成“年花由收益”——这些看似滑稽的误识别,实则暴露了通用语音识别系统在专业领域的致…

文章不存在

相关文章

LLM内存优化与持续学习:MBC方法解析与实践
前端
LLM内存优化与持续学习:MBC方法解析与实践 2026/5/4 11:05:27

LLM内存优化与持续学习:MBC方法解析与实践

1. 项目背景与核心挑战大型语言模型(LLM)在近年来展现出惊人的能力,但随之而来的内存扩展和持续学习问题正成为制约其发展的关键瓶颈。传统方法在处理超长上下文或持续学习新知识时,往往面临显存爆炸、训练不稳定和灾难性遗忘等典…

AI语音识别新星崛起:Fun-ASR开源项目全面解析
前端
AI语音识别新星崛起:Fun-ASR开源项目全面解析 2026/4/19 10:53:30

AI语音识别新星崛起:Fun-ASR开源项目全面解析

Fun-ASR:让每个人都能拥有自己的语音识别引擎 在远程会议频繁、线上教学普及的今天,你是否曾为手动整理录音逐字稿而头疼?又是否担心将公司内部会议上传到云端语音服务会带来数据泄露风险?这些问题,正是当前语音识别技…

提升生产力利器:将Fun-ASR嵌入日常工作流的五种方式
前端
提升生产力利器:将Fun-ASR嵌入日常工作流的五种方式 2026/4/19 10:53:40

提升生产力利器:将Fun-ASR嵌入日常工作流的五种方式

提升生产力利器:将Fun-ASR嵌入日常工作流的五种方式 在每天被会议、语音备忘录和客户通话填满的工作节奏中,你是否曾想过——那些说出口的话,能不能直接变成可编辑、可搜索、可归档的文字?更进一步,如果这个过程不需要…

线下Meetup计划:北上广深杭首批城市启动
前端
线下Meetup计划:北上广深杭首批城市启动 2026/4/19 10:53:40

线下Meetup计划:北上广深杭首批城市启动

Fun-ASR WebUI 技术解析:从本地语音识别到高效批量处理 在智能办公与自动化需求日益增长的今天,如何快速、安全地将会议录音转化为可编辑文本,成为许多企业和个人用户的刚需。尤其是在金融、医疗、政务等对数据隐私高度敏感的领域&#xff0c…

金融行业合规性改造:满足等保三级要求
前端
金融行业合规性改造:满足等保三级要求 2026/4/23 1:42:44

金融行业合规性改造:满足等保三级要求

金融行业合规性改造:满足等保三级要求 在银行、证券、保险等机构的日常运营中,客服通话录音、内部会议记录、合规审计材料正越来越多地依赖语音识别技术进行自动化处理。然而,这些音频往往包含客户身份信息、交易细节甚至风控策略&#xff0c…

MA-EgoQA:多智能体第一视角视频问答基准解析
前端
MA-EgoQA:多智能体第一视角视频问答基准解析 2026/5/4 1:04:20

MA-EgoQA:多智能体第一视角视频问答基准解析

1. 项目背景与核心价值在计算机视觉与自然语言处理的交叉领域,视频问答(VideoQA)一直是极具挑战性的研究方向。而当我们把视角聚焦在第一人称视频(Egocentric Video)时,问题会变得更加复杂——这类视频通常…

首页 博客 项目 关于我