建站者
建站者
前端开发工程师
2026/5/29 6:56:47
15分钟阅读
1,245 次浏览
React 18 新特性
前端开发 React TypeScript

文章摘要

vLLM 里的 Swap 和 Recompute 是两个专门解决 GPU显存不足 的“救星功能”。核心目标都是:在有限显存下,让你能跑更大的模型、处理更长的序列,不用因为显存不够就被迫降低模型规模或缩短文本长度。 先铺垫一个关键背景: LLM推理时,KV Cache 是显存占用的“头号大户”(比…

文章不存在

相关文章

SaaS未来趋势:AI融合、垂直化与生态化演进
前端
SaaS未来趋势:AI融合、垂直化与生态化演进 2026/5/29 6:54:13

SaaS未来趋势:AI融合、垂直化与生态化演进

1. 从“租软件”到“买服务”:我们正在经历什么?如果你在2010年跟一个企业老板说,以后你们公司用的财务软件、客户管理系统甚至设计工具,都不用一次性花几十万买了,也不用自己雇IT团队维护服务器了,每个月像…

AI 告诉你代码安全,它在骗你!
前端
AI 告诉你代码安全,它在骗你! 2026/5/29 6:51:14

AI 告诉你代码安全,它在骗你!

开源 TrustEngine,终结 AI 幻觉的终极方案 这是每一个用 AI 写代码的人,每天都在踩的坑。 你让 GPT-4o 写一个登录接口,它返回的代码干净漂亮,注释齐全。你让它自己审核一遍,它拍着胸脯告诉你:"没有任…

《存储类云服务》
前端
《存储类云服务》 2026/5/29 6:51:15

《存储类云服务》

存储类服务实践笔记 一、云硬盘(EVS) 1.1 实验介绍 EVS:为 ECS 等计算服务提供持久性块存储,支持数据冗余和缓存加速。实验目的:掌握云硬盘的购买、挂载、初始化(格式化)、快照等基本操作。 1.2…

大模型面试题57:是否了解LLM的分词器,LLM中的词表文件是如何生成的?
前端
大模型面试题57:是否了解LLM的分词器,LLM中的词表文件是如何生成的? 2026/5/18 5:44:21

大模型面试题57:是否了解LLM的分词器,LLM中的词表文件是如何生成的?

LLM就像一个只认识“自家字典”的外国翻译,分词器是“翻译助手”,负责把你说的话(自然语言)拆成“字典”里的一个个“小词条”(Token),再转换成数字让LLM看懂;而词表文件就是这本“字典”,存着所有LLM认识的“词条”和对应的数字编号。 一、 入门级:先搞懂「分词器」…

VSCode + Claude:AI编程助手如何提升你的开发效率
前端
VSCode + Claude:AI编程助手如何提升你的开发效率 2026/5/10 6:18:58

VSCode + Claude:AI编程助手如何提升你的开发效率

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个VSCode插件,集成Claude AI助手功能。插件应支持:1) 通过自然语言描述生成代码片段;2) 解释复杂代码逻辑;3) 自动修复常见错…

GitHub下载效率对比:传统vs现代加速方案
前端
GitHub下载效率对比:传统vs现代加速方案 2026/5/20 1:51:24

GitHub下载效率对比:传统vs现代加速方案

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个GitHub下载速度测试工具,功能包括:1. 支持多种加速方式测试(直连、代理、镜像等);2. 自动生成对比图表&#xf…

传统VS AI:HTML转Canvas效率提升10倍的秘密
前端
传统VS AI:HTML转Canvas效率提升10倍的秘密 2026/5/10 6:18:59

传统VS AI:HTML转Canvas效率提升10倍的秘密

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个对比测试应用,分别展示:1.传统手动编写html2canvas代码的实现 2.使用快马AI生成的优化版本 3.性能对比仪表盘(加载速度、内存占用等) 4.渲染质量对…

1小时打造PANDAWIKI原型:验证你的知识产品创意
前端
1小时打造PANDAWIKI原型:验证你的知识产品创意 2026/5/10 6:19:00

1小时打造PANDAWIKI原型:验证你的知识产品创意

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个PANDAWIKI最小可行产品(MVP),要求:1. 核心知识管理功能 2. 极简用户界面 3. 基础搜索能力 4. 可扩展的架构设计 5. 一键部署方案。使用低代码平台实…

Qwen3-VL-WEBUI具身AI支持:空间推理部署教程
前端
Qwen3-VL-WEBUI具身AI支持:空间推理部署教程 2026/5/10 6:19:00

Qwen3-VL-WEBUI具身AI支持:空间推理部署教程

Qwen3-VL-WEBUI具身AI支持:空间推理部署教程 1. 引言 随着多模态大模型的快速发展,视觉-语言模型(Vision-Language Model, VLM)在复杂任务理解、空间感知和具身智能代理等方向展现出巨大潜力。阿里云推出的 Qwen3-VL 系列模型&a…

首页 博客 项目 关于我