建站者
建站者
前端开发工程师
2026/1/26 12:16:56
15分钟阅读
1,245 次浏览
React 18 新特性
前端开发 React TypeScript

文章摘要

摘要:本文深度揭秘如何将Qwen2-7B模型压缩至手机可运行的4GB内存占用。通过LLM.int8()量化、KV-Cache优化、投机解码(Speculative Decoding)等技术组合,我们在骁龙8 Gen3上实现了18 tokens/s的推理速度。涵盖从模型压缩、推理引擎…

文章不存在

相关文章

2.5 Docker镜像构建实战:Dockerfile指令详解与最佳实践
前端
2.5 Docker镜像构建实战:Dockerfile指令详解与最佳实践 2026/1/26 12:15:23

2.5 Docker镜像构建实战:Dockerfile指令详解与最佳实践

2.5 Docker镜像构建实战:Dockerfile指令详解与最佳实践 引言 Dockerfile是构建Docker镜像的蓝图。掌握Dockerfile的编写方法和最佳实践,能够构建高效、安全的镜像。本文将详细介绍Dockerfile的各个指令和最佳实践。 一、Dockerfile基础 1.1 什么是Dockerfile Dockerfile…

YOLOv12官版镜像助力学生快速完成AI课程项目
前端
YOLOv12官版镜像助力学生快速完成AI课程项目 2026/1/26 12:15:27

YOLOv12官版镜像助力学生快速完成AI课程项目

YOLOv12官版镜像助力学生快速完成AI课程项目 在计算机视觉课程设计中,你是否经历过这样的场景:老师布置了“基于YOLO的目标检测系统开发”任务,而你花了整整两天时间卡在环境配置上——CUDA版本不匹配、PyTorch安装失败、Flash Attention编译…

YOLOv12官版镜像效果展示:小目标也能看清
前端
YOLOv12官版镜像效果展示:小目标也能看清 2026/1/26 12:12:58

YOLOv12官版镜像效果展示:小目标也能看清

YOLOv12官版镜像效果展示:小目标也能看清 你有没有遇到过这样的场景:监控画面里一只飞鸟只有十几个像素,工业质检中电路板上的微小焊点 barely 可见,无人机巡检时远处的电力塔螺栓模糊成点——传统YOLO模型在这些场景下要么漏检&…

Qwen3-Embedding-0.6B使用心得:轻量级模型的大用途
前端
Qwen3-Embedding-0.6B使用心得:轻量级模型的大用途 2026/1/26 12:11:26

Qwen3-Embedding-0.6B使用心得:轻量级模型的大用途

Qwen3-Embedding-0.6B使用心得:轻量级模型的大用途 你有没有遇到过这样的问题:想给自己的搜索系统加个语义理解能力,但发现主流大嵌入模型动辄要 24G 显存、推理慢、部署成本高;或者想在边缘设备上跑个轻量检索服务,却…

AI Agent智能办公助手:从ChatGPT到真正“干活“的系统
前端
AI Agent智能办公助手:从ChatGPT到真正“干活“的系统 2026/1/23 10:58:29

AI Agent智能办公助手:从ChatGPT到真正“干活“的系统

摘要:本文揭秘如何构建一个生产级的AI Agent办公自动化系统。基于ReAct框架与函数调用(Function Calling)技术,我们打造了一个能自主操作ERP、写邮件、生成报表的"数字员工"。文章将深入解析Agent的任务规划、工具调用、…

鑫成誉-小黄鸭电动车小程序界面设计
前端
鑫成誉-小黄鸭电动车小程序界面设计 2026/1/24 6:19:49

鑫成誉-小黄鸭电动车小程序界面设计

项目背景2025 年,共享两轮车进入“3.0 时代”:政策对电池安全、车辆秩序、数据合规提出更高要求;用户侧则希望“随借随还、一眼找到、一秒换电”。小黄鸭出行需要在 6 个月内完成一次品牌升级,既要守住“亲民、可爱”的视觉资产&a…

港仔机器人指挥控制系统数字孪生界面设计
前端
港仔机器人指挥控制系统数字孪生界面设计 2026/1/23 14:12:01

港仔机器人指挥控制系统数字孪生界面设计

项目背景 2025年6月16日,香港首家具身智能人形机器人公司港仔机器人(00370)在香港科学园隆重举行“香港智能机器人发展前景论坛暨港仔机器人具身智能品牌战略启幕式”活动。港仔机器人首次向全球展示香港本土具身智能人形机器人的创新成果&am…

精通大数据领域Doris:高级操作技巧分享
前端
精通大数据领域Doris:高级操作技巧分享 2026/1/25 13:10:49

精通大数据领域Doris:高级操作技巧分享

精通大数据领域Doris:高级操作技巧分享 关键词:大数据、Doris、高级操作技巧、数据处理、性能优化 摘要:本文围绕大数据领域的Doris展开,旨在为读者深入介绍Doris的高级操作技巧。从背景知识入手,详细阐述Doris的核心概念与联系、核心算法原理及操作步骤,通过数学模型和公…

云手机群控系统源码
前端
云手机群控系统源码 2026/1/26 0:01:48

云手机群控系统源码

源码介绍: Go 1.18 Node.js 16 pnpm 包管理器 ADB 工具(必须安装并配置环境变量) 看了下,是很多软件组合起来的,感觉很复杂。没测试。 下载地址 (无套路,无须解压密码)https://pan…

RiPlus开心版日主题资源下载 知识付费资源
前端
RiPlus开心版日主题资源下载 知识付费资源 2026/1/26 0:01:50

RiPlus开心版日主题资源下载 知识付费资源

源码介绍:Riplus主题,付费资源素材下载查看系统,全新会员系统,注重会员体系分离, 一键开启关闭会员系统/单独付费系统,支持评论可见,付费可见,付费下载,视频缩略图播放&a…

【Spring Web MVC 入门实战】实战三部曲由易到难:加法计算器 + 用户登录 + 留言板全流程实现
前端
【Spring Web MVC 入门实战】实战三部曲由易到难:加法计算器 + 用户登录 + 留言板全流程实现 2026/1/23 13:54:31

【Spring Web MVC 入门实战】实战三部曲由易到难:加法计算器 + 用户登录 + 留言板全流程实现

文章目录一、加法计算器1.1 约定前后端交互接口1.2 服务端代码1.3 运行测试二、用户登录2.1 约定前后端交互接口2.2 服务端代码2.3 运行测试三、留言板3.1 约定前后端交互接口3.2 服务端代码3.2.1 引入Lombok依赖3.2.2 Lombok 使用3.2.3 后端代码实现3.3 运行测试结语 | 岁末祝…

首页 博客 项目 关于我