建站者
建站者
前端开发工程师
2026/5/30 9:26:03
15分钟阅读
1,245 次浏览
React 18 新特性
前端开发 React TypeScript

文章摘要

BGE-Large-Zh模型量化实战:FP16与INT8精度对比 1. 引言 在部署语义向量模型时,我们经常面临一个关键抉择:是选择高精度的FP16格式保证最佳效果,还是采用INT8量化来换取更快的推理速度和更小的内存占用?今天我们就通过…

文章不存在

相关文章

CANN/catlass TileCopyTla TLA搬运模板基类
前端
CANN/catlass TileCopyTla TLA搬运模板基类 2026/5/30 9:22:25

CANN/catlass TileCopyTla TLA搬运模板基类

TileCopyTla 系列(TLA 搬运模板基类) 【免费下载链接】catlass 本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。 项目地址: https://gitcode.com/cann/catlass 代码位置 [TOC] 概述 tile_copy_tla.hpp …

AMCT大模型MINMAX量化
前端
AMCT大模型MINMAX量化 2026/5/30 9:20:09

AMCT大模型MINMAX量化

AMCT大模型MINMAX量化 【免费下载链接】amct AMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。 项目地址: https://gitcode.com/cann/amct 1 量化前提 1.1 安装依赖 本sample依赖包可参考requirements.txt 需要注意的是torch_npu包版本需要与Python、torch包版本…

CANN/catlass稀疏矩阵GM到L1搬运模板
前端
CANN/catlass稀疏矩阵GM到L1搬运模板 2026/5/30 9:20:11

CANN/catlass稀疏矩阵GM到L1搬运模板

TileCopySparseTla(GM → L1,Sparse) 【免费下载链接】catlass 本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。 项目地址: https://gitcode.com/cann/catlass 代码位置 [TOC] 功能说明 Til…

Go反射reflect包高级用法
前端
Go反射reflect包高级用法 2026/5/11 4:37:05

Go反射reflect包高级用法

Go语言反射机制探秘:深入reflect包高级用法 Go语言的反射机制通过reflect包为开发者提供了强大的运行时类型检查与操作能力。尽管反射会带来一定的性能开销,但在需要动态处理类型、实现泛型逻辑或构建框架时,它往往是不可替代的工具。本文将…

OpenClaw硬件控制:Qwen3.5-9B通过串口调试物联网设备
前端
OpenClaw硬件控制:Qwen3.5-9B通过串口调试物联网设备 2026/5/11 4:37:04

OpenClaw硬件控制:Qwen3.5-9B通过串口调试物联网设备

OpenClaw硬件控制:Qwen3.5-9B通过串口调试物联网设备 1. 为什么需要AI介入硬件调试? 去年夏天,我在调试一个基于ESP32的农业传感器项目时,经历了连续三天重复发送AT指令、等待响应、记录数据的机械劳动。当我在第四天发现因为手…

利用快马平台快速构建快速排序算法可视化演示原型
前端
利用快马平台快速构建快速排序算法可视化演示原型 2026/5/11 4:37:20

利用快马平台快速构建快速排序算法可视化演示原型

最近在复习算法时,发现快速排序虽然原理简单,但实际理解递归过程还是有些抽象。为了更直观地掌握这个经典算法,我尝试用InsCode(快马)平台快速搭建了一个可视化演示工具,整个过程比想象中顺利很多。 1. 为什么需要可视化演示 快…

首页 博客 项目 关于我