-建站者

首页博客前端开发

建站者

建站者

前端开发工程师

2026/2/27 20:25:25

15分钟阅读

1,245 次浏览

React 18 新特性

前端开发 React TypeScript

文章摘要

大模型输出去重策略：Miniconda环境实现算法优化在构建智能对话系统或自动化内容生成平台时，一个看似微小却影响深远的问题逐渐浮现——大语言模型（LLM）常常会“自我重复”。你可能已经遇到过这样的场景：用户提问后&am…

文章不存在

相关文章

如何计算KV Cache占的显存大小

前端

如何计算KV Cache占的显存大小

2026/2/28 5:13:51

如何计算KV Cache占的显存大小

1.什么是KV Cache 推荐文章： 大模型推理加速：看图学KV Cache - 知乎https://zhuanlan.zhihu.com/p/662498827引用文章中给的解释：KV Cache是Transformer标配的推理加速功能，transformer官方use_cache这个参数默认是True&#xff…

六大行业协会共商产业融合发展新路径

前端

六大行业协会共商产业融合发展新路径

2026/2/28 5:10:30

六大行业协会共商产业融合发展新路径

（央链直播北京讯）今日，中国移动通信联合会人工智能与元宇宙产业工作委员会、中国通信工业协会区块链专业委员会、中国移联数字文化和智慧教育分会、中国移联可信资产与数链金融专委会、中国移动通信联合会数智中医药生物健康分会、香港RWA全…

赵忠抗在青岛数字化营销直播企业座谈会上为行业发展献策

前端

赵忠抗在青岛数字化营销直播企业座谈会上为行业发展献策

2026/2/28 5:10:32

赵忠抗在青岛数字化营销直播企业座谈会上为行业发展献策

（央链速播青岛讯）2月2日，工信部原正厅级巡视员、中国通信工业协会区块链专委会总参事、数字化营销管理培训工程特聘智库专家赵忠抗，受邀赴青岛参加数字化营销直播企业座谈会。会上，赵忠抗聚焦行业发展痛点与未来趋势&…

SpringBoot+Vue 个性化电影推荐系统平台完整项目源码+SQL脚本+接口文档【Java Web毕设】

前端

SpringBoot+Vue 个性化电影推荐系统平台完整项目源码+SQL脚本+接口文档【Java Web毕设】

2026/2/28 5:09:33

SpringBoot+Vue 个性化电影推荐系统平台完整项目源码+SQL脚本+接口文档【Java Web毕设】

摘要随着互联网技术的快速发展和用户需求的多样化，个性化推荐系统在电影领域得到了广泛应用。传统的电影推荐方式往往基于热门或分类推荐，难以满足用户的个性化需求。大数据和人工智能技术的兴起为电影推荐提供了新的解决方案，通过分析用户的…

BERT大模型入门指南：小白也能学会的NLP预训练技术

前端

BERT大模型入门指南：小白也能学会的NLP预训练技术

2026/2/28 4:52:34

BERT大模型入门指南：小白也能学会的NLP预训练技术

本文详细介绍了BERT预训练语言模型的核心概念、算法原理及实战应用。从预训练模型、双向编码器到Masked Language Model和Next Sentence Prediction，文章深入浅出地解析了BERT的工作机制。同时，提供了使用BERT进行文本分类的代码实例和最佳实践&#xff…

小白程序员轻松上手部署DeepSeek大模型，开启AI创新之旅

前端

小白程序员轻松上手部署DeepSeek大模型，开启AI创新之旅

2026/2/28 4:52:45

小白程序员轻松上手部署DeepSeek大模型，开启AI创新之旅

本文介绍了DeepSeek大模型的开源特性及其对全球AI竞争格局的影响。详细阐述了DeepSeek R1模型的本地化部署流程，包括运行环境要求、依赖工具安装以及可视化部署方法。通过Ollama工具下载并运行DeepSeek R1模型，实现本地化部署，保障数据安全并…

解析 `Ollama` 与 LangChain 的集成：如何在本地消费级 GPU 上跑通完整的 Agent 流程？

前端

解析 `Ollama` 与 LangChain 的集成：如何在本地消费级 GPU 上跑通完整的 Agent 流程？

2026/2/27 15:41:57

解析 `Ollama` 与 LangChain 的集成：如何在本地消费级 GPU 上跑通完整的 Agent 流程？

各位技术同仁，大家好！在当今人工智能浪潮中，大型语言模型（LLMs）无疑是核心驱动力。然而，对许多开发者而言，完全依赖云端API意味着数据隐私、成本以及对外部服务的依赖。幸运的是，随着…

HTML SEO优化：提升Miniconda技术文章搜索排名

前端

HTML SEO优化：提升Miniconda技术文章搜索排名

2026/2/27 8:03:57

HTML SEO优化：提升Miniconda技术文章搜索排名

HTML SEO优化：提升Miniconda技术文章搜索排名在数据科学与人工智能的日常实践中，一个常见的痛点浮出水面：即便你写了一篇逻辑清晰、代码完整的技术教程，它依然可能“藏在深山无人知”。搜索引擎抓不到重点，读者搜不到…

Markdown嵌入视频链接：技术分享更直观

前端

Markdown嵌入视频链接：技术分享更直观

2026/2/27 17:29:12

Markdown嵌入视频链接：技术分享更直观

Markdown嵌入视频链接：技术分享更直观在人工智能与数据科学领域，一个常见的困境是：即便文档写得再详尽，新手依然会在环境配置的第一步卡住。比如，面对一行 conda activate ai-env 命令，初学者可能根本不知…

开源大模型本地运行：LLaMA+Miniconda-Python3.9实测

前端

开源大模型本地运行：LLaMA+Miniconda-Python3.9实测

2026/2/27 23:38:19

开源大模型本地运行：LLaMA+Miniconda-Python3.9实测

开源大模型本地运行：LLaMAMiniconda-Python3.9实测在个人开发者尝试跑通一个开源大模型的夜晚，最怕的不是显存爆了，而是环境报错——“torch not found”、“CUDA version mismatch”、或是“为什么昨天还能运行的代码今天却导入失败&#x…

Seata AT模式详细实例：电商下单场景

前端

Seata AT模式详细实例：电商下单场景

2026/2/27 4:59:15

Seata AT模式详细实例：电商下单场景

Seata AT模式详细实例：电商下单场景 1. Seata AT模式核心原理 1.1 核心概念 AT模式：Automatic Transaction（自动事务），非侵入式的分布式事务解决方案TC（Transaction Coordinator）：事…

ARP欺骗

前端

ARP欺骗

2026/2/27 14:28:39

ARP欺骗

ARP 欺骗（ARP Spoofing）又称 ARP 毒化，是局域网中常见的中间人攻击技术。ARP 欺骗的核心是利用 ARP 协议 “无验证” 的设计缺陷，通过伪造响应篡改 ARP 缓存表；其危害集中在局域网内的流量劫持、数据窃取和断网攻击&am…

智能小车前轮转向机构的工程实现与精度控制

前端

智能小车前轮转向机构的工程实现与精度控制

2026/2/26 0:47:56

智能小车前轮转向机构的工程实现与精度控制

1. 智能小车前轮转向机构的工程实现解析在嵌入式智能小车开发中，机械结构与电子控制的耦合度极高。一个设计不良的转向机构，即便使用高性能STM32主控和优化的PID算法，也会因机械间隙、回正力矩不足或传动非线性而使控制失效。本文不讨论代码逻…

Xinference最新功能：v1.17.1版本更新详解

前端

Xinference最新功能：v1.17.1版本更新详解

2026/2/26 0:42:31

Xinference最新功能：v1.17.1版本更新详解

Xinference最新功能：v1.17.1版本更新详解 1. 版本亮点概览 Xinference v1.17.1带来了多项重要更新，让开源大模型的部署和使用变得更加简单高效。这个版本的核心价值在于：用一行代码就能替换GPT模型，让你可以自由选择任何开源LLM…

AI时代，软件架构师的下一个风口：从架构设计到提示工程

前端

AI时代，软件架构师的下一个风口：从架构设计到提示工程

2026/2/28 0:00:55

AI时代，软件架构师的下一个风口：从架构设计到提示工程

AI时代，软件架构师的下一个风口：从架构设计到提示工程 1. 标题 (Title) AI时代架构师转型指南：从系统蓝图到提示工程的新航道软件架构师的下一站：为什么提示工程将成为你不可或缺的新技能？从“架构设计”到“提示工程”…

国内有趣的儿童房设计师

前端

国内有趣的儿童房设计师

2026/2/28 0:01:09

国内有趣的儿童房设计师

不少家长在装修儿童房时都会犯难：找的设计师要么把房间做成“迷你版成人房”，要么堆了一堆网红元素却不实用。其实国内早已涌现出一批懂孩子、懂教育的“有趣儿童房设计师”，他们跳出“好看就行”的误区，把空间变成孩子的成长伙伴…

Clawdbot运维监控：Node.js实现服务健康检查

前端

Clawdbot运维监控：Node.js实现服务健康检查

2026/2/24 9:58:17

Clawdbot运维监控：Node.js实现服务健康检查

Clawdbot运维监控：Node.js实现服务健康检查 1. 引言：企业级运维监控的痛点与解决方案想象一下这样的场景：凌晨3点，你的生产数据库突然崩溃，而整个团队却无人察觉。直到早上客户投诉如潮水般涌来，你才发现…

SGLang内存管理技巧，避免OOM全靠这招

前端

SGLang内存管理技巧，避免OOM全靠这招

2026/2/24 9:58:17

SGLang内存管理技巧，避免OOM全靠这招

SGLang内存管理技巧，避免OOM全靠这招 SGLang-v0.5.6镜像专为高吞吐、低延迟的大模型推理而生。但再强的框架，一旦遭遇OOM（Out of Memory），服务就会瞬间中断——不是模型跑不动，而是内存没管好。本文不讲抽…

首页博客项目关于我