建站者
建站者
前端开发工程师
2026/3/21 12:56:44
15分钟阅读
1,245 次浏览
React 18 新特性
前端开发 React TypeScript

文章摘要

Markdown转技术博客自动化流程:基于Miniconda-Python3.10的大规模内容生成 在今天的技术团队中,一个常见的场景是:多位工程师并行撰写技术文档,有人用Jupyter记录实验过程,有人用Markdown写设计说明。最终这些内容要统…

文章不存在

相关文章

Ψ0——人形全身VLA:先用800h人类自视角视频数据预训练VLM,再用30h的真实机器人交互数据训练MM-DiT,最后用AMO做下肢RL跟踪
前端
Ψ0——人形全身VLA:先用800h人类自视角视频数据预训练VLM,再用30h的真实机器人交互数据训练MM-DiT,最后用AMO做下肢RL跟踪 2026/3/22 8:39:25

Ψ0——人形全身VLA:先用800h人类自视角视频数据预训练VLM,再用30h的真实机器人交互数据训练MM-DiT,最后用AMO做下肢RL跟踪

前言 对于本文要介绍的Ψ0 首先,作者在大规模第一视角人类视频(约800 小时的人类视频数据)上对一个 VLM 主干进行自回归预训练,以获得具有良好泛化能力的视觉-动作表征随后,再在高质量的人形机器人数据(30 小时的真实世界机器人数据)上后训…

利用GLM-OCR构建自动化作业批改系统原型
前端
利用GLM-OCR构建自动化作业批改系统原型 2026/3/22 8:35:41

利用GLM-OCR构建自动化作业批改系统原型

利用GLM-OCR构建自动化作业批改系统原型 想象一下,一位老师面对堆积如山的作业本,需要逐字逐句地批改,不仅耗时费力,还容易因为疲劳而出现疏漏。对于学生来说,等待批改结果的时间漫长,无法及时获得反馈来调…

ESP32-C3驱动圆形TFT实现生理级眼动渲染
前端
ESP32-C3驱动圆形TFT实现生理级眼动渲染 2026/3/19 10:50:07

ESP32-C3驱动圆形TFT实现生理级眼动渲染

1. 项目背景与工程目标 一个“会动的眼珠子”看似是趣味电子玩具,实则是嵌入式图形系统在资源受限平台上的典型综合实践。它不依赖视频解码或外部存储介质,而是通过实时几何建模、动态渲染与人眼行为建模,在低分辨率圆形 TFT 屏幕上生成具有生…

首页 博客 项目 关于我