Welcome to Kuo Space! 你好,我是Kuo,一名热爱学习与分享的学生。 欢迎来到我的个人空间,这是我的第一篇博客。在这里,我将用文字记录下我的学习旅程——从点滴的知识笔记,到实践中的踩坑总结;从灵光一现的思考,到持续成长的痕迹。 这不仅是一个技术笔记的归档地,更是我思维成长的见证。这个博客是我与自己对话的方式,也是我向世界分享所学的窗口。每一篇文章,都是我对“理解”的一次尝试。 也许内容还很稚嫩,但正是这些不完美, 2025-10-01
扩散模型 扩散模型(Diffusion Model)零基础·超详细学习笔记 从“完全不懂” → “能完整复述 + 自己推公式” 一、扩散模型到底在解决什么问题? 1.1 生成模型要干的事(最原始版本) 所有生成模型,本质都在做一件事: 学会“真实数据长什么样”,然后自己“造”一个出来 比如图像生成: 输入:随机噪声 输出:一张“看起来像真的”图片 文件中用一句话概括: 影像生成模型的目标是让 2025-12-15 具身智能基础 #大模型 #VLA
π0——从论文到复现 π0——从论文到复现 openpi = 一个把「多相机视觉 + 语言指令」编码成 token,再用 Transformer 预测「动作 token chunk」的 VLA 系统 整体架构图 123456789101112131415161718192021222324输入├── 多视角 RGB 图像├── 语言指令 (prompt)│▼Observation Encoder├── Vision E 2025-12-14
OpenVla微调优化实践 OpenVLA微调优化实践 以 GPT 为代表的 Decoder-Only 架构大模型在泛化性、zero-shot 能力上取得巨大进展,随后的 Clip、LLaVA 的等多模态的工作让大模型有了理解世界的能力,使得使用 VLM 控制机器人成为可能。 我深入研究视觉-语言-动作(VLA)领域的新模型 OpenVLA ,通过全面复现、创新微调与优化部署,实现机器人智能控制系统提升: 精准复现与仿真验 2025-12-11 项目复现 #大模型 #VLA
OpenVla复现 这份文档为记录了详尽的 OpenVLA (Open-Source Vision-Language-Action) 模型推理任务复现记录。OpenVLA 是基于 Llama 2 和 DINOv2/SigLIP 的视觉-语言-动作模型,专为机器人控制任务设计。 这份记录模拟了在 Linux 服务器环境下的完整操作流程,涵盖了从环境配置到最终动作输出的每一个细节。 实验记录:OpenVLA-7B 模型 2025-11-28 项目复现 #大模型 #VLA
📘《SimpleVLA-RL》学习笔记 📘《SimpleVLA-RL》学习笔记 1. 研究背景与问题动机 1.1 Vision-Language-Action(VLA)模型的发展背景 VLA 模型旨在使用统一网络完成三类能力: 视觉理解(Vision) 语言理解(Language Instructions) 机器人动作生成(Action Generation) 它们是现代通用机器人系统(Generalist Robots)的核心, 2025-11-13 论文阅读 #大模型 #VLA
学习笔记 — 机器人操作综述:重点关注 VLA(视觉-语言-动作) 方法 学习笔记 — 机器人操作综述:重点关注 VLA(视觉-语言-动作) 方法 本文基于 《Towards a Unified Understanding of Robot Manipulation: A Comprehensive Survey》,全面总结了机器人操作领域的最新研究成果,特别是围绕 VLA(Vision-Language-Action) 方法展开,深入分析了其在机器人操作中的应用与挑战 2025-10-30 具身智能基础 #大模型 #VLA
逻辑回归到Softmax回归 逻辑回归到Softmax回归 1.分类问题 一个新算法的诞生要么用来改善已有的算法模型,要么就是首次提出用来解决一类新的问题,而逻辑回归模型恰恰属于后者,它是用来解决一类新的问题——分类(Classification)。什么是分类问题呢? 现在有两堆样本点,需要建立一个模型来对新输入的样本进行预测,判断其应该属于哪个类别,即二分类问题(Binary Classification),如图所示。线性回 2025-10-26 深度学习 #大模型 #深度学习
梯度下降与反向传播 梯度下降与反向传播 线性回归刚好是一个很简单的优化问题。 与我们将在本书中所讲到的其他大部分模型不同,线性回归的解可以用一个公式简单地表达出来, 这类解叫作解析解。像线性回归这样的简单问题存在解析解,但并不是所有的问题都存在解析解。 解析解可以进行很好的数学分析,但解析解对问题的限制很严格,导致它无法广泛应用在深度学习里。即使在我们无法得到解析解的情况下,我们仍然可以有效地训练模型。 在许多任务上 2025-10-24 深度学习 #大模型 #深度学习
线性回归 线性回归 1.线性回归模型 回归(regression)是能为一个或多个自变量与因变量之间关系建模的一类方法。 在自然科学和社会科学领域,回归经常用来表示输入和输出之间的关系。 以房价预测为例, 我们希望根据房屋的面积(平方英尺)和房龄(年)来估算房屋价格(美元)。 为了开发一个能预测房价的模型,我们需要收集一个真实的数据集。 这个数据集包括了房屋的销售价格、面积和房龄。 2025-10-24 深度学习 #大模型 #深度学习