<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>Note - Tag - Kiraa</title>
    <link>https://kiraa-blog.vercel.app/tags/note/</link>
    <description>Kiraa</description>
    <generator>Hugo 0.147.7 &amp; FixIt v0.4.3-20260123080729-2a5bd268</generator>
    <language>zh-cn</language>
    <lastBuildDate>Fri, 13 Feb 2026 00:00:00 +0000</lastBuildDate>
    <atom:link href="https://kiraa-blog.vercel.app/tags/note/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>HSTU Embedding 学习笔记</title>
      <link>https://kiraa-blog.vercel.app/post/hstu-embedding/</link>
      <pubDate>Fri, 13 Feb 2026 00:00:00 +0000</pubDate>
      <guid>https://kiraa-blog.vercel.app/post/hstu-embedding/</guid>
      <description>&lt;h2 class=&#34;heading-element&#34; id=&#34;torchrec&#34;&gt;&lt;span&gt;Torchrec&lt;/span&gt;&#xA;  &lt;a href=&#34;#torchrec&#34; class=&#34;heading-mark&#34;&gt;&#xA;    &lt;svg class=&#34;octicon octicon-link&#34; viewBox=&#34;0 0 16 16&#34; version=&#34;1.1&#34; width=&#34;16&#34; height=&#34;16&#34; aria-hidden=&#34;true&#34;&gt;&lt;path d=&#34;m7.775 3.275 1.25-1.25a3.5 3.5 0 1 1 4.95 4.95l-2.5 2.5a3.5 3.5 0 0 1-4.95 0 .751.751 0 0 1 .018-1.042.751.751 0 0 1 1.042-.018 1.998 1.998 0 0 0 2.83 0l2.5-2.5a2.002 2.002 0 0 0-2.83-2.83l-1.25 1.25a.751.751 0 0 1-1.042-.018.751.751 0 0 1-.018-1.042Zm-4.69 9.64a1.998 1.998 0 0 0 2.83 0l1.25-1.25a.751.751 0 0 1 1.042.018.751.751 0 0 1 .018 1.042l-1.25 1.25a3.5 3.5 0 1 1-4.95-4.95l2.5-2.5a3.5 3.5 0 0 1 4.95 0 .751.751 0 0 1-.018 1.042.751.751 0 0 1-1.042.018 1.998 1.998 0 0 0-2.83 0l-2.5 2.5a1.998 1.998 0 0 0 0 2.83Z&#34;&gt;&lt;/path&gt;&lt;/svg&gt;&#xA;  &lt;/a&gt;&#xA;&lt;/h2&gt;&lt;h3 class=&#34;heading-element&#34; id=&#34;数据结构&#34;&gt;&lt;span&gt;数据结构&lt;/span&gt;&#xA;  &lt;a href=&#34;#%e6%95%b0%e6%8d%ae%e7%bb%93%e6%9e%84&#34; class=&#34;heading-mark&#34;&gt;&#xA;    &lt;svg class=&#34;octicon octicon-link&#34; viewBox=&#34;0 0 16 16&#34; version=&#34;1.1&#34; width=&#34;16&#34; height=&#34;16&#34; aria-hidden=&#34;true&#34;&gt;&lt;path d=&#34;m7.775 3.275 1.25-1.25a3.5 3.5 0 1 1 4.95 4.95l-2.5 2.5a3.5 3.5 0 0 1-4.95 0 .751.751 0 0 1 .018-1.042.751.751 0 0 1 1.042-.018 1.998 1.998 0 0 0 2.83 0l2.5-2.5a2.002 2.002 0 0 0-2.83-2.83l-1.25 1.25a.751.751 0 0 1-1.042-.018.751.751 0 0 1-.018-1.042Zm-4.69 9.64a1.998 1.998 0 0 0 2.83 0l1.25-1.25a.751.751 0 0 1 1.042.018.751.751 0 0 1 .018 1.042l-1.25 1.25a3.5 3.5 0 1 1-4.95-4.95l2.5-2.5a3.5 3.5 0 0 1 4.95 0 .751.751 0 0 1-.018 1.042.751.751 0 0 1-1.042.018 1.998 1.998 0 0 0-2.83 0l-2.5 2.5a1.998 1.998 0 0 0 0 2.83Z&#34;&gt;&lt;/path&gt;&lt;/svg&gt;&#xA;  &lt;/a&gt;&#xA;&lt;/h3&gt;&lt;h4 class=&#34;heading-element&#34; id=&#34;jaggedtensor-jt&#34;&gt;&lt;span&gt;&lt;a href=&#34;https://meta-pytorch.org/torchrec/datatypes-api-reference.html#torchrec.sparse.jagged_tensor.JaggedTensor&#34; target=&#34;_blank&#34; rel=&#34;external nofollow noopener noreferrer&#34;&gt;&lt;code&gt;JaggedTensor&lt;/code&gt;&lt;/a&gt; (&lt;code&gt;jt&lt;/code&gt;)&lt;/span&gt;&#xA;  &lt;a href=&#34;#jaggedtensor-jt&#34; class=&#34;heading-mark&#34;&gt;&#xA;    &lt;svg class=&#34;octicon octicon-link&#34; viewBox=&#34;0 0 16 16&#34; version=&#34;1.1&#34; width=&#34;16&#34; height=&#34;16&#34; aria-hidden=&#34;true&#34;&gt;&lt;path d=&#34;m7.775 3.275 1.25-1.25a3.5 3.5 0 1 1 4.95 4.95l-2.5 2.5a3.5 3.5 0 0 1-4.95 0 .751.751 0 0 1 .018-1.042.751.751 0 0 1 1.042-.018 1.998 1.998 0 0 0 2.83 0l2.5-2.5a2.002 2.002 0 0 0-2.83-2.83l-1.25 1.25a.751.751 0 0 1-1.042-.018.751.751 0 0 1-.018-1.042Zm-4.69 9.64a1.998 1.998 0 0 0 2.83 0l1.25-1.25a.751.751 0 0 1 1.042.018.751.751 0 0 1 .018 1.042l-1.25 1.25a3.5 3.5 0 1 1-4.95-4.95l2.5-2.5a3.5 3.5 0 0 1 4.95 0 .751.751 0 0 1-.018 1.042.751.751 0 0 1-1.042.018 1.998 1.998 0 0 0-2.83 0l-2.5 2.5a1.998 1.998 0 0 0 0 2.83Z&#34;&gt;&lt;/path&gt;&lt;/svg&gt;&#xA;  &lt;/a&gt;&#xA;&lt;/h4&gt;&lt;p&gt;&amp;ldquo;Jagged&amp;rdquo; 的意思是 &amp;ldquo;锯齿状的&amp;rdquo;，顾名思义，这种 Tensor 每一行的长度不一，可以将长度差异大的特征高效存储为一个 batch，避免 padding 造成资源浪费。如，可以将不同用户的交互历史作为一个 batch，放进 &lt;code&gt;JaggedTensor&lt;/code&gt; 中存储。&lt;/p&gt;</description>
    </item>
    <item>
      <title>OneRev V2 学习笔记</title>
      <link>https://kiraa-blog.vercel.app/post/learning_onerevv2/</link>
      <pubDate>Fri, 06 Feb 2026 00:00:00 +0000</pubDate>
      <guid>https://kiraa-blog.vercel.app/post/learning_onerevv2/</guid>
      <description>&lt;h1 class=&#34;heading-element&#34; id=&#34;onerec-v2&#34;&gt;&lt;span&gt;OneRec V2&lt;/span&gt;&#xA;  &lt;a href=&#34;#onerec-v2&#34; class=&#34;heading-mark&#34;&gt;&#xA;    &lt;svg class=&#34;octicon octicon-link&#34; viewBox=&#34;0 0 16 16&#34; version=&#34;1.1&#34; width=&#34;16&#34; height=&#34;16&#34; aria-hidden=&#34;true&#34;&gt;&lt;path d=&#34;m7.775 3.275 1.25-1.25a3.5 3.5 0 1 1 4.95 4.95l-2.5 2.5a3.5 3.5 0 0 1-4.95 0 .751.751 0 0 1 .018-1.042.751.751 0 0 1 1.042-.018 1.998 1.998 0 0 0 2.83 0l2.5-2.5a2.002 2.002 0 0 0-2.83-2.83l-1.25 1.25a.751.751 0 0 1-1.042-.018.751.751 0 0 1-.018-1.042Zm-4.69 9.64a1.998 1.998 0 0 0 2.83 0l1.25-1.25a.751.751 0 0 1 1.042.018.751.751 0 0 1 .018 1.042l-1.25 1.25a3.5 3.5 0 1 1-4.95-4.95l2.5-2.5a3.5 3.5 0 0 1 4.95 0 .751.751 0 0 1-.018 1.042.751.751 0 0 1-1.042.018 1.998 1.998 0 0 0-2.83 0l-2.5 2.5a1.998 1.998 0 0 0 0 2.83Z&#34;&gt;&lt;/path&gt;&lt;/svg&gt;&#xA;  &lt;/a&gt;&#xA;&lt;/h1&gt;&lt;h2 class=&#34;heading-element&#34; id=&#34;kuaishou-onerec-family&#34;&gt;&lt;span&gt;Kuaishou OneRec Family&lt;/span&gt;&#xA;  &lt;a href=&#34;#kuaishou-onerec-family&#34; class=&#34;heading-mark&#34;&gt;&#xA;    &lt;svg class=&#34;octicon octicon-link&#34; viewBox=&#34;0 0 16 16&#34; version=&#34;1.1&#34; width=&#34;16&#34; height=&#34;16&#34; aria-hidden=&#34;true&#34;&gt;&lt;path d=&#34;m7.775 3.275 1.25-1.25a3.5 3.5 0 1 1 4.95 4.95l-2.5 2.5a3.5 3.5 0 0 1-4.95 0 .751.751 0 0 1 .018-1.042.751.751 0 0 1 1.042-.018 1.998 1.998 0 0 0 2.83 0l2.5-2.5a2.002 2.002 0 0 0-2.83-2.83l-1.25 1.25a.751.751 0 0 1-1.042-.018.751.751 0 0 1-.018-1.042Zm-4.69 9.64a1.998 1.998 0 0 0 2.83 0l1.25-1.25a.751.751 0 0 1 1.042.018.751.751 0 0 1 .018 1.042l-1.25 1.25a3.5 3.5 0 1 1-4.95-4.95l2.5-2.5a3.5 3.5 0 0 1 4.95 0 .751.751 0 0 1-.018 1.042.751.751 0 0 1-1.042.018 1.998 1.998 0 0 0-2.83 0l-2.5 2.5a1.998 1.998 0 0 0 0 2.83Z&#34;&gt;&lt;/path&gt;&lt;/svg&gt;&#xA;  &lt;/a&gt;&#xA;&lt;/h2&gt;&lt;div class=&#34;table-wrapper&#34;&gt;&#xA;  &lt;table&gt;&#xA;    &lt;thead&gt;&#xA;        &lt;tr&gt;&#xA;            &lt;th&gt;&lt;strong&gt;版本&lt;/strong&gt;&lt;/th&gt;&#xA;            &lt;th&gt;&lt;strong&gt;论文/报告标题&lt;/strong&gt;&lt;/th&gt;&#xA;            &lt;th&gt;&lt;strong&gt;发布时间 (arXiv)&lt;/strong&gt;&lt;/th&gt;&#xA;            &lt;th&gt;&lt;strong&gt;核心架构&lt;/strong&gt;&lt;/th&gt;&#xA;            &lt;th&gt;&lt;strong&gt;解决的关键痛点&lt;/strong&gt;&lt;/th&gt;&#xA;        &lt;/tr&gt;&#xA;    &lt;/thead&gt;&#xA;    &lt;tbody&gt;&#xA;        &lt;tr&gt;&#xA;            &lt;td&gt;&lt;strong&gt;OneRec V1&lt;/strong&gt;&lt;/td&gt;&#xA;            &lt;td&gt;&lt;em&gt;&lt;a href=&#34;https://arxiv.org/abs/2506.13695&#34; target=&#34;_blank&#34; rel=&#34;external nofollow noopener noreferrer&#34;&gt;OneRec Technical Report&lt;/a&gt;&lt;/em&gt;&lt;/td&gt;&#xA;            &lt;td&gt;2025. 06&lt;/td&gt;&#xA;            &lt;td&gt;&lt;strong&gt;Encoder-Decoder&lt;/strong&gt;&lt;/td&gt;&#xA;            &lt;td&gt;&lt;strong&gt;范式验证&lt;/strong&gt;：证明了“推荐”可以重构为“生成”任务。&lt;/td&gt;&#xA;        &lt;/tr&gt;&#xA;        &lt;tr&gt;&#xA;            &lt;td&gt;&lt;strong&gt;OneRec V2&lt;/strong&gt;&lt;/td&gt;&#xA;            &lt;td&gt;&lt;em&gt;&lt;a href=&#34;https://arxiv.org/abs/2508.20900&#34; target=&#34;_blank&#34; rel=&#34;external nofollow noopener noreferrer&#34;&gt;OneRec-V2 Technical Report&lt;/a&gt;&lt;/em&gt;&lt;/td&gt;&#xA;            &lt;td&gt;2025. 08&lt;/td&gt;&#xA;            &lt;td&gt;&lt;strong&gt;Lazy Decoder-Only&lt;/strong&gt;&lt;/td&gt;&#xA;            &lt;td&gt;&lt;strong&gt;计算效率&lt;/strong&gt;：解决 V1 编码太慢的问题，实现工业级低延迟。&lt;/td&gt;&#xA;        &lt;/tr&gt;&#xA;        &lt;tr&gt;&#xA;            &lt;td&gt;&lt;strong&gt;OneRec-Think&lt;/strong&gt;&lt;/td&gt;&#xA;            &lt;td&gt;&lt;em&gt;&lt;a href=&#34;https://arxiv.org/abs/2510.11639&#34; target=&#34;_blank&#34; rel=&#34;external nofollow noopener noreferrer&#34;&gt;OneRec-Think: In-Text Reasoning for Generative Recommendation&lt;/a&gt;&lt;/em&gt;&lt;/td&gt;&#xA;            &lt;td&gt;2025. 10&lt;/td&gt;&#xA;            &lt;td&gt;&lt;strong&gt;Think-Ahead (CoT)&lt;/strong&gt;&lt;/td&gt;&#xA;            &lt;td&gt;&lt;strong&gt;深度理解&lt;/strong&gt;：让模型在推荐前先“思考”理由，增强可解释性。&lt;/td&gt;&#xA;        &lt;/tr&gt;&#xA;        &lt;tr&gt;&#xA;            &lt;td&gt;&lt;strong&gt;OpenOneRec&lt;/strong&gt;&lt;/td&gt;&#xA;            &lt;td&gt;&lt;em&gt;&lt;a href=&#34;https://arxiv.org/abs/2512.24762&#34; target=&#34;_blank&#34; rel=&#34;external nofollow noopener noreferrer&#34;&gt;OpenOneRec Technical Report&lt;/a&gt;&lt;/em&gt;&lt;/td&gt;&#xA;            &lt;td&gt;2025. 12&lt;/td&gt;&#xA;            &lt;td&gt;&lt;strong&gt;Qwen-based&lt;/strong&gt;&lt;/td&gt;&#xA;            &lt;td&gt;&lt;strong&gt;开源与通用&lt;/strong&gt;：打破数据孤岛，发布基础模型。&lt;/td&gt;&#xA;        &lt;/tr&gt;&#xA;    &lt;/tbody&gt;&#xA;  &lt;/table&gt;&#xA;&lt;/div&gt;&lt;p&gt;分为两组：&lt;/p&gt;</description>
    </item>
    <item>
      <title>qwen3-0.6B 学习笔记</title>
      <link>https://kiraa-blog.vercel.app/post/learning-qwen3-0.6b/</link>
      <pubDate>Fri, 30 Jan 2026 00:00:00 +0000</pubDate>
      <guid>https://kiraa-blog.vercel.app/post/learning-qwen3-0.6b/</guid>
      <description>&lt;h2 class=&#34;heading-element&#34; id=&#34;0-qwen3-technical-report&#34;&gt;&lt;span&gt;0 Qwen3 Technical Report&lt;/span&gt;&#xA;  &lt;a href=&#34;#0-qwen3-technical-report&#34; class=&#34;heading-mark&#34;&gt;&#xA;    &lt;svg class=&#34;octicon octicon-link&#34; viewBox=&#34;0 0 16 16&#34; version=&#34;1.1&#34; width=&#34;16&#34; height=&#34;16&#34; aria-hidden=&#34;true&#34;&gt;&lt;path d=&#34;m7.775 3.275 1.25-1.25a3.5 3.5 0 1 1 4.95 4.95l-2.5 2.5a3.5 3.5 0 0 1-4.95 0 .751.751 0 0 1 .018-1.042.751.751 0 0 1 1.042-.018 1.998 1.998 0 0 0 2.83 0l2.5-2.5a2.002 2.002 0 0 0-2.83-2.83l-1.25 1.25a.751.751 0 0 1-1.042-.018.751.751 0 0 1-.018-1.042Zm-4.69 9.64a1.998 1.998 0 0 0 2.83 0l1.25-1.25a.751.751 0 0 1 1.042.018.751.751 0 0 1 .018 1.042l-1.25 1.25a3.5 3.5 0 1 1-4.95-4.95l2.5-2.5a3.5 3.5 0 0 1 4.95 0 .751.751 0 0 1-.018 1.042.751.751 0 0 1-1.042.018 1.998 1.998 0 0 0-2.83 0l-2.5 2.5a1.998 1.998 0 0 0 0 2.83Z&#34;&gt;&lt;/path&gt;&lt;/svg&gt;&#xA;  &lt;/a&gt;&#xA;&lt;/h2&gt;&lt;blockquote&gt;&#xA;&lt;p&gt;原文: &lt;a href=&#34;https://arxiv.org/pdf/2505.09388&#34; target=&#34;_blank&#34; rel=&#34;external nofollow noopener noreferrer&#34;&gt;Qwen3 Technical Report&lt;/a&gt;&lt;/p&gt;&lt;/blockquote&gt;&#xA;&lt;p&gt;Qwen3 稠密模型与 Qwen2.5 相似，共同特点是：&lt;/p&gt;&#xA;&lt;ol&gt;&#xA;&lt;li&gt;分组查询头 (Grouped Query Attention, GQA) ，即多个 Q-head 共享同一组 KV 。&lt;/li&gt;&#xA;&lt;li&gt;SwiGLU，替代了传统 transformer 中简单的 MLP 。&lt;/li&gt;&#xA;&lt;li&gt;旋转位置编码 (Rotary Positional Embeddings, ROPE) ，用于对 Q-head 和 K-head 注入位置信息。&lt;/li&gt;&#xA;&lt;li&gt;RMSNorm，均方根归一化。&lt;/li&gt;&#xA;&lt;li&gt;pre-norm，主要是针对残差连接的。数据输入后，先归一化，再进入模块计算，最后加上原始输入。与之相对的是 post-norm，表示数据输入后，先进入模块计算，再加上原始输入，最后统一归一化。pre-norm 可以避免训练时梯度消失。&lt;/li&gt;&#xA;&lt;/ol&gt;&#xA;&lt;p&gt;不同点：&lt;/p&gt;</description>
    </item>
    <item>
      <title>OpenOneRec 论文阅读笔记</title>
      <link>https://kiraa-blog.vercel.app/post/learning_openonerec/</link>
      <pubDate>Wed, 28 Jan 2026 00:00:00 +0000</pubDate>
      <guid>https://kiraa-blog.vercel.app/post/learning_openonerec/</guid>
      <description>&lt;h2 class=&#34;heading-element&#34; id=&#34;0&#34;&gt;&lt;span&gt;0&lt;/span&gt;&#xA;  &lt;a href=&#34;#0&#34; class=&#34;heading-mark&#34;&gt;&#xA;    &lt;svg class=&#34;octicon octicon-link&#34; viewBox=&#34;0 0 16 16&#34; version=&#34;1.1&#34; width=&#34;16&#34; height=&#34;16&#34; aria-hidden=&#34;true&#34;&gt;&lt;path d=&#34;m7.775 3.275 1.25-1.25a3.5 3.5 0 1 1 4.95 4.95l-2.5 2.5a3.5 3.5 0 0 1-4.95 0 .751.751 0 0 1 .018-1.042.751.751 0 0 1 1.042-.018 1.998 1.998 0 0 0 2.83 0l2.5-2.5a2.002 2.002 0 0 0-2.83-2.83l-1.25 1.25a.751.751 0 0 1-1.042-.018.751.751 0 0 1-.018-1.042Zm-4.69 9.64a1.998 1.998 0 0 0 2.83 0l1.25-1.25a.751.751 0 0 1 1.042.018.751.751 0 0 1 .018 1.042l-1.25 1.25a3.5 3.5 0 1 1-4.95-4.95l2.5-2.5a3.5 3.5 0 0 1 4.95 0 .751.751 0 0 1-.018 1.042.751.751 0 0 1-1.042.018 1.998 1.998 0 0 0-2.83 0l-2.5 2.5a1.998 1.998 0 0 0 0 2.83Z&#34;&gt;&lt;/path&gt;&lt;/svg&gt;&#xA;  &lt;/a&gt;&#xA;&lt;/h2&gt;&lt;blockquote&gt;&#xA;&lt;p&gt;原文：&lt;a href=&#34;https://arxiv.org/abs/2512.24762&#34; target=&#34;_blank&#34; rel=&#34;external nofollow noopener noreferrer&#34;&gt;OpenOneRec Technical Report&lt;/a&gt;&lt;/p&gt;&lt;/blockquote&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;尽管 OneRec 系列已将散乱的推荐算法 pipeline 统一成了一个 end-to-end 的推荐系统框架。但是推荐系统和生成式智能之间仍然有 a huge gap: &lt;strong&gt;Isolated Data (孤立数据)&lt;/strong&gt;.&lt;/p&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&#xA;&lt;p&gt;Isolated Data 可以理解为推荐系统和生成式智能在数据使用上的差异。推荐系统中的数据，如用户行为数据、物品属性数据等，这些数据往往是结构化的、离散的，并且与具体的推荐任务紧密相关，重要的是缺乏相关的语义信息。同时也可以指不同平台之间的数据隔离。&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
