gpt2

2025-03-09 GPT2 Transformer 自注意力机制 自动回归模型 词嵌入

GPT2基于Transformer的decoder组件,采用自回归模型逐token生成文本。通过词嵌入、位置嵌入和多层Transformer块(含自注意力机制和前馈神经网络)处理输入,最终输出词的概率分布。自注意力机制通过Query、Key、Value向量计算词间相关性,增强上下文理解。

阅读全文

Lec22

2025-03-09 元学习 深度学习 强化学习 少样本学习 多任务学习

...

阅读全文

Note4GPT2

2025-03-09 GPT2 Transformer 自注意力机制 自动回归模型 词嵌入

GPT2基于Transformer的decoder组件,采用自回归模型逐token生成文本。通过词嵌入、位置嵌入和多层Transformer块(含自注意力机制和前馈神经网络)处理输入,最终输出词的概率分布。自注意力机制通过Query、Key、Value向量理解上下文,增强模型对语境的理解。

阅读全文

南京之歌

2025-03-09 南京 历史 城市生活 诗歌 情感表达

《南京之歌》通过描绘南京的历史遗迹、城市生活和自然景观,表达了对南京深厚的情感与归属感,展现了在这座城市中找到方向、希望和家的温暖。

阅读全文

南京邮电大学之歌

2025-03-09 南京邮电大学 校园生活 青春记忆 校友情谊 校园文化

《南京邮电大学之歌》以幽默贴吧风格描绘了南邮学子在校园中的生活点滴,展现了他们在图书馆、实验室、食堂和操场的青春岁月,强调了南邮精神与老哥们情谊的永恒传承。

阅读全文

强化学习教程

2025-03-09 强化学习 机器学习 智能体 Q学习 深度Q网络

本教程详细介绍了强化学习的基本概念、分类、算法、应用场景、挑战和未来发展方向,帮助读者全面了解这一重要的机器学习分支。

阅读全文

强化学习发展史

None 强化学习 机器学习 深度强化学习 Q学习 人工智能

强化学习的起源可以追溯到20世纪50年代,当时心理学家和计算机科学家开始研究如何通过试错法来训练机器。1951年,马文·明斯基(Marvin Minsky)在他的博士论文中首次提出了"强化"的概念。1957年,理查德·贝尔曼(Richard Bellman)提出了动态规划(Dynamic Programming),这为后来的强化学习算法奠定了基础。...

阅读全文

星辰之巅

None 星辰 武侠 修仙 玄幻

在这个浩瀚的星空之下,每个人都有一个属于自己的星辰梦想。这是一个关于追逐星辰、突破极限的故事。...

阅读全文

玄幻小说:李三的传奇

None 玄幻小说 李三传奇 成长历程 九天玄功 巅峰对决

在一个充满神秘与奇幻的世界里,李三,一个平凡的少年,因一次偶然的机遇,踏上了成为传奇的旅程。本文将深入探讨李三的成长历程,揭示他如何从一个无名小卒成长为一代宗师,并通过具体的例子和数据,展现他的非凡成就。...

阅读全文