论文理解【Vision Transformer】——【Swin Transformer】Hierarchical Vision Transformer using Shifted Windows Swin Transformer 是首个在通用视觉任务上全面超越 CNN 的 Transformer-Based 通用 CV 骨干网络。该模型借鉴 CNN 中的卷积和池化操作,将注意力计算约束在可重叠的图像patch内部,使计算复杂度与图像大小呈线性关系 2025-09-10 机器学习 > 论文理解 #CV #Transformer-Based #Vision Transformer #CV backbone
论文理解 【LLM-RL】——【EndoRM】Generalist Reward Models-Found Inside Large Language Models 本文发现任何通过标准next token prediction训练的LLM内部已隐含通用奖励模型,并基于逆强化学习提出一种从预训练模型中直接提取内生奖励函数的方法,为LLM对齐提供了新的理论基础和实践路径。 2025-09-08 机器学习 > 论文理解 #LLM-RL #LLM #RL #EndoRM
经典机器学习方法(6)——非线性支持向量机与核技巧 本文介绍非线性支持向量机(SVM)及其核技巧,包括核函数的定义与常见类型,通过映射函数解决非线性分类问题,并利用 sklearn 实现非线性SVM。 2025-09-08 机器学习 > 实践 #机器学习 #SVM #sklearn
经典机器学习方法(5)——线性支持向量机 本文介绍支持向量机(SVM)的硬间隔最大化和软间隔最大化原理,包括线性可分SVM与线性SVM的优化问题建模、对偶算法及Python实现。 2025-09-08 机器学习 > 实践 #机器学习 #SVM #sklearn
经典机器学习方法(4)——感知机 本文介绍了感知机模型的基础概念,包括其数学表达形式、学习策略和算法实现,并提供了 PyTorch 实现感知机训练的示例代码 2025-09-05 机器学习 > 实践 #机器学习 #pytorch #感知机
经典机器学习方法(3)——多层感知机 本文主要介绍了多层感知机(MLP)的基本概念、原理和实现,包括隐藏层的作用、激活函数的重要性(ReLU、Sigmoid、tanh)、多层感知机的数学表示,以及使用 PyTorch 在 Fashion-MNIST 数据集上实现多层感知机进行图像分类的完整代码示例。 2025-09-05 机器学习 > 实践 #pytorch #深度学习 #神经网络 #多层感知机
经典机器学习方法(2)——Softmax 回归 本文详细介绍了softmax回归模型,包括其原理、计算表达式、交叉熵损失函数和模型训练。通过实例展示了如何在PyTorch中实现softmax回归,以及训练过程和模型评估。此外,还探讨了为何在分类问题中使用交叉熵损失而非MSE损失的原因。 2025-09-05 机器学习 > 实践 #机器学习 #pytorch #数值回归
经典机器学习方法(1)——线性回归 本文介绍了如何使用PyTorch库从头实现线性回归,包括模型设计、数据准备、损失函数和优化算法的运用。通过实例演示了如何准备数据、构建Sequential模型、初始化参数,并使用SGD进行训练,最终展示模型预测和可视化结果。 2025-09-05 机器学习 > 实践 #机器学习 #线性回归 #pytorch