云端FFF的博客
  • 首页
  • 归档
  • 分类
  • 标签
  • 关于
论文理解【LLM-回归】——【NTL】Regress, Don‘t Guess--A Regression-like Loss on Number Tokens for Language Model

论文理解【LLM-回归】——【NTL】Regress, Don‘t Guess--A Regression-like Loss on Number Tokens for Language Model

尽管 LLM 在文本生成方面表现出色,但它们缺乏对数字的自然归纳偏置,导致在涉及数值的任务中表现不佳。本文提出了一种新的损失函数——Number Token Loss (NTL),以增强语言模型在数值任务中的表现
2025-10-16
机器学习 > 论文理解
#数值回归 #Transformer-Based
Transformess库(5)—— Datasets

Transformess库(5)—— Datasets

datasets 是一个简单易用的数据集加载库,可方便地从本地或 HF hub 加载数据集,并完成数据划分、清洗、数据集和加载器构造等工作
2025-10-08
常用库 > Transformers库
#Transformers库
Transformers库(4)—— Model

Transformers库(4)—— Model

本文介绍了 Transformers 库的 Model 组件相关 API 的用法,包括模型的基本架构、预训练模型的加载、模型的微调等
2025-10-03
常用库 > Transformers库
#Transformers库
Transformers库(3)—— Tokenizer

Transformers库(3)—— Tokenizer

本文介绍了 Transformers 库中的 Tokenizer 组件相关 API 的用法,包括其基本概念、使用方法和在不同任务中的应用。Tokenizer 是将原始字符串转换为模型可以计算的数值形式的工具
2025-10-02
常用库 > Transformers库
#Transformers库
Transformers库(2)—— Pipeline

Transformers库(2)—— Pipeline

Pipeline 是 Transformers 库的一个高层次封装类,它可以将数据预处理、模型调用、结果后处理三部分组装成流水线,为用户忽略复杂的中间过程,仅保留输入输出接口
2025-10-01
常用库 > Transformers库
#Transformers库
Transformers库(1)—— 基础介绍

Transformers库(1)—— 基础介绍

介绍 Transformers 库的基本概念
2025-10-01
常用库 > Transformers库
#Transformers库
论文理解【CV-对比学习】——【BYOL】Bootstrap Your Own Latent-A New Approach to Self-Supervised Learning

论文理解【CV-对比学习】——【BYOL】Bootstrap Your Own Latent-A New Approach to Self-Supervised Learning

BYOL通过两个神经网络的互相学习,提出了第一种无需负样本的新型自监督图像表示学习方法,且在多个基准测试中超越了当时的 SOTA
2025-09-19
机器学习 > 论文理解
#自监督预训练 #对比学习 #CV
论文理解【CV-对比学习】——【SimCLR】A Simple Framework for Contrastive Learning of Visual Representations

论文理解【CV-对比学习】——【SimCLR】A Simple Framework for Contrastive Learning of Visual Representations

SimCLR 是一种简洁的自监督对比学习方法,通过强数据增强、非线性投影头与大批量训练,在无标签条件下学习判别性表示,在线性评估与下游任务中表现优异,大幅减少对人工标注的依赖。
2025-09-15
机器学习 > 论文理解
#自监督预训练 #对比学习 #CV
论文理解【Vision Transformer】—— 【MAE】Masked Autoencoders Are Scalable Vision Learners

论文理解【Vision Transformer】—— 【MAE】Masked Autoencoders Are Scalable Vision Learners

MAE 是一种 Transformer-Based CV backbone,其核心在于使用了类似 Bert 模型的训练机制,通过高比例随机 mask 图像 patch,使用非对称 Encoder-Decoder 架构进行自监督训练重建图像,实现了高效的视觉特征学习。
2025-09-10
机器学习 > 论文理解
#自监督预训练 #CV #Transformer-Based #Vision Transformer
论文理解【Vision Transformer】——【VIT】An Image is Worth 16x16 Words-Transformers for Image Recognition at Scale

论文理解【Vision Transformer】——【VIT】An Image is Worth 16x16 Words-Transformers for Image Recognition at Scale

VIT将图像切分成16x16的patch块,通过标准Transformer进行图像分类,在引入尽量少图像归纳偏置的情况下,验证了纯Transformer在图像分类任务中的有效性,为CV和NLP的模型统一奠定基础。
2025-09-10
机器学习 > 论文理解
#CV #Transformer-Based #Vision Transformer #CV backbone
1234

搜索

Hexo Fluid