云端FFF的博客
  • 首页
  • 归档
  • 分类
  • 标签
  • 关于
论文理解【LLM-OR】——【Step-Opt】Training LLMs for Optimization Modeling via Iterative Data Synthesis and

论文理解【LLM-OR】——【Step-Opt】Training LLMs for Optimization Modeling via Iterative Data Synthesis and

Step-opt 是一种针对 LLM 求解运筹优化任务的数据增强框架,其通过用迭代问题生成 + 分步验证机制实现更可靠的训练数据合成,并微调开源 LLM 得到 Step-Opt,在多个 OR 建模基准提升性能,尤其在复杂问题上提升更明显
2026-01-31
机器学习 > 论文理解
#LLM #LLM-OR
论文理解【LLM-OR】—— 【PaMOP】Guiding large language models in modeling optimization problems via question partitioning

论文理解【LLM-OR】—— 【PaMOP】Guiding large language models in modeling optimization problems via question partitioning

针对 LLM 求解运筹优化任务,PaMOP 通过约束划分树分离子问题,实现复杂优化问题的分块建模,降低子任务复杂度;结合求解器反馈与反向翻译一致性检查迭代纠错,实现建模逻辑错误识别与纠正,提升了建模准确性。
2026-01-25
机器学习 > 论文理解
#LLM #LLM-OR
论文理解【LLM-OR】——【ORLM】Training Large Language Models for Optimization Modeling

论文理解【LLM-OR】——【ORLM】Training Large Language Models for Optimization Modeling

LLM 有能力将自然语言描述的工业场景问题建模为数学运筹优化问题,然后通过写代码调用经典求解器的方式加以解决。本文提出的 ORLM 方法主要关注如何合成数据来训练或微调这种领域模型
2025-12-29
机器学习 > 论文理解
#LLM #LLM-OR
论文理解【LLM-OR】——【OptiTree】Hierarchical thoughts generation with tree search for LLM optimization model

论文理解【LLM-OR】——【OptiTree】Hierarchical thoughts generation with tree search for LLM optimization model

使用 LLM 对运筹优化问题(OR Problem)建模时,传统固定步骤分解在复杂数学结构下准确率低,本文提出 OptiTree:基于“子问题层级建模树”的树搜索检索,自适应地将原问题分解为一串更简单的子问题,并递归整合各子问题的高层建模思路形成全局指导,从而显著提升建模准确率
2025-12-29
机器学习 > 论文理解
#LLM #LLM-OR
LLM-RL的探索困境

LLM-RL的探索困境

分析 Policy-Gradient RL 等可微代理优化方法在平衡探索和利用时的先天特性,说明 LLM-RL 的困境本质:探索不足导致陷入局部最优
2025-12-20
数学杂烩
#LLM-RL #LLM #RL
论文理解 【LLM-RL】—— Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model

论文理解 【LLM-RL】—— Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model

本文系统评估了 RLVR 在提升 LLM 推理能力方面的实际效果。发现当前RLVR方法主要提高了基座模型已有推理路径的采样效率,但并未创造新的推理模式。相比之下,蒸馏方法能真正扩展模型推理能力。研究呼吁开发新的RL范式。
2025-12-14
机器学习 > 论文理解
#LLM-RL #LLM #RL
小目标检测的尺寸极限

小目标检测的尺寸极限

本文从统计检测理论出发,建立了小目标检测问题的数学模型。通过将检测问题形式化为二元假设检验,推导出基于KL散度的可检测性度量,为小目标检测限提供了量化依据
2025-11-02
数学杂烩
#小目标检测
Wasserstein 距离简介

Wasserstein 距离简介

Wasserstein距离是一种基于最优传输思想的概率分布度量方法,本文介绍了其定义、一维情况下基于CDF的计算方法和与CRPS损失的关系
2025-11-02
数学杂烩
#距离度量 #Wasserstein距离
论文理解【LLM-回归】—— Decoding-based Regression

论文理解【LLM-回归】—— Decoding-based Regression

本文探讨了LLM使用的自回归解码式生成方法在数值回归任务中的能力,证明其可逼近任意一维概率密度的理论界,在数值范围大、噪声复杂或数据较少的情形相比传统点回归头和 Riemann 回归头有优势
2025-10-16
机器学习 > 论文理解
#数值回归 #Transformer-Based
论文理解【LLM-回归】——【RAFT】Better autoregressive regression with LLMs via regression-aware fine-tuning

论文理解【LLM-回归】——【RAFT】Better autoregressive regression with LLMs via regression-aware fine-tuning

RAFT 方法通过对候选网格数值的概率加权期望直接优化均方误差,将回归损失直接融入解码式LLM的训练中,从而同时保留自回归预训练的优势并利用数值目标的特性,在多项自然语言回归任务中显著优于传统交叉熵微调和预测头方法
2025-10-16
机器学习 > 论文理解
#数值回归 #Transformer-Based
1234

搜索

Hexo Fluid