云端fff的博客

论文理解【LLM-OR】——【Step-Opt】Training LLMs for Optimization Modeling via Iterative Data Synthesis and

论文理解【LLM-OR】——【Step-Opt】Training LLMs for Optimization Modeling via Iterative Data Synthesis and

Step-opt 是一种针对 LLM 求解运筹优化任务的数据增强框架，其通过用迭代问题生成 + 分步验证机制实现更可靠的训练数据合成，并微调开源 LLM 得到 Step-Opt，在多个 OR 建模基准提升性能，尤其在复杂问题上提升更明显

2026-01-31

机器学习 > 论文理解

#LLM #LLM-OR

论文理解【LLM-OR】—— 【PaMOP】Guiding large language models in modeling optimization problems via question partitioning

论文理解【LLM-OR】—— 【PaMOP】Guiding large language models in modeling optimization problems via question partitioning

针对 LLM 求解运筹优化任务，PaMOP 通过约束划分树分离子问题，实现复杂优化问题的分块建模，降低子任务复杂度；结合求解器反馈与反向翻译一致性检查迭代纠错，实现建模逻辑错误识别与纠正，提升了建模准确性。

2026-01-25

机器学习 > 论文理解

#LLM #LLM-OR

论文理解【LLM-OR】——【ORLM】Training Large Language Models for Optimization Modeling

论文理解【LLM-OR】——【ORLM】Training Large Language Models for Optimization Modeling

LLM 有能力将自然语言描述的工业场景问题建模为数学运筹优化问题，然后通过写代码调用经典求解器的方式加以解决。本文提出的 ORLM 方法主要关注如何合成数据来训练或微调这种领域模型

2025-12-29

机器学习 > 论文理解

#LLM #LLM-OR

论文理解【LLM-OR】——【OptiTree】Hierarchical thoughts generation with tree search for LLM optimization model

论文理解【LLM-OR】——【OptiTree】Hierarchical thoughts generation with tree search for LLM optimization model

使用 LLM 对运筹优化问题（OR Problem）建模时，传统固定步骤分解在复杂数学结构下准确率低，本文提出 OptiTree：基于“子问题层级建模树”的树搜索检索，自适应地将原问题分解为一串更简单的子问题，并递归整合各子问题的高层建模思路形成全局指导，从而显著提升建模准确率

2025-12-29

机器学习 > 论文理解

#LLM #LLM-OR

LLM-RL的探索困境

LLM-RL的探索困境

分析 Policy-Gradient RL 等可微代理优化方法在平衡探索和利用时的先天特性，说明 LLM-RL 的困境本质：探索不足导致陷入局部最优

2025-12-20

数学杂烩

#LLM-RL #LLM #RL

论文理解【LLM-RL】—— Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model

论文理解【LLM-RL】—— Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model

本文系统评估了 RLVR 在提升 LLM 推理能力方面的实际效果。发现当前RLVR方法主要提高了基座模型已有推理路径的采样效率，但并未创造新的推理模式。相比之下，蒸馏方法能真正扩展模型推理能力。研究呼吁开发新的RL范式。

2025-12-14

机器学习 > 论文理解

#LLM-RL #LLM #RL

小目标检测的尺寸极限

小目标检测的尺寸极限

本文从统计检测理论出发，建立了小目标检测问题的数学模型。通过将检测问题形式化为二元假设检验，推导出基于KL散度的可检测性度量，为小目标检测限提供了量化依据

2025-11-02

数学杂烩

#小目标检测

Wasserstein 距离简介

Wasserstein 距离简介

Wasserstein距离是一种基于最优传输思想的概率分布度量方法，本文介绍了其定义、一维情况下基于CDF的计算方法和与CRPS损失的关系

2025-11-02

数学杂烩

#距离度量 #Wasserstein距离

论文理解【LLM-回归】—— Decoding-based Regression

论文理解【LLM-回归】—— Decoding-based Regression

本文探讨了LLM使用的自回归解码式生成方法在数值回归任务中的能力，证明其可逼近任意一维概率密度的理论界，在数值范围大、噪声复杂或数据较少的情形相比传统点回归头和 Riemann 回归头有优势

2025-10-16

机器学习 > 论文理解

#数值回归 #Transformer-Based

论文理解【LLM-回归】——【RAFT】Better autoregressive regression with LLMs via regression-aware fine-tuning

论文理解【LLM-回归】——【RAFT】Better autoregressive regression with LLMs via regression-aware fine-tuning

RAFT 方法通过对候选网格数值的概率加权期望直接优化均方误差，将回归损失直接融入解码式LLM的训练中，从而同时保留自回归预训练的优势并利用数值目标的特性，在多项自然语言回归任务中显著优于传统交叉熵微调和预测头方法

2025-10-16

机器学习 > 论文理解

#数值回归 #Transformer-Based