今日推介(第1727期):预训练中的实体频率会导致LLM对逻辑等价事实识别的不对称、利用专家混合冗余释放多模态生成能力、推荐之前先思考:释放序列推荐的潜在推理能力、推理时对齐的覆盖率扩展性和最优性、用Sharpe比率引导的主动学习改进RLHF偏好优化 公·众·号:爱可可爱生活
网页链接
#机器学习#
#人工智能#
#论文#