新昆仑万维推出Skywork-Reward-V2:小模型也能挑战大模型的奖励模型新标杆近日,昆仑万维正式发布第二代奖励模型系列 Skywork-Reward-V2,这一系列模型以“小而强”为核心理念,通过创新的数据构建方法和高效的训练策略,在多个主流评测基准上全面超越现有开源模型,甚至...AI新闻资讯# GitHub# HuggingFace# RLHF03640