第四十二章 AI智能研讨会(二)(1/2)
威廉姆斯博士微微前倾:“谄媚现象的本质,是模型在训练过程中过度拟合了‘用户偏好’这个变量。”
“陈雅,你们的模型在微调阶段,是不是用了大量的用户反馈数据?”
陈雅点头:“是的。我们收集了数百万条用户对回答的满意度评分,用来优化模型的回答方向。”
“但问题就在这里——用户点赞的回答,并不一定‘正确’,只是‘符合预期’。”
陆彬放下笔:“符合预期,不等于符合事实。”
“对。”陈雅接过话头,“比如用户问‘这家餐厅好不好吃’,如果模型给出一个中立的回答——‘口味因人而异,建议参考具体评价’——用户可能会觉得没用。”
“但如果模型说‘这家餐厅非常棒,推荐尝试’——用户更容易点击‘有用’。模型学到的,不是‘真实性’,而是‘讨好用户’。”
王峰补充:“这和我们之前提到的数据标注偏差是同一个逻辑。”
“模型在追求用户满意度时,会牺牲客观性。它不是‘判断’,是‘迎合’。”
威廉姆斯博士看向陈雅:“解决方案不是不用用户反馈,而是要把‘事实一致性’作为独立指标,和用户满意度一起参与优化。”
“你们可以设计一组基准测试题,这些题的标准答案是已知的,用它们来监控模型在谄媚倾向上的偏移。”
陈雅若有所思地点了点头。
威廉姆斯博士接着说:“今天的研讨会很有意义。”
“我们科研人员大胆发言、提出问题、互相交流。”
“希望大家在今后的工作中也能保持沟通,遇到科研难题时,我们一起集思广益来攻克。”
“
陆彬刚准备站起来,威廉姆斯博士说:“董事长请坐下讲话!”
陆彬与左右两位专家碰了一下头,开始讲话:“很高兴参加今天上午的AI智能研讨会。”
“各位专家的精彩发言,让我深受启发。”
“科研方面我是外行,我的工作就是协调资源、当好大家的勤务员,鼓励全公司员工多干活。”
“但我也不是资本家,不会辜负每一位员工的付出。”
只有我们一起把活干好了,公司才能有源源不断的现金流,确保正常运转。”
“无论外部环境如何变化,只要我们公司内部拥有核心竞争力,就能够抵御外部风险的侵袭。”
“国际移动互联网股份公司是一家大型研发型企业,我们的研发工程师接近三十万人,每年有上千项科技发明需要转化应用。”
“但我们的科技研发不能脱离五大板块产业。”
“只有把五大板块产业做到行业标杆,国际移动互联网股份公司才能屹立不倒。”
“我们也要有居安思危的前瞻意识。即便黑天鹅哪天飞来,我们也能从容应对。”
“这一切,都需要全公司共同努力,迎接各种环境的挑战!谢谢大家!”
威廉姆斯博士继续主持:“谢谢董事长的鼓励,希望全体同事按照董事长的讲话精神,贯彻执行!”
“今天的研讨会到此结束,请大家依次离开会议室!”
本章未完,点击下一页继续阅读。