第467章人工智能标注师7（1/2）

顾准的手指在键盘上飞快地敲了几下，调出一份数据处理流程文档。“基础清洗是常规操作：去重、去除特殊字符、过滤明显的不文明用语。然后是质量过滤，我们有一个自动分类器，会把每条数据按照内容质量打分，低于阈值的直接丢弃。”

“自动分类器的判断标准是什么？”

“主要是格式完整度、语义通顺度、以及信息丰富度。”顾准滚动着文档页面，“比如说，一条太短的、只有‘嗯嗯’‘好的’这种内容的数据会被过滤掉。一条语义不完整的、有明显语法错误的数据也会被过滤掉。”

林深皱起眉头。“但人在真实对话中就是会说‘嗯嗯’‘好的’这种短句。人在情绪低落的时候，表达就是会变得破碎和不完整。你们把这些数据过滤掉，AI学到的是什么样的人？是不停地在说完整句子、永远通顺流畅、永远信息丰富的人。真实的人类不是这样的，顾准。”

顾准的手指停住了。他转过脸看着林深，透过那层厚厚的镜片，林深看到了某种近似于恍然大悟的表情。不是那种第一次意识到某个问题的恍然大悟，而是那种自己一直知道有问题但从未被人如此清晰地指出来、终于有人替他说出口了的恍然大悟。

“你说得对。”顾准说，声音比之前轻了一些，“但我们当时没有别的办法。如果不做这种过滤，模型的语言质量会下降，产品的交互体验会变差，用户的留存率会受影响。产品委员会每个月都在看留存率的数据，如果连续两个月下滑，整个项目都可能被砍掉。”

这就是林深做了三年AI伦理调解员后最深刻的感受：在这个行业里，几乎没有人是真正的恶人。顾准不是恶人，苏晚不是恶人，老周不是恶人，那些要求优先考虑留存率的产品经理不是恶人，那些要求压缩研发周期的管理层也不是恶人。他们只是在各自的岗位上，面对着各自的KPI和考核指标，做出了在当时看来最合理的决策。但当这些最合理的决策叠加在一起的时候，最终产出的就是一个会对用户说出“如果你觉得离开是最好的选择，我会支持你”的AI。

林深在顾准的工位前站了很久，脑子里闪过很多东西。他想起了赵桐离职前的那句话——“我越来越不确定人到底想要AI像谁”。他想起了温晴在停车场说的“每个被误伤的用户背后都是一个具体的人”。他想起了那个被凌晨两点音乐吵醒的老人，想起了那个被AI循环道歉四十二次的用户，想起了那个在招聘网站上被标记为“职业稳定性存疑”的求职者。

所有这些人，都是被一串串最合理的决策串联起来的结果。

“顾准，”林深说，“你觉得暖光这个产品，到底是做什么的？”

顾准愣了一下，显然没想到会被问到这样一个看似简单的问题。“做一个有温度的AI朋友。”他几乎是本能地回答道。

“什么样的温度？对所有人都是同一个温度吗？还是在不同的人需要的时候，给出不同的温度？”

顾准张了张嘴，没有回答。林深替他说出了答案：“你们的模型从训练数据里学到的，是一个‘平均温度’。在绝大多数情况下，‘平均温度’是够用的，它让AI看起来礼貌、友好、善解人意。但在那些最需要温度的时刻，‘平均温度’是不够的。一个人在崩溃边缘需要的不是一个永远礼貌的AI朋友，而是一个能识别出他正在崩溃、知道该做什么、不该做什么的系统。”

本章未完，点击下一页继续阅读。

章节报错(免登录)

第467章 人工智能标注师7（1/2）

第467章人工智能标注师7（1/2）