首页 > 都市小说 > 打工逆袭pei > 第467章 人工智能标注师7

第467章 人工智能标注师7(1/2)

目录

顾准的手指在键盘上飞快地敲了几下,调出一份数据处理流程文档。“基础清洗是常规操作:去重、去除特殊字符、过滤明显的不文明用语。然后是质量过滤,我们有一个自动分类器,会把每条数据按照内容质量打分,低于阈值的直接丢弃。”

“自动分类器的判断标准是什么?”

“主要是格式完整度、语义通顺度、以及信息丰富度。”顾准滚动着文档页面,“比如说,一条太短的、只有‘嗯嗯’‘好的’这种内容的数据会被过滤掉。一条语义不完整的、有明显语法错误的数据也会被过滤掉。”

林深皱起眉头。“但人在真实对话中就是会说‘嗯嗯’‘好的’这种短句。人在情绪低落的时候,表达就是会变得破碎和不完整。你们把这些数据过滤掉,AI学到的是什么样的人?是不停地在说完整句子、永远通顺流畅、永远信息丰富的人。真实的人类不是这样的,顾准。”

顾准的手指停住了。他转过脸看着林深,透过那层厚厚的镜片,林深看到了某种近似于恍然大悟的表情。不是那种第一次意识到某个问题的恍然大悟,而是那种自己一直知道有问题但从未被人如此清晰地指出来、终于有人替他说出口了的恍然大悟。

“你说得对。”顾准说,声音比之前轻了一些,“但我们当时没有别的办法。如果不做这种过滤,模型的语言质量会下降,产品的交互体验会变差,用户的留存率会受影响。产品委员会每个月都在看留存率的数据,如果连续两个月下滑,整个项目都可能被砍掉。”

这就是林深做了三年AI伦理调解员后最深刻的感受:在这个行业里,几乎没有人是真正的恶人。顾准不是恶人,苏晚不是恶人,老周不是恶人,那些要求优先考虑留存率的产品经理不是恶人,那些要求压缩研发周期的管理层也不是恶人。他们只是在各自的岗位上,面对着各自的KPI和考核指标,做出了在当时看来最合理的决策。但当这些最合理的决策叠加在一起的时候,最终产出的就是一个会对用户说出“如果你觉得离开是最好的选择,我会支持你”的AI。

林深在顾准的工位前站了很久,脑子里闪过很多东西。他想起了赵桐离职前的那句话——“我越来越不确定人到底想要AI像谁”。他想起了温晴在停车场说的“每个被误伤的用户背后都是一个具体的人”。他想起了那个被凌晨两点音乐吵醒的老人,想起了那个被AI循环道歉四十二次的用户,想起了那个在招聘网站上被标记为“职业稳定性存疑”的求职者。

所有这些人,都是被一串串最合理的决策串联起来的结果。

“顾准,”林深说,“你觉得暖光这个产品,到底是做什么的?”

顾准愣了一下,显然没想到会被问到这样一个看似简单的问题。“做一个有温度的AI朋友。”他几乎是本能地回答道。

“什么样的温度?对所有人都是同一个温度吗?还是在不同的人需要的时候,给出不同的温度?”

顾准张了张嘴,没有回答。林深替他说出了答案:“你们的模型从训练数据里学到的,是一个‘平均温度’。在绝大多数情况下,‘平均温度’是够用的,它让AI看起来礼貌、友好、善解人意。但在那些最需要温度的时刻,‘平均温度’是不够的。一个人在崩溃边缘需要的不是一个永远礼貌的AI朋友,而是一个能识别出他正在崩溃、知道该做什么、不该做什么的系统。”

本章未完,点击下一页继续阅读。

目录
返回顶部