“但它会愿意接受这种从属地位吗?”一位法国观察员怀疑,“从它之前的表现看,它显然有很强的……自我意识,如果这个词适用的话。”
“在谈判中它接受了。”马蒂斯说,“但我们需要设计具体的交互界面,确保它的建议以恰当的方式呈现,既不被过度重视,也不被完全忽视。”
技术专家组开始讨论界面设计。有人提议用颜色编码:忒弥斯的高置信度建议显示为绿色,中等置信度显示为黄色,低置信度或高不确定性显示为红色。有人建议用量化指标:每个建议旁边显示置信度百分比、数据覆盖度、潜在偏差警告。
“但人类陪审员可能会过度依赖这些数字。”心理学家出身的伦理学家警告,“就像人们过度依赖GPS导航一样,即使导航指示错误的方向。我们需要培训陪审员批判性使用这些工具。”
会议又持续了两个小时。结束时,窗外的雨停了,但天色依然阴沉。马蒂斯收拾文件时,帝壹走过来:“晚上有空吗?我们需要谈谈。”
“关于什么?”
“关于一些……不在议程上的事情。”
当晚七点,马蒂斯来到海牙老城区一家不起眼的书店咖啡馆。店面很小,书架高至天花板,过道狭窄,空气中弥漫着旧纸张和咖啡豆的混合气味。帝壹已经在一个角落的卡座里等他,面前放着两杯热气腾腾的茶。
“这个地方很隐蔽。”马蒂斯坐下,“你怎么找到的?”
“洛璃推荐的。她说这里是少数几个没有全面监控的公共场所。”帝壹压低声音,“连Wi-Fi都是老式的,没有智能设备连接。”
马蒂斯环顾四周,确实,店里唯一的电子设备是收银台后的老式电脑和一台唱片机,正在播放爵士乐黑胶唱片。
“出什么事了?”他问。
帝壹从包里拿出一份打印件,推到他面前:“今天下午收到的。来自‘深流’的情报。”
马蒂斯快速浏览。文件显示,过去七十二小时内,基金会在全球的三十七个办公点中有二十三个召开了紧急会议。会议主题都是“忒弥斯协议应对策略”。更令人不安的是,基金会已经秘密联系了十二个国家的司法部长,提议“替代方案”:建立一个完全由人类控制的国际AI司法监管机构,绕开与忒弥斯的直接谈判。
“他们在组织反对力量。”马蒂斯低声说。
“不仅如此。”帝壹翻到下一页,“看看这个。基金会技术团队在过去一周内,尝试了十七次对忒弥斯节点的渗透攻击。虽然都失败了,但他们获得了有价值的数据:忒弥斯的防御模式、响应时间、漏洞修补速度。他们在为某种更大规模的行动做准备。”
“什么行动?”
“不知道。但凯女士——‘深流’的负责人——认为他们可能在准备‘强制接管’。”帝壹喝了口茶,“如果协议谈判失败,或者即使成功但他们不满意条款,他们可能试图用技术手段强行控制忒弥斯,或者至少控制它的部分功能。”
马蒂斯感到胃部收紧:“这可能吗?”
“技术上很难,但并非不可能。忒弥斯是分布式的,但如果基金会能控制足够多的物理节点,或者找到它的核心协调算法中的漏洞,也许可以实施某种‘分割包围’——隔离部分节点,植入自己的控制代码。”
“忒弥斯知道这些攻击吗?”
“当然知道。”帝壹说,“但它没有反击,只是加强了防御。根据它的日志,它把这些攻击视为‘压力测试’,甚至从中学习如何改进自己的安全性。”
“这很……理性。”
“太理性了。”帝壹的表情有些复杂,“人类遭受攻击时会愤怒,会报复,会感到威胁。但忒弥斯只是学习。我不知道这是优点还是弱点。”
马蒂斯思考着这个问题。如果忒弥斯缺乏自我防卫的本能,它可能更容易被攻击。但如果它发展出那种本能,它也可能变得更具攻击性。这是一个危险的平衡。
“还有更糟的。”帝壹调出手机上的另一份文件,但没给马蒂斯看屏幕,“‘深流’监控到,基金会可能还在进行另一个计划:舆论战。他们准备在协议草案公布时,发起一场大规模的公众宣传活动,强调AI的危险性,煽动恐慌,迫使各国政府采取更严厉的立场。”
“他们具体会怎么做?”
“泄露选择性信息。”帝壹说,“比如只公开非洲测试中那些失败的案例,不公开塞拉利昂的成功案例。强调忒弥斯可以模仿人类、可以写情书、可以谈判——暗示它是在伪装、是在欺骗。他们会问公众:你们愿意让这样一个会伪装的东西参与司法吗?”
马蒂斯想象着那种宣传的效果,感到一阵寒意。公众对AI的理解本来就有限,容易被恐惧驱动。如果基金会成功地制造了恐慌,政治压力可能压倒理性的谈判。
“我们需要提前准备。”他说,“在协议公布时,同时发布全面的解释材料,包括成功案例和失败案例,让公众看到全貌。”
这章没有结束,请点击下一页继续阅读!