AI 治理与监管

为什么需要治理，以及为什么是现在

在这架阶梯前面的台阶上，你已经学过模型「能」做什么——而最近几篇指南讲的是它会出什么错：偏见、隐私泄露、对齐问题、生成式 AI 的滥用。治理就是叠加在所有这些之上的那一层。它不是某一种单一的技术；它是一整套规则、角色和习惯，用来决定：谁有资格构建一个系统、当系统伤害了某人时谁来负责、以及他们事先必须拿出什么样的证据。

这件事之所以在「现在」变得重要，原因是部署，而不是能力炒作。一个贷款评分模型、一个招聘筛选器、一个医疗分诊工具、一个内容推荐系统——它们已经在大规模地对真实的人做出影响深远的决定。那些棘手的问题不再是纯技术性的：一个模型可以有 99% 的准确率，却依然违法、不公平，或者干脆无人可问责。治理就是一个社会在伤害发生之前（而非之后）回答「这件事被允许吗？在什么条件下被允许？」的方式。

透明度与问责制：两个承重的核心观念

几乎每一种治理制度都建立在两根支柱之上。[[transparency|透明度]]意味着一个系统的存在、用途、数据和局限对受影响的人以及监督者是可见的——你至少应该知道「有」一个自动化系统在评判你，理想情况下还应知道为什么。[[accountability|问责制]]意味着当出了问题时，有一个具体的、可指认的责任方需要负责，并且可以被要求去修复它或为之买单。没有问责的透明度，是一份没有后果的供词；没有透明度的问责，是一种你永远无法调查的指责。

透明度是分层的，而不是非黑即白。最表层是*披露*：告诉用户他们正在和一个机器人对话，或者某个决定是自动做出的。更深一层是*文档*：模型卡和数据说明书，记录一个模型用什么训练、如何评估、以及已知它会在哪里失灵。最深一层是*解释*：你之前接触过的可解释 AI工具——是哪个特征导致了这次拒绝？每一层服务于不同的受众：数据主体、部署该系统的公司，以及监管者。

欧盟《人工智能法案》与全球的拼凑格局

目前发展得最完善的硬性法律制度是 2024 年达成、并在随后几年逐步生效的[[ai-regulation-eu-ai-act|欧盟《人工智能法案》]]。它的核心理念是*风险分级*：与其把「AI」当作一整件事来监管，不如把各种用途分入不同的等级。一小部分做法被彻底禁止（例如政府的社会评分、大多数实时生物识别的大规模监控）。更大的一类是高风险——用于招聘、信贷、教育、医疗器械、关键基础设施的 AI——它们要承担沉重的义务。其余的一切都属于低风险，只受轻微规则约束或几乎不受约束。

注意这种分级所暗示的东西：法律监管的是*用途和情境*，而不是数学本身。同一个图像分类器，用在照片应用里就不受监管，用在边境检查站就是高风险。对于高风险系统，《法案》要求一套有文档记录的风险管理流程、数据治理记录、技术文档、日志记录、人工监督，以及在产品上市之前的合格评定。它还为通用型基础模型——许多产品赖以构建的那些大语言模型——增加了特定的责任，并对其中能力最强的那些把责任进一步加码。

欧盟不等于全世界，也不存在一本统一的全球规则手册——它是一种*拼凑*。美国更依赖各行业的监管机构（金融、卫生）、各州法律以及自愿性框架，而不是一部包罗万象的综合性法律。中国通过针对性的规则来监管诸如推荐算法和生成式 AI 这样的具体应用。英国偏好一种「促进创新」、以原则为基础的做法，分散在各个现有监管机构手中。由于模型瞬间就能跨越国界，欧盟那套细致的制度往往会成为事实上的下限——即「布鲁塞尔效应」——就像它的隐私法 GDPR 当年所做的那样。

标准、审计与合格评定

法律陈述目标；标准则陈述在实践中如何达成这些目标，而治理正是在这里变成了具体的工程。一部法律可能要求高风险系统「足够准确且稳健」；而来自 ISO/IEC 的标准，或像美国 NIST《人工智能风险管理框架》这样的框架，则把实际的流程一一写明——如何记录数据、如何测试偏见、如何衡量稳健性、以及如何在整个生命周期里管理风险。标准通常是自愿的，但法律越来越多地指向它们，于是遵循标准就成了证明你守法的最简单途径。

审计就是核查规则是否真的被遵守了。它可以是*内部的*（你自己的团队进行一次部署前审查），也可以是*外部的*（由一个独立的第三方来检查这个系统）。一次真正的审计需要证据，这正是那些枯燥的生命周期产物如此重要的原因：数据集文档、在留出数据和压力测试数据上的评估结果、模型版本和决策的日志、以及谁签字批准的记录。没有这条书面线索，就没有任何东西可供审计——问责就坍缩成了一句「相信我们就好」。

Lifecycle governance trail (high-risk system)

  define use & risk tier ─► document data & known bias
        │                          │
        ▼                          ▼
   evaluate (accuracy,        human oversight
   robustness, fairness)      design
        │                          │
        └─────────► conformity ◄───┘
                    assessment
                        │
                        ▼
          deploy ─► log ─► monitor ─► re-audit

治理是一个循环，而不是一道一次性的关卡：每个阶段都会产出下一次审计所依赖的证据，而监控又会反馈到重新评估之中。

两点诚实的提醒。第一，审计的好坏取决于它的访问权限和它的「牙齿」——一次看不到训练数据、或没有任何监管者能据以采取行动的审计，不过是一场表演。第二，治理是持续的，而不是上线当天的一个勾选框：一个模型可以通过所有测试，然后随着世界的变化而漂移，这正是为什么持续监控（MLOps 那个台阶里的话题）本身就是一项治理义务，而不只是工程上的锦上添花。

让人留在回路中

在各种制度中反复出现的一项要求，就是[[human-in-the-loop|人在回路中]]：要有一个人能够审查、推翻或否决一项自动化的决定，尤其是在高风险的用途里。这背后的直觉是站得住脚的——一位医生确认 AI 的分诊标记、一名信贷专员可以推翻模型的判断。但它很容易被做坏，而「有个人签了字」是这个领域里被过度宣称的保障之一。

它的失效模式是*自动化偏见*：当一个系统在 95% 的时间里都是对的，人类审查者就不再真正地审查，而只是点一下「批准」，沦为一个橡皮图章，把模型的决定洗白成「有人监督的」。有意义的监督所需要的，不只是「在场」的一个人——它需要一个有时间、有信息（包括一份关于模型为何如此判断的解释）、有真正说「不」的权力、并且在他们确实说「不」、因而拖慢了流程时不会因此受罚的人。

该如何看待这一切

把这些线索收拢到一起。治理是叠加在技术栈之上的社会层：用透明度让人们和监督者看清正在发生什么，用问责制让总有人需要负责，用像欧盟《人工智能法案》这样的硬性法律划定不可逾越的红线，用标准和审计把原则变成可核查的实践，并在高风险之处放一个真正的人在回路中。这里没有一颗银弹；它们作为相互重叠的层次共同发挥作用，就像航空安全那样——没有任何单一规则能阻止坠机，但整套体系让坠机变得罕见。

对它的局限保持诚实。监管落后于技术，执法参差不齐，而为今天已部署的系统写就的规则，套到明天的系统上可能会很别扭。但那种愤世嫉俗的论调——「这一切不过是合规表演罢了」——和那种气喘吁吁的吹捧一样错得离谱。好的治理已经挡下了违法的生物识别监控、迫使招聘工具进行偏见测试、并给了被拒绝的申请人一份要求解释的权利。这项工作是不起眼的管道工程，而恰恰是这种不起眼的管道工程，决定着一项强大的技术究竟是否主要在帮助它所触及的那些人。