国思软件 - 太火了！我在外滩大会玩Deepfake，想骗过机器人结果……

　　白小交发自凹非寺

　　量子位公众号 QbitAI

　　我在外滩大会上生成 Deepfake，结果没骗过机器人……

　　反倒啪的一下，秒秒钟就被找出？！

　　而机器人手中的神兵利器，仅仅只是我们日常都在使用的手机摄像头。

实在是太火了！

　　Deepfake 攻防，成为整个外滩大会现场最受关注的展区之一；相关讨论也成为整个外滩大会最火热的论坛，现场可以说是人山人海人挤人。

　　之所以如此受关注，也有大众已知的原因。

　　这不最近 DeepFake 可以说是来势汹汹，用这项 AI 技术犯罪的严重程度被网友直呼是「韩国N号房再现」。

　　刚提到的这场“全球 Deepfake 攻防挑战赛”，吸引了全球 26 个国家和地区，2200+ 技术研究者对抗 Deepfake 威胁。在这期间，大赛队伍中科院自动化所表示，将开源 AI 模型供大家免费使用，一时间引发全网朋友共鸣。

　　如今在外滩大会，终于有机会亲自体验这个 Deepfake 从生成到对抗的流程是什么样，看 AI 如何帮助普通人识别伪造风险。

　　这背后究竟还有哪些细节？除此之外还有哪些亮点，我们一起来看看。

　　探展蚂蚁数科

　　那么首先就来看蚂蚁数科里这个超火的展区：Deepfake 攻防。

　　整个过程你唯一需要做的，就是站在一个定点，由 iPad 拍摄人脸。

　　然后，就由现有 AI 模型来生成的换脸图 or 视频。

　　Deepfake 就由机械臂来从三组图+一个视频中找出真照片。可以看到视频还是很逼真的，这下谁能证明“我不是我”。

　　由于是现场实时物理采集，机械臂手持智能手机打开相机拍照来收集数据，然后再进行一个识别的操作。

　　短短几秒钟的时间，bingo~机器人就识别出来了正确答案。

　　据现场工作人员介绍，在他们日常工作中，往往最快三秒就可以识别出来。

　　这背后是由天玑实验室以及安全品牌 ZOLOZ提供技术支持。

　　前者主要专注在可信数字身份这块，自研了一套自动化生物识别测评体系。当前市面上 70% 的安卓手机，都要来到天玑实验室经历一番“毒打”。它也是谷歌全球唯一官方合作”安卓生物识别安全”检测实验室。

　　而后者，则是蚂蚁数科旗下安全科技品牌 ZOLOZ，现在在为中国、印尼、马来西亚、菲律宾等 14 个国家和地区的 70 余家合作伙伴提供技术服务，包括像端到端身份验证、在线欺诈检测以及持续风险监控服务等。

　　今年 4 月，他们推出了反 Deepfake 产品ZOLOZ Deeper。外滩大会展示的，正好是他们日常的真实业务场景——

　　几十万测试样本，每月超 20000 次的攻防测评，模拟上百种伪造攻击情况·····

　　同样以直观可感的方式展示出来的，还有他们的 AI 标注场景。

　　AI 大模型生产流程通常包括三个步骤：采集-标注-合成。

　　首先是采集过程。

　　现场准备了一个模拟真实环境的沙盘，我们通过控制机械臂来对沙盘中任意位置 or 场景，进行实时拍照。

　　这时候图像数据也就被传输到系统当中去，这也就完成了数据生产的起点。

　　随后就是标注这一步骤，不再是传统依靠纯人工的方式，而是依靠自研的多模态大模型来 AIGD（AI 生成数据）。

　　模型会自动完成目标检测并标注、语义分割、文本描述、深度检测、3D 建模等任务。

　　人类主打一个协助审核的作用，比如在文本描述阶段，需要靠人工来审核识别目标的细节，比如物体的颜色、形状等等。

　　最后就来到数据合成。核心特点就是可控。既可以对单个物体编辑，也可以对整体场景把关。

　　这样一来无需采集，打破原有真实条件限制，可持续地生产全新的数据。

　　而除了实景标注，旁边还有个视频标注的模块，只需对任意视频中的任意一帧进行采集，同样也可以完成接下来的标注和合成操作。

　　这样一套全链路生产体系，实测显示，在同类结构和同类规模数据量的情况下，会让标注效率提升 40% 以上。

　　除了智能化标注产品，蚂蚁数科还配备了万人的人工标注团队，垂直专业领域同高阶标注人才超过 90%。

　　提到数据标注，当前市面上最具代表的莫过于 Scale AI，科技圈当红独角兽，他最新完成近 10 亿美元融资，估值升至 138 亿美元。

　　不过同 Scale AI 不同的是，此次可以看到蚂蚁数科还提供数据加工、合成服务。

　　比如在一些企业私域或者垂直领域，大量数据尚未公开没有被充分挖掘。

　　结合蚂蚁数科多年来场景和技术优势，这时候除了帮助企业实现数据服务的“就地取材”，还可以针对性地数据泛化，比如像交通、政务、金融等垂直场景，合成更多高质量数据。

　　好了，以上 Deepfake 攻防与智能标注是此次蚂蚁数科最具代表性的展区内容。

　　值得注意的是，这正好是当前业界正在热议也是最受关注的两个问题：

　　当 AI 应用泛滥，如何应对造假问题；大模型加速落地，高质量数据缺失又应该如何解决？

　　如今大模型时代来到应用时期，更多风险和问题由此暴露出来，给企业带来了不少挑战。

　　对于本身在产业深耕多年的蚂蚁数科，其实这次也带来了他们的解决方案。

　　这藏在外滩大会上，藏在这两个最受关注的产品之中。

　　他们整个业务布局，可以这样总结：从 AI For Data 到 Data for AI。

　　从 AI For Data 到 Data for AI

　　什么是从 AI For Data 到 Data for AI？要回答这个问题，需要从整个产业现状开始看。

　　AI 发展到现在，从模型驱动来到了数据驱动，而随着数字化转型的深入，企业生产经营实际上是数据的流通。技术与场景，AI 与 Data，从未像今天这样如此契合。业务场景需要 AI 来提效，而高质量数据需要充分利用为给 AI。

　　一边是AI for data，利用 AI 来充分挖掘数据的价值，进行数据分析、判别等。

　　以风控场景为例，这是每个企业经营生产时都会面对的场景。

　　蚂蚁数科搭建了一套决策式 AI 驱动的风控算法模型。引入像工商司法数据、财报数据、产业链数据、发票税务数据、舆情数据等，来帮助企业做出高效准确的决策。

　　以往需要大量人力进行人肉风控，对于他们来说，理解管理诉求和快速决策布控非常具有挑战性。而现在只需要 AI 这个决策辅助在手，运营新手面对再复杂的场景也能 hold 住了。

　　比如蚂蚁数科与中铁建的合作中，他们共建了一套“产业数据 +AI 模型”的产业风控平台，让产业链的客商准入效率提升了至少 50%。

　　一边data for AI，高质量数据是训练 AI 模型的基础。AI 驱动的数据服务-数据加工-数据标注于一体的方案，加速企业大量原始非结构化数据朝着高质量结构化数据的转化。

　　除此之外，还有像蚁天鉴这样的大模型安全产品，来保障大模型在训练生产和使用过程中的安全可控可靠。

　　我们注意到，蚂蚁数科已经形成 ABC 三大业务板块：

　　首先是云服务（Cloud+），帮助企业迈入数字化「上云」阶段，打造更强大的科技引擎；

　　第二块是 AI 服务（AI+），以 AI 技术重构升级风控、营销等场景效率，助力企业在大模型时代建立竞争优势。

　　第三块是区块链服务（Blockchain+），通过科技构建产业信任，提升数字化协作效率，加速数据资产流通。

　　对于蚂蚁数科来说，ABC 中的“A”很重要，很明显的指向是，此次蚂蚁数科呈现出来的业务布局“从 AI For Data 到 Data for AI”，有三个特点：

　　产业、产业还是产业。用 AI 真实创造产业价值，解决实际问题。这同样也是大模型应用最紧要的命题。

　　产业需要什么样的 AI？

　　大模型发展到现在，人们对大模型的看法已经变了。

　　比如就从最近诸多行业问题与思考开始，图像视频生成模型频频开卷，人们的目光不再聚焦于效果多么惊艳，而是因为效果过于逼真，开始担心背后的潜在隐忧；被「缓解高质量数据荒」的数据合成，结果 Nature 封面一个：Garbage in Garbage out，数据合成越多会导致语言模型崩溃，给这个新兴行业趋势浇了冷水……

　　以及关于 ScallingLaws 的讨论，在行业应用的大模型，参数量到底在多少合适？真的是越来愈多，模型性能就会好吗？

　　种种问题，甚至还导向了另一种倾向：大模型，是不是真的存在泡沫？

　　之所以能引起这样的思考，其实也不难理解。

　　随着大模型技术的发展和应用的深入，一方面人们逐渐意识到了大模型能力的边界。模型的参数量不再作为模型能力的核心指标，高质量的数据流入才能保证模型高性能。

　　另一方面，大模型进入应用深水区。产业界对 AI 的需求，已经不仅仅是单纯的技术追求，解决实际问题才是衡量大模型的唯一标准。

　　随之而来的，就是场景中的诸多挑战。

　　以数据问题为例，当前市面上通用大模型都是基于互联网公开的数据集。他们虽然数量众多、类别广泛，但是无法保质保量，甚至大部分都是“脏”数据。

　　对于专业严肃的应用场景来说，一来更多高质量的行业数据是非公开的，又或者是企业内部自身的，这需要系统来统一调度和管理，还有一些非结构数据需要转化；二来，对于大量公开的数据需要工程级别的清洗、标注，才能达到能使用训练的水平。

　　因此看大模型落地千行百业，不能简单看大模型的性能展示，而是说怎么同产业的深度融合。

　　而本身就在产业有着长期投入的企业，他们有着天然的场景优势，也最有可能将 AI 能力和影响力才能渗透进行业之中。

　　蚂蚁数科，就是一个。

　　— 完 —

太火了！我在外滩大会玩Deepfake，想骗过机器人结果……

我们的产品

相关链接

关于我们

联系我们