时间:2025-07-29 01:41 作者:轩樟
蚂蚁集团大模型安全解决方案“蚁天鉴”升级,新增智能体安全评测工具
数据显示,超过70%的智能体从业者担忧AI幻觉与错误决策、数据泄露等问题,因为AI生成的内容往往包含事实错误,或者对指令产生误解,其中超半数受访者表示,所在企业尚未设立明确的智能体安全负责人。
世界数字科学院(WDTA)最新发布《AI智能体运行安全测试标准》提出将输入输出、大模型、RAG、记忆和工具五个关键链路与运行环境对应起来,分析智能体全链路风险。
大模型安全解决方案“蚁天鉴”新增智能体安全评测工具
此外,其Agent对齐功能,集成了高效工具调用、敏感双重验证、多通道恶意识别及沙盒环境训练,确保智能体的决策、行为与开发者预设目标、价值观及伦理道德保持一致;通过深度理解智能体服务上下文与风险情境,“蚁天鉴”还可对每一次调用进行内容、链路、行为、权限、组件、来源、身份七层校验,并依据策略引擎动态决策放行、降级或阻断,实现“永不信任,始终验证”的零信任动态防御。
蚂蚁集团机器智能部总经理、安全实验室首席科学家王维强在WAIC论坛演讲
据了解,2024世界人工智能大会上,“蚁天鉴”2.0发布,形成了包括大模型基础设施测评、大模型X光测评、应用安全测评、AIGC滥用检测、证件伪造检测、围栏防御等在内的完整技术链条,面向行业提供全方位智能化的大模型安全测评和防御解决方案。
1、苹果折叠屏iPhone呼之欲出?华为高端市场遭遇劲敌,iphone折叠屏概念机
2、澳大利亚和土耳其为COP31主办权争执不下,联合国:尽快解决,澳大利亚u19vs土耳其u19
3、德国究竟为何发动第一次世界大战?,第一次世界大战德国为什么向法国宣战