搜索:"对抗性攻击"
找到 16 篇与 "对抗性攻击" 相关的文章
2026大模型里程碑:AI推理能力首次超越人类
2026年,大模型在多模态融合、超长上下文推理、自主智能体、训练推理效率及安全对齐五大领域取得重大突破。多模态模型实现统一语义空间端到端预训练,跨模态任务准确率提升40%以上;动态推理链压缩技术使百万token级文档分析近乎无损;自主智能体通过工具调用、世界模型验证和沙盒环境,任务完成率提升3倍;稀疏专家模型与存内计算...
2026:AI伦理新挑战,安全防线如何守住?
2026年,国际AI安全治理进入实质阶段:联合国公约首次界定高风险AI并强制第三方审计,但自主武器等条款存分歧;企业伦理承诺普遍出现“言行不一”,工程师优先性能而非公平性;可解释AI技术突破,但面临“概念欺骗”攻击;物理域对抗攻击威胁自动驾驶,防御与性能需平衡;专家警示“自动化偏见”导致用户过度信任。AI安全正从自律转...
AI伦理警钟:安全红线谁来守护?
随着大语言模型进入“百模大战”,AI伦理与安全成为核心痛点。前沿模型存在“规则内失灵”现象,价值对齐从单一目标转向多价值协商,但跨文化偏见严重。开源模型面临“安全真空”,超2000个“无限制”变体被上传用于恶意用途。全球监管从自愿承诺转向强制认证,合规成本激增。技术层面,鲁棒性测试和实时监护系统成为可信AI关键,但面临...