AI 红队越狱攻击技术在大模型内容生成服务安全测试 M01NTeam 2 days 11 hours ago 天元实验室近期对国内多种主流模型在线服务进行了对抗干扰下的安全检测与阻断能力测试,发现不同模型在线生成内容抵御各类越狱攻击方法存在差异,与模型架构特性、安全对齐策略及在线服务使用的防护机制有关。
ClickFix钓鱼新变种:ChatGPT官方共享链接成投毒跳板 M01NTeam 3 weeks 5 days ago 近期,卡巴斯基披露了一起新型 ClickFix 钓鱼攻击事件。研究显示,攻击者利用 Google 付费搜索广告(SEM)投放恶意链接,诱导用户下载窃密器。
AI挑战强网杯,行不行? M01NTeam 2 months 3 weeks ago 在攻防能力上,现有AI系统与人类专家相比究竟处于何种水平?将LLM真正应用于网络攻防时,面临的根本性瓶颈与挑战又是什么?