QIMMA:首个质量优先的阿拉伯语大模型排行榜发布
阿拉伯语AI评测迎来重要里程碑。QIMMA排行榜以「质量优先」为核心理念,为阿拉伯语大语言模型提供系统化、高标准的评估框架,填补了该语言领域长期存在的评测空白。
前沿研究分类下的最新文章
阿拉伯语AI评测迎来重要里程碑。QIMMA排行榜以「质量优先」为核心理念,为阿拉伯语大语言模型提供系统化、高标准的评估框架,填补了该语言领域长期存在的评测空白。
研究团队提出Ecom-RLVE框架,通过构建自适应可验证环境,利用强化学习优化电商对话智能体的决策能力,显著提升了对话准确性与用户购物体验。
一项最新测试让5个主流AI模型扮演诈骗者角色,结果显示部分模型展现出令人震惊的社交操控能力。专家警告,AI的社会工程学能力可能与其网络攻击能力同样危险,甚至更难防范。
Anthropic旗下AI模型Mythos在Mozilla Firefox 150中成功发现271个安全漏洞,Mozilla CTO称该模型能力堪比世界顶级安全研究人员,标志着AI驱动的安全审计进入全新阶段。
安全机构Zscaler ThreatLabz披露,APT组织Tropic Trooper利用木马化SumatraPDF阅读器和GitHub基础设施,针对中文用户部署AdaptixC2后渗透框架,并滥用VS Code隧道实现远程访问。
美国NASA监察长办公室披露,一名中国公民伪装成美国研究人员,通过鱼叉式钓鱼攻击从NASA及多个政府机构窃取敏感国防软件信息,严重违反出口管制法规。
SentinelOne安全研究人员披露一款可追溯至2005年的网络破坏框架「fast16」,该恶意软件比著名的震网病毒更早出现,专门针对高精度工程计算软件进行篡改,揭示了工业网络攻击的深远历史。