2024年07月27   星期六    站内搜索
字号大小:
0

齐向东:高质量数据是稀缺资源,构成高水平AI的基础

2024-06-05 22:18:42    作者:智库时代网
核心摘要:6月5日,全球数字经济大会数字安全高层论坛暨BCS2024北京网络安全大会在京举办。全国政协委员、全国工商联副主席、奇安信科技集团董事长齐向东发表了“AI驱动安全”的主题演讲。在演讲的过程中,他用同样一个恶意域名,去提问最新的ChatGPT和奇安信安全机器人QAX-GPT。结果对比发现,ChatGPT只是泛泛提供了一些建议,而QAX-GPT则回答的非常专业且有价值,不仅准确判断出该域名是恶意域名,还给出了专业的判断依据,提炼出核心知识点,基本匹敌一个安全专家的分析报告。

6月5日,全球数字经济大会数字安全高层论坛暨BCS2024北京网络安全大会在京举办。全国政协委员、全国工商联副主席、奇安信科技集团董事长齐向东发表了“AI驱动安全”的主题演讲。在演讲的过程中,他用同样一个恶意域名,去提问最新的ChatGPT和奇安信安全机器人QAX-GPT。结果对比发现,ChatGPT只是泛泛提供了一些建议,而QAX-GPT则回答的非常专业且有价值,不仅准确判断出该域名是恶意域名,还给出了专业的判断依据,提炼出核心知识点,基本匹敌一个安全专家的分析报告。

由此可见,经过专业知识优化的大模型在实际应用中具有显著优势,其精确性和实用性远超未优化的通用大模型。而此类高水平AI的基础则是高质量的数据。

齐向东强调,要想做好AI驱动安全,高质量的数据至关重要。高质量的数据有两个特点,一是全、二是新。只有拥有最多人才、承担最多国家关基设施防护任务、处理最多安全应急事件的企业,才能积累下又全又新的数据,此类数据则是稀缺资源。

他介绍,第一个特点“全”指的是足够多的基础安全数据用于训练安全大模型。安全设备覆盖越广,得到的数据量越大、越丰富。

IDC等权威机构公布的数据显示,奇安信在终端安全、威胁发现与态势感知、数据安全、云安全、安全管理平台等领域,都稳居市场第一。特别是终端安全市场,连续六年领跑。安全数据规模位居全国首位,为大模型预训练打下了坚实的基础。

齐向东介绍,目前,奇安信自主研发的数据存储平台,汇聚了总量超过380亿的全球独有样本库、超百亿的恶意网址库、国内最大的互联网漏洞库、2万亿级的DNS日解析量、200多亿条资产数据等。

第二个特点“新”指的是有足够贴近实战的一手原始语料用于大模型推理。“只有丰富的实战经验,才能磨练出专业的原始语料。”齐向东表示,奇安信有遍布全国的网络安全服务团队,人数规模超过3000人,能深入了解客户遇到的安全问题;还开通了全国首个行业服务热线95015,为各地客户解决紧急的安全事件,能第一时间获取威胁信息。

另外,奇安信还举行了近900场攻防演习活动,完成了80多场国内外重大活动网络安全保障任务,在实战过程中积累了丰富、先进的安全知识和经验。

齐向东总结,这些实战经验和知识既是训练高水平安全大模型的核心要素,也可以作为大模型推理时所需的最新实时信息,双管齐下确保生成精准的、高价值的答案。

媒体聚焦更多

五大行高管年薪或难逃“腰斩”命运
央企高管降薪风声渐起,作为金融业里最“高大上”的国有五大行(设银行、农业银行、中国银行、交通银行、工商银行)或将最先受到冲……

  • 杭州明日起全面放开住房限购
  • 杭州明日起全面放开住房限购
  • 杭州明日起全面放开住房限购
  • 杭州明日起全面放开住房限购
  • 杭州明日起全面放开住房限购

关于我们  |  联系我们  |  人员查询  |  广告服务  |  合作加盟  |  版权声明  |  网站留言