上海市肺科医院:人工智能赋能网络安全自主值守

发布时间:2024-10-31
浏览次数:

  2024年医院新兴技术创新应用典型案例征集活动经行业专家背靠背盲审以及终审,共选出20篇典型案例,将陆续刊登出来,以飨读者。

1 网络安全现状

  2022年底,以ChatGPT为代表的的生成式人工智能取得了长足进展。相比传统机器学习、深度学习算法,生成式人工智能一般具备算法模型参数大(数十亿以上)、训练数据量级大、训练推理算力大三方面的特点。

  网络安全领域的各类威胁、样本、日志、事件,同样可以通过生成式人工智能进行学习训练、推理研判,并且微软、OpenAI、谷歌、CrowdStrike、斯坦福大学、清华大学等机构的大量学术研究和工程实践证实,生成式人工智能相比传统机器学习和深度学习算法,具有更高的威胁检出率,更低的误报率,更强的意图理解和内容生成能力,甚至具备自主联动情报、沙箱、安全设备等能力。生成式人工智能在网络安全中的应用,为网络安全的威胁检测、事件研判、溯源处置,甚至应用开发安全、数据安全,都具有巨大助力。

  当前,上海市肺科医院网络安全已完成云网端体系的安全建设,但在面对黑客基于ChatGPT等工具的攻击时现有安全体系仍然有些力不从心。为了应对这种挑战,上海市肺科医院引入网络安全垂直领域的生成式人工智能大模型,提升网络安全运营处置能力。

2 医院网络安全自主值守体系搭建

  上海市肺科医院在原有云网端安全运营体系之上再次构建GPT能力,通过XDR(可扩展的检测与响应平台)接入现有网络侧和终端侧的安全流量日志,做网端告警的聚合分析。同时通过“安全GPT”赋能XDR安全平台,提供深度威胁检测框架、自然语音交互的安全运营和基于思维链的自主值守,并针对自主运营值守和研判处置在医院深入落地实践。

  网络安全领域的生成式人工智能“安全GPT”基于面向安全行业的垂直领域应用,构建具备网络安全常见知识和最佳实践流程的专用大模型。基于自然语言的交互式安全运营,依托于云端强大的算力、架构、安全实践的能力,结合实际场景和安全数据进行预训练,构建安全大模型基座。通过采集来自端、网端的海量网络安全威胁数据,以及其他合法来源的网络安全百科知识等,进行数据清洗、数据扩充、数据配比融合,形成高质量完备的安全行业数据。经过行业数据进行增量预训练和指令微调,打造具备安全问答、上下文理解、产品数据联动、服从合规原则的安全原始大模型。

1.jpg

图1 整体架构图

3 技术亮点

  自主运营值守基于场景化运营工作实践经验,将资产梳理、加固预防、监测研判、调查处置、联动处置、情报查询及溯源总结等方面的工作能力流程化,并能使安全专员可以通过自然语言与安全大模型进行交互,通过快速问答的方式,调动对应的工具、人员和流程完成安全运营的辅助驾驶,提升安全运营效率,将安全响应单安全事件的处置时间压缩到1分钟以内,提升网络空间安全对抗响应和处置效能。安全GPT可以提供基于思维链的运营值守和研判处置能力,进行托管式值守,支持7x24小时实时在线自动研判,代替安全运营人员做资产、漏洞的排查和管理等工作。

  具体应用技术如下:

  (1)大模型自主值守研判技术

  值守总览提供当前自主值守的研判处置结果统计信息,包括自有设备与第三方设备产品接入数量展示,可点击跳转具体展示界面进行查看与配置,同时可显示离线&告警设备情况、系统资源状态。同时,值守总览还包括值守状态整体监控,可基于时间自定义筛选,支持展示各类组件的告警数量、GPT告警消减后的有效告警数量与自动处置告警数、人工决策告警数,点击后可跳转告警值守中心查看详情。同时可查看告警效应率、累计处置威胁实体数、待决策告警数、GPT告警消减率和累计节省研判用时等。

  (2)基于思维链的大模型自主告警研判技术

  告警值守中心支持实时告警分析,可实现思维链处置过程追溯,24小时不间断自动分析、实时值守,可结合数据包解读、周期检测、资产分析、威胁情报分析和基础信息分析等维度输出研判处置思考过程,针对人工决策告警支持自动给出具体处置建议,针对自动处置告警支持直接实现自动处置并展示处置状态。

  (3)攻击行为分析和威胁定性技术

  在面对海量告警的时候,运维人员无法对告警进行一一研判,可能导致关键告警被忽略,这其中大部分告警属于低价值的业务误报、自动化扫描,这些告警量大、价值低,严重拖累处置效率,真正需要关注的病毒类、手动攻击告警量反而占比少。威胁定性就是通过业务误报识别、病毒行为识别、人机行为识别及结合云端强大的威胁情报库,对告警进行类型定性,以达到更高的处置效率。

  (4)基于威胁图谱的攻击过程还原技术

  首先通过Provenance Graph溯源图对海量数据中时间、资产、网络、情报等多因子进行关联,形成初始的攻击故事链——威胁图谱。

  其次基于告警统计、时序、语义、情报、关联等维度上下文,结合攻击成功检测,精准判断攻击是否已经成功。对告警进行自动化分类,并评估其威胁等级,降低误报对安全运营人员的干扰。针对不同场景,灵活采用了强关联或弱关联,通过ATT&CK技战术因果关系、时间顺序、威胁场景等关联,发现最合理的数据关联关系,帮助安全运营人员高效快速的研判威胁。

  (5)自动化响应处置技术

  应用SOAR技术架构,根据不同的安全事件可自行灵活地编排不同的处置流程,将安全运营相关的技术、流程和人员等各种能力整合在一起工作。

  当安全组件中产生安全事件并同步到安全事件编排与响应组件之后,会在响应中心的安全事件列表产生对应的数据,此时可触发剧本的执行,并将待执行任务同步到应用管理中,应用管理通过剧本中具体的动作以及应用资源,通过对应的调用方式,例如API、SSH、命令行等,调用具体的实例执行动作,并最终由任务管理将动作执行的情况同步到事件列表中完成事件状态的更新。

  (6)基于大模型的值守研判报告生成技术

  安全GPT自主值守过程产生的安全报告将集中展示在报告中心中,支持按照自定义时间生成报告,可基于日报、周报、月报、自定义等维度筛选查询报告。报告列表展示上,属性内容包括按照报告名称、报告创建时间、时间范围、报告类型、操作等维度展示报告详情。报告内容上,包含资产总览、威胁总览(含安全事件分析、影响资产分析与调查、安全告警值守等内容)。

4 应用效果

  截至本文编纂时间,现有自助值守系统已为上海市肺科医院守护超过245天,分析网络侧及终端侧各类告警超72178条,有效告警超426条,其中已自动处置341条,需人工决策告警85条。GPT告警消减率99.41%,累计节省研判用时1203小时以上。

2.jpg

图2 值守总览

  告警危害等级分布如下图所示,其中严重告警占比1.22%,高危告警占比21.81%,中危告警占比23.96%。

3.jpg

图3 危害等级分布

  告警攻击类型分布排名前五的分别为:远程执行、违规访问、钓鱼网站、远程控制行为以及隐秘隧道,攻击类型分布较多,呈分散态势。

4.jpg

图4 攻击类型分布TOP5

5 总结

  本院人工智能技术在赋能网络安全并实现自主值守方面的实践效果显著,通过运用机器学习和大数据分析技术,AI可以实时监控和深度挖掘网络流量、系统日志等海量数据,模拟专家的决策思维链,对潜在的安全威胁进行智能研判。AI能自动识别异常行为模式,如未经授权的数据访问、非正常时间段的操作行为等,并根据预设的风险评估模型,快速准确地判断出可能的安全风险等级,及时预警。同时在自动处置层面,一旦发现外网安全威胁或事件,AI系统能够立即启动自动化响应机制。通过自我学习和训练,不断提升对新型攻击手段的识别能力,实现对外网攻击的精准定位与拦截。同时,对于已知类型的威胁,AI可以基于策略自动隔离受影响的系统,阻断病毒传播路径,或封堵外网恶意IP,保障业务正常运行。

  整体来看,人工智能在医院网络安全领域的应用,不仅减轻了医院运维人员的工作压力,提升了工作效率,也极大增强了医院网络环境的整体安全性,为医疗信息化建设提供了坚实保障。

  申报单位:上海市肺科医院

  联合申报单位:深信服科技股份有限公司

  案例赛道:网络安全创新

  案例业务领域:其他