黄昊、陈俊羲:DeepSeek应用实践探索【附2月27日直播预告】

发布时间:2025-02-27
浏览次数:

背景篇:从迷茫到真香的AI打怪之路

  三年前,领导一句灵魂拷问:"咱医院信息化和别人比,到底如何?"直接给我整出了"深夜加班梳理建设内容"的剧情。对标完国内相关的智慧医院建设标准后,我长舒一口气:几年建设已经完成了我们的五年规划。但信息化建设下一步如何发展?继续卷数据治理?走数字化转型发展,还是开启人工智能的应用实践呢?这又是一个摆在我案头的问题了。

  2023年,随着ChatGPT带火全球AI热搜,答案逐渐清晰——医疗AI将是未来的应用方向,AI不落地,谈何高质量发展?于是,我们再次郑重把"人工智能引擎"写进了建设规划。然鹅……现实很骨感:算力贵如金,人才难寻觅,试错成本高,这些都不是短期能够完成的任务。咋办?先加强自身知识储备吧!

  2023年,在参加完人工智能培训班后打开了新世界大门。虽然日常还是用千问、文心一言搞点"帮娃写作文"的基本操作,但也养成了每天刷AI公司动态的"赛博养成"习惯。直到2024年某天,幻方公司扔出一颗深水炸弹——开源大模型DeepSeek,评测榜直接屠榜!必须用起来呀,好家伙,初次体验后,回答深度就直接碾压我这从业三十年信息老专家!更香的是,它居然支持单卡部署!当即申请了一台4.8万的工作站(配RTX4090显卡),想着就算搞不成,也就只有4.8w,我也没有那么大负罪感。

  2025年春节,就如同窗外的礼花炸响般突然,DeepSeek彻底封神!它凭一己之力打破"算力霸权",让通用大模型变得像手机APP一样亲民。和其他行业一样,医疗圈也瞬间被DeepSeek炸锅了,各家医院疯狂内卷AI落地——这一刻,我是又后悔又庆幸,后悔自己没有提前做算力资源的储备,庆幸的是,我们的显卡终于要发光了!如此逆天的应用,我们也可以部署了。

实战篇:从部署开始的探索

  1.知识库搭建:让制度文件学会"自动答"

  技术组合拳:Dify低代码平台 + DeepSeek 14B蒸馏模型 +bge-m3通用向量模型

  先说我们的开发部署环境吧,我们采用了dify+DeepSeek的方式。Dify是一个专注于生成式 AI 应用开发的平台,采用低代码开发模式,且兼容多个大模型。这也方便以后的应用扩展。基于硬件条件,我们先部署了14B的蒸馏模型,并利用bge-m3通用向量模型将信息科的各种制度文档切成"知识块"转化为向量模型,存进数据库。通过 DeepSeek 提供的 API,将知识库与模型连接。在调用 DeepSeek 时,将用户问题转换为向量,在向量数据库中进行相似度检索,获取相关知识单元向量。将检索到的知识单元作为上下文信息,与用户问题一同发送给 DeepSeek 模型,使模型基于知识库内容生成更准确、符合制度要求的回答。这样就搭建起了第一个知识库应用。

  通过测试,DeepSeek所具有的强大逻辑分析能力可以将问题转化后提供最贴切的回答。这一下就激发起了我们的热情,同时开始深挖硬件潜能,完成了32B版本的部署,于是一边调整参数一面开始邀请各个部门来参观,共同探索如何更好的将DeepSeek应用到实际的业务场景。

  实践技巧:经实践DeepSeek对于Markdown和HTML文件的读取正确率最佳,word文件如果其中有表格之类的控件,需要进行预处理。

  效果:从此,新员工问"怎么申请服务器权限",AI秒回制度条款+操作指南,信息科老员工从此就有了"失业"危机感。

  2.代码生成与审核:程序员的摸鱼神器

  一直以来程序员都是信息科的心头宝,能让IT厂商提供驻场程序员更是医院梦寐以求的待遇。然而现实情况是,程序员稀少,好的程序员更少。经常我们遇到的就是开发进度无法把控,开发质量难以掌控的痛点。那看看DeepSeek如何发挥作用吧,DeepSeek-Coder-V2能够根据指令自动生成代码。

  部署方案:DeepSeek-Coder-V2接入VS Code,代码生成+审核一条龙

  实战案例:让AI写个"临床配送中心资源调度算法",只见它噼里啪啦输出Python代码,连异常处理都带注释!更绝的是,把祖传代码丢给它审核,直接标出3处内存泄漏+解决方案——我不知道工程师怎么想,反正作为信息主任,那一刻我感觉天空是格外的蓝。

  3.文档诊疗室:专治PPT废话文学

  文档分析能力可是DeepSeek强项,拿一份项目管理文档给它,看看DS老师给出啥意见。

  硬核操作:甩给AI一份项目管理文档,5分钟后收获"标红批注版"。"第8页'优化迭代闭环'建议改为'需求-开发-验证循环';第12页风险预案缺少备用供应商清单……"这比我看的都快,都仔细。以后我可就轻松多了。

  附加Buff:AI的思维过程,还是一个经验展示的"心路历程",堪比请了个24小时在线的麦肯锡顾问啊!各位老司机,就问你慌不慌,以后职场小白们都不会找你了。

  4.翻车现场:当AI患上"幻觉症"

  大型社死:让DeepSeek翻译医学论文,结果把《炎症因子机制研究》翻成《小白鼠健身指南》……

  这有一篇SCI论文,让它翻译写个摘要。很快,翻译的中文全文也出来了,看起来像模像样的,又有点不对味呀。翻出原文让豆包给翻译一下,果然,这次翻车了。文章是一篇写炎性反应研究的医学论文,而DS给整出了一篇小动物训练的中文文章。哈哈,不会这就是AI幻觉吧。这里省略1000字,经过查询,发现了问题所在,DS没有正确的读取到这篇PDF的内容,于是它就发挥自己的“想象”,写出了这篇中文文章。

  破案时刻:原来PDF解析模块“抽风”,AI开启"一本正经胡说八道"模式。

  解决方案:PDF文件通过minicpm-v多模态模型解析+DeepSeek推理,从此AI被迫学会"知之为知之"。让DeepSeek能够正确读取各类数据是我们在实践过程中不断遇到的,看来有必要开发一个通用模块来统一知识库的数据格式。

  5.疾病编码训练:从"大而化之"到"精准到细胞"

  做好了专属知识库就可以利用DeepSeek强大的逻辑分析能力来进行病案编码了,只需要我们将患者就医期间的各类病历文件提供给它,剩下的工作就是等待它出结果。当然前提是我们提供的数据准确性高,标准化程度高。如果只是依靠Deepseek自身的知识库,它仅仅能实现亚目编码,还是无法满足编码需要。

  痛点:内置ICD-10编码只到亚目,实际需要细化。

  改造方案:把我们已经完成的院内标准诊断库数据喂给AI,结合规则引擎做强化训练,现在让AI看到"患者主诉菊花疼",还需要判断急性期还是慢性,是瘘还是裂,然后再淡定输出K60.000、K60.100或者K60.301、K60.302、K60.303这些细分项了。

  时间在我们的探索中飞逝,DeepSeek的实力也在不断呈现,短短20多天,我们就已经摸索出了10多项应用,从知识库的建立到CT片的解读,心电图的分析,健康体检报告的评估。在持续探索中,我们也对硬件进行了升级,现在已经是双A6000的配置了,速度那是嘎嘎的。对比10年前的移动互联网医疗的兴起,现在DS的应用呈现更快速的迭代升级。每天都有各个行业接入DeepSeek的新闻在轰炸着大众的眼球,医疗行业也不断的报道着兄弟医院的实践成效,基本上形成了不接入DeepSeek都是落后的态势。这不仅是给了信息科一个添置GPU硬件条件的契机,更体现各位工程师的学习能力,必须开始恶补人工智能的知识和操作技能。当人工智能在各个行业广泛应用时,其实不仅仅是程序员面临下岗的风险,其实原本那些非常紧缺的岗位,比如病案编码人员,这种依靠大量工作经验刷出来的岗位,很快也就会被系统替代。

  警惕啊朋友们!现在连临床医生都能用DeepSeek写代码了,信息科再不转型,恐怕要沦为"重启开关专业户"。一句话:拥抱AI,保住工位;原地躺平,必被淘汰!

后记

  以上是对我们DeepSeek使用探索的真实记录,欢迎大家批评指正,共同把DeepSeek这个开源大模型工具用好,解决实际问题。

  作者简介

  1 黄昊,CHIMA常委

  2 陈俊羲,重庆大坪医院信息科工程师

CHIMA大讲堂直播预告

  在数字化转型的浪潮中,DeepSeek作为数据分析与智能化的利器,已在医疗领域展现出巨大潜力。本期大讲堂聚焦DeepSeek系统的部署优化、数据分析及场景探索三大核心模块,深入探讨如何通过技术手段提升医疗服务的智能化水平,为您提供实用的操作技巧与前沿的行业洞察,助力您在医疗数字化转型中抢占先机。

1.jpg

  扫描图片上方二维码可线上参会

  点击此处可进入CHIMA大讲堂