医疗大模型从小事做起(三):产品形态

发布时间:2024-09-20
浏览次数:

案例

  最近一段时间,我跟大模型的关系突然变得密切起来,我想了想,出于两个原因:

  一是在准备开学的过程中,我查阅了大量文献和资料。对于看文献资料这样的沉浸式深度阅读,保持注意力专注是非常重要的。但是,读文献难免遇到自己不懂的地方,在检索的过程中,注意力需要在不同的标签页、窗口或者应用之间切换,还要分辨不同的查询结果,从中筛选自己想要的内容,不可避免地对专注力产生干扰。

  二是市场上大模型的产品形态悄然发生了变化,解决了上述问题。开发者突然意识到,与其拼参数性能,不如更贴近用户,既贴近使用场景,也贴合用户习惯。因此,大模型迅速以“插件”的方式,开始占领用户的高频使用场景。

  比如,小米手机在任意应用的文字输入框显著位置,增加了帮写插件,可以自动帮用户润色、续写、代写聊天内容等。

  腾讯把自研大模型混元大模型以插件的形式塞进了自家的QQ浏览器里,包括手机端和PC端。这种创新显著改善了我的阅读体验:在手机端,我可以把一篇感兴趣的公众号文章用QQ浏览器打开,然后实现同屏下的自动总结、边读边问等操作。在PC端,大屏幕给了大模型更好的发挥空间,我可以用浏览器打开文档,然后让大模型阅读插件以侧边栏的形态出现,通过划词搜索等方式,实现了同一块屏幕、同一个窗口下的“哪里不会点哪里”。

  这种新潮的阅读体验很快带来“甜蜜的烦恼”,随着KIMI、豆包等先后发布浏览器插件,在阅读文献的过程中,出现了插件扎堆打架、功能同质化的情况(有兴趣的读者可以自行下载体验,这里就不上图了)。除了同质化,还有个问题:同一个用户跨平台调用大模型的对话记录不能同步。如果站在AI Agent的角度,以人的定位去看待产品逻辑,显然这种“健忘”是不合格的,如果聊天记录没法保持连续性,那么其价值将大打折扣。

  这场大模型插件在我浏览器中的排位之争,最终随着豆包大模型发布了其PC版的产品,而告一段落。因为PC版的豆包大模型,安装后可以常驻操作系统右下角,提供全局性质的助手服务。相对于浏览器的插件模式,这种全局模式适用面更广,也给我看文献带来很大便利。目前,我把PC版的豆包大模型设置为随开机启动。这应该也是用户给予一款应用最高的认可(仅次于付费)。

  顺便说一句,除了简单的“解释、追问、翻译”等,基于浏览器的大模型插件已经开始做视频总结、要点梳理等深度工作,如果这个功能早出来半年,我在看网课的过程中,可就省事多了。当然,这是题外话了。

思考

  大模型插件和应用,通过侧边栏、任务栏等方式,很好地提升了用户端的产品体验。用户通过“哪里不会划哪里”的简单操作,就可以在专注于内容本身的同时,快速调用大模型进行搜索、翻译或内容总结等操作,而不至于被频繁的窗口切换和操作所干扰。

  在医疗大模型的开发应用中,也可以借鉴上述思路。

  1.以目前医院的工作环境来看,综合考虑屏幕大小、应用匹配度、算力等因素,PC依然是主流办公工具,而浏览器也是高频次的应用。在这种情况下,打通浏览器和大模型,为专业用户提供更顺手的生产力工具,成为一种好的选择。特别是浏览器,本身就在HIS中占据了重要的入口位置,更有必要与大模型打通。

  2.之前流行一种观点:所有行业、软件等,都值得用AI重做一遍。但是目前来看,也不是非要重做,像浏览器插件这样,用更轻巧的方式打通行业和大模型,不失为一种更划算的部署方式,不仅可以潜移默化地改变专业用户的网上办公习惯,还能增强用户对于AI服务的依赖度。

  3.前面提到,我在自己的办公电脑上,给了PC版的豆包一个随开机启动的权限,我仔细想了想,上一次我给一个非系统应用这样的权限,还是QQ。相信很多人都跟我有同样的回忆,有那么些年,开机联网后第一件事就是登录QQ,否则你就感觉工作和生活无法展开。那个年代的QQ,虽然在软件下载的分类中是聊天工具,但实际用处早超出了聊天工具。

  眼下,随着我重新将PC作为第一生产力工具,随着开机启动的不再是QQ,而是豆包大模型。这说明,用户对大模型工具可能会期待更多,除了提问回答等基本功,还要向AI Agent靠拢,能够感知环境、进行决策和执行动作,还要打通PC端和手机端的问答记录同步等,真正成为医生手机里如影随形的“小秘书”。

  以上内容为个人思考,仅供参考。文中提到的各产品品牌,仅为便于描述,不做任何推荐。

  作者简介

  李楠,CHIMA委员。现从事医院管理和信息化工作。作者观点仅代表个人,纯属技术交流,与供职单位无关。