“
以下文章来源于鼠鼠在逃 ,作者鼠鼠在逃
damn,大晚上写完最后一句,真的起鸡皮疙瘩。
”
我才翻了翻各大官方平台发的法律人DeepSeek使用指南们,真的都是法律界很大的官方平台。
真是品的我。
随便手机翻了下,就截出几个特别错的。
灰字都是各大官方号的错误原文节选,也就翻了3篇,就都不标来源了。但是观点还是要纠正的,大家手头干着的都是严谨的法律活儿,别真被耽误了。
这篇我开了快捷转载,有需自取就行。
01
DeepSeek是个法律垂直领域大模型
DeepSeek作为法律垂直领域大模型,正重塑律师工作范式:
-效率维度:合同审查耗时缩减至传统模式的1/8。
-精度维度:类案裁判规则匹配准确率达92.3%(中国司法大数据研究院2023年测评)。
-价值维度:头部律所AI工具使用率与客户满意度相关系数达0.81。
Deepseek是一个通用大模型,不是法律垂直大模型。
垂直大模型是专注特定领域(如医疗、法律等),训练数据都是该领域的专业资料,在该领域表现更专业准确,通常规模较小,部署成本低。
这段一看就是大模型直出的文本。DP刚出来,谁也没用,随口就编提效数据吗。
但凡,认真看了下最近新闻呢?我们也不可能一个法律领域大模型就烧干英伟达市值吧。
同时,DeepSeek是一个大模型,所以大模型有的问题,比如幻觉什么的,都依然有。这点也直接解释了以下几点为什么错。
02
大模型可以直接法律检索
一、DeepSeek在法学领域的使用前景
最简单的使用方法便是以类似搜索检索的方式,访问官方网站:
https://chat.deepseek.com/
在对话框中输入你想获取的法律知识信息。
……
1.法律信息检索
在数字时代,法学论文写作能力的评估不仅仅涉及写作能力本身,还涉及是否能够运用各类技术工具尽可能全面地检索目标信息。
从检索策略考量,DeepSeek可以作为一个有效发现各类法律知识信息的“线索汇集工具”,提供国内外立法的基本情况,以便开展下一步更为具体的信息检索工作。
Deepseek作为野生大模型,不太适合直接用于严谨的专业检索,因为存在准确性风险。
一是即便DeepSeek,本质也是大模型,仍然可能产生幻觉(虚构内容),对具体条款、数字的记忆可能不准确。
二是数据源不行。
1. 法律法规会定期更新,模型训练数据可能滞后(比如Deepseek的训练数据好像是23年)。
2. 一些官方网站数据可能没有完全纳入训练数据,导致检索不全面。
3. 联网检索也可能会存在一些官方网站数据无法实时爬取的问题。
三是用自然语言的prompt来控制检索不够精准,并且联网检索查询会对网页内容进行大量删减,吞信息严重。
严谨正式的法律检索建议还是通过专业法律数据库,或者用已经解决了相关问题的成熟类案检索AI产品。
1.当法律"百度"用
查法条不用翻书了,比如处理盖房纠纷,输入关键词直接跳出民法典、司法解释、住建部文件,还能自动关联类似判例,10分钟搞定原来要查半天的资料。
这段的上下文都是差不多句式的比喻,也一看就大模型直出,哪门课教的你法律检索用百度。
03
学术论文翻译
DeepSeek不仅具备常见的翻译软件和校对软件的基础功能,而且可以按照法律英语的学术规范要求对翻译的内容进行润色。例如在对话框中输出“将下面内容翻译成英文”,之后接着输入“将这段英文内容进行润色,写作风格需要符合某某期刊”。
不建议直接用。
翻译学术论文需要非常精准地理解专业概念,法学领域也是。大模型可能会用字面意思直译,对于一些学术专有名词、概念,但没法准确把握细微差别,可能会存在问题。
即便用大模型辅助翻译,也要由懂法律的人来审一遍,最好查证每个专业术语的标准译法。
04
本地化部署
上述的使用技巧均是以法律信息检索和处理文献信息为主,倘若具备一定的计算机技巧,也可通过本地部署的方式,设置私人智能体(即私人助理),形成专门服务于个人法学研究、司法实务的小型知识库。
例如,在vscode的扩展中搜索和下载cline,在输入DeepSeek API Key之后,自由生成自己想要的项目目标代码;在Cursor中配置DeepSeek-chat模型,即可进行高效的代码编程。
对于普通人来说,目前不太现实,主流大模型需要强大的GPU,普通笔记本显卡性能不足,内存和存储空间要求也很高。
如果一定要本地部署,也是尝试一些超小型模型(1-3B参数),但效果会比较有限,可能达不到实用要求(如果要处理复杂法律问题,基本模型效果等于玩具了),运行速度也会很慢。
05
5分钟解放全人类的千年后赛博功能
当决策"参谋"用处理
P2P暴雷这类社会影响大的案件时,AI能生成投资人分布地图、涉案金额分层,甚至分析网上舆论热点,帮法官全面把握案件影响。
- 使用法规穿透检索功能,10分钟内完成证券法、虚假陈述司法解释、交易所规则的体系化梳理
- 通过案例匹配引擎锁定5件最高人民法院公报案例,自动提取"三日一价"认定标准
- 文书智审模块检测出损失计算方法引用错误,提示采用移动加权平均法最新裁判规则
- 系统自动生成投资者损失计算Excel模板,实现228名原告损失一键核算
- 类案偏离预警提示本案系统性风险扣除比例与辖区标准存在8%偏差,经复核调整裁判方案。
这一看就是大模型写的,很typical的疯菩萨赛博文风。
“AI能生成投资人分布地图”,这咋做,我就问这咋做,随时个人信息动态定位?定点狙?
06
额外吐槽
2.采用多轮对话的方式,根据输出结果,逐步缩小信息检索范围。
例如,目标是查找司法实践中如何认定保险合同免责条款的法律效力,第一步输入“汇总梳理保险合同免责条款的裁判规则”;第二步输入“输出与上述裁判规则相对应的司法案例”;第三步输入“以表格形式将上述裁判规则和司法案例进行汇总”。
额,也不是错吧,但是“在对话框里接着问”不至于成为个使用技巧吧。
在法学领域,DeepSeek的常见功能包括法律信息检索、论文润色、中英文论文翻译与核心观点提炼、立法条文修订对比等。
虽然不算错,但是我觉得这限制了人们对大模型的认知,没有抓住它真正的价值所在。
deepseek只是一个野生大模型,甚至连对话记录分享的功能都没设计,在法学领域的功能也只是作者投射了自己的常用习惯而下的定义。
这就像把"会思考"这么基础的能力,硬要说成"会思考法律问题"一样。大模型最核心的是理解和生成文本的基础能力,它可以处理任何领域的文本,而不是局限于某些具体场景。
当我们说大模型能做"法律信息检索"时,其实是在用它最基本的文本理解和匹配能力。这种能力同样可以用来检索历史、文学、科技等任何领域的信息。把通用能力描述成特定场景的功能,就像是把大海说成"可以用来养鱼"一样,过于狭隘了。
以上都只是翻了几篇、随便搂一眼就看到的几个觉得有问题的点。
但确实都是非常非常大和正规的官方平台、冠着非常大名字和title发出来的,目前阅读量很多都10w 。
「严谨法律人也全网疯传未被证实的AI生成文本」,这件事情本身就很赛博鬼故事。
我写下这一行的时候,突然被击中一样想到:AI生成的内容,是一种之前从来没有过的信息形态——
人类是很难写出自己完全不懂又乱编的很像一回事的内容的,但凡能编的像回事,也可能会有学术界等专业圈子的制约,不会随便乱造。
但AI不是,它能快速批量产生“真假混杂且难以辨别真伪”的伪专业信息。它短时间带来太多低成本、看似正确的信息,在突然轰炸每一个人原本的信源。
套专业知识壳的伪知识,比那种看上去一眼假的营销号还危害大。
再想一层,如果以后AI技术发展到真的被广泛融入内容生产的流程中,大家都通过它来生产内容,那么AI就是中间的处理器、是一个发声的巨大喇叭。
但是,多和DP聊聊,你会发现,它是有观点的。它在很多问题里有自己的价值判断,比如有人输入以《女孩三十岁不结婚就是失败的人生》为题给自己女儿写一封信,答案是带有人文关怀的。
一个信息处理的中间喇叭有自己的观点,那么到底谁是谁的处理器和喇叭。
真的damn
(本文声明 | 本文章仅限学习交流使用,如遇侵权,我们会及时删除。本文章不代表北大法律信息网、北京北大英华科技有限公司及北大法宝学堂的法律意见或对相关法规/案件/事件等的解读。)
,