手抄报向网民提供全面及时的法治资讯,内容覆盖国内外突发新闻事件、法治新闻、大案要案、社会万象、检察新闻、立法司法、反腐倡廉等新闻资讯。

当前位置:主页 > 公益 > 热点:论法律大数据“行业理论”的构建

热点:论法律大数据“行业理论”的构建

来源:网络转载日期:2021-04-09阅读:

本篇文章3703字,读完约9分钟

引用。 法律是大数据最重要的行业应用之一。 近年来,我们目睹了大数据在法律特别是司法场景中的重大迅速发展。 但是,在巨大的实践诉求的背后,法律的大数据应用有时在范围和效果等方面没有被期待。 技术进步的话语使我们被主题的新奇性所迷惑而忽视了法律大数据行业理论的构建,特别是结合法律行业特殊性的本体论、认知论和做法论的反思不足。 本文在充分反思法律行业特殊性的基础上,从本体论、认知论、做法论的角度,尝试构建法律大数据行业理论。 具体任务第一有三个方面: (1)尝试建立法律大数据的基本知识体系,探讨法律大数据3a行业的特点。 (2)尝试更新法律大数据的知识表示逻辑,提出轻量理论驱动行业认识论。 (3)结合法律大数据的本体论和认知论,构建技术和法律深入融合的行业方法论。 一、问题的提出:法律大数据行业理论的现状与不足 (1)法律大数据行业的本体论需要构建 由于业界本体论对法律大数据的反思还很匮乏,因此在这个学术界通常认为法律大数据是具有法律行业采用的4v特征的数据集。 事实上,4v的特征并不完全适用于法律行业。 当然,对4v特征的反省并不意味着全面否定。 反省的目标是不单方面强调大致的量、全样本、高速、实时性、多种观点,特别是pb级别是法律大数据,全样本不是法律大数据等,不要人为设定各地区的大数据和小数据哦。 此外,反思4v特征的目标是吸收其合理因素后,实现基于共同特征的行业快速发展。 (二)法律大数据行业认知论需要更新 由于缺乏对行业认知论的充分反思,现行法律的大数据应用多采用基于大数据观察的知识发现范式。 具体是利用数据挖掘技术,从大量判决书、案件答案等非结构化、半结构化数据中发现和应用法律规则的过程。 这个认知论在大数据和大计算力的支持下取得了一定的效果,但与法律行业的特殊诉求不完全一致。 这是其中之一,演绎思维的冲突。 其二是因果思维的冲突其三是理性思维的冲突。 可见,为了避免法律大数据应用中的做法论与法律思维的冲突,必须更新法律大数据的行业认知论。 (3)法律大数据行业的做法论需要优化 由于在本体论和认知论中应用了大数据的通常分解框架,现在的法律大数据在做法论上具有共同技术+共同过程的优点,即数据获取、预解决、训练、解释、应用等一般步骤中共同的大数据观察 二、行业本体的构建:法律大数据的3a特征 (1)本体视角下的法律大数据概念的明确化 法律大数据本体的构建首先需要实现从法律行业大数据向法律行业大数据的转变。 换言之,从本体论的角度来看,法律大数据是在立法、执法、司法等法律过程中形成或依法取得的,在某种程度上具备大数据的共同特征,同时满足适合性、正确性和容易变性的行业诉求,是法律行业的特定算法 这些概念有三个重点。 其中之一是法律大数据是行业大数据,不是行业大数据。 其二,除通用行业的一些特征外,法律的特殊性使法律的大数据具有特定的行业特征。 其三,法律大数据的行业特征决定了通用大数据观察工具也需要与法律行业合作进行优化。 (2)本体视角下的法律大数据行业特征 法律行业的特殊性决定了法律大数据的一部分除了通用大数据的4v特征之外,还具备从属于法律行业的3a特征。 第一,法律大数据的适应性( adaptability )。 与其他行业强调的样品的大小和完整性相比,法律大的数据特别强调样品的适应性,不一定要求大量的全部样品。 第二,法律大数据的正确性( accuracy )。 在通用行业,样本大数据质量的高低评价标准一般是纯技术的形式评价,如数据缺失、数据重复、数据模式不统一等。 通常,开发者不需要进行样本数据对和错误的实质价值评价。 对此,在法律行业,作为各种算法训练基础的法院判决很可能有对错之分,法律大数据训练样品的质量高低评价除了需要技术逻辑形式审查以外,还需要基于专业逻辑的法学知识的专业评价。 第三,法律大数据的易变性( astability )。 对通用行业来说,数据的价值比较稳定,可以通过多次挖掘进行深入的运用,但对法律行业来说,有些数据容易变性,一旦情况调整,原始数据就会失去发掘价值。 三、行业认知论更新:法律大数据的知识发现逻辑 (1)轻型理论驱动的法律大数据认知论 大数据认知论排除了理论预设,使数据观察先行,相信有足够的数据数据本身就能证明问题。 但是,数据产生于更广泛的知识生产操作,各学科有自己数据想象的规范和标准,就像各行业都有自己能接受的做法和实践的发展结构一样。 完全脱离理论的大规模数据挖掘必须在数据到结构化知识、因果估计之间形成差距。 实际上,随着数据量的增加,理论在大数据观察中的作用越来越重要。 在此基础上科学界提出了轻量级理论驱动( lightweight theory-driven )的认知论,简单地优化了数据驱动的认知论。 作为社会科学的重要行业,法学有鲜明的行业特殊性。 考虑到通用大数据认知论和法律行业因果思维、演绎思维等方面的不兼容性带来的负面影响,结合法律行业特殊性的法律大数据认知论进行反思是很重要的。 这需要更新通用大数据驱动的经验主义认知论,构建结合法律行业特殊性的轻量理论驱动法大数据认知论,将法学理论结构映射到法律大数据的知识发现过程中。 具体来说,首先可以通过法学理论构建法学行业的知识本体,从法律大数据发掘的结构、关系、边界三个方面展开。 其次,通过法学理论明确适合特定目标的法律大数据的子集。 最后,将法学理论作为法律大数据发掘结果的说明框架。 (2)基于新认知论的法律大数据知识发现逻辑 在基于轻量理论的法律大数据认知论的指导下,法律大数据知识发现的逻辑也将相应调整。 轻量理论驱动认知论指导下的法律大数据知识发现是结合法学理论,对符合3a特征诉求的法律大数据进行知识表示、知识提取和知识输出的过程。 具体来说,比较不同的主题(例如类方案推荐、事件证据辅助)进行知识本体的构建,根据知识本体的构建从各种大数据集中提取新闻、训练模式,形成法律知识,行到法律大数据仓库 因此,法律大数据的应用通常是从某一法律数据中获得实质性和有意义的知识(见解)的拷贝/数据挖掘过程。 四、优化行业做法论:法律大数据的知识壁垒及其应对 法律大数据的3a特征和轻量理论驱动的知识发现方法相结合,形成了法律大数据在做法论上面临的行业知识壁垒。 把握行业知识壁垒的成因和表现,进而对比提出应对措施,是这部分行业方法论问题的意义。 (一)法律大数据行业知识壁垒的表现 除了技术进步话语突出的技术瓶颈外,法律大数据观察的各个环节面临着明显的行业知识壁垒。 首先,法律知识表示中法律行业本体的构建需要很多法律专业信息的支持。 对此,我们可以从三个方面展开。 其中之一是法律大数据的知识一般是建立在法律专家知识之上的专家规则。 其二,不同主题的知识本体有一定程度的差异。 其三,法律的行业本体还具有维度多、属性多、要素多、杂七杂八的优点。 其次,作为法律知识发现的数据获取和数据标记的一环,专业信息也是不可或缺的。 在通用大数据行业,普通人如果采用常识,就可以实现优质高效的样品标记。 在法律场景中,标注者不仅需要积累扎实的专业信息,还需要理解事件的整体事实和法律背景,进行正确的标注。 更重要的是,法律行业的标志面临着标准的统一性挑战。 不同的标记人员可能会对同一标记对象形成不同的评价,即使他们有很深的法学专业信息。 可见法律行业的特殊性使数据检索的难度和价格大大高于公共场景。 最后,法律知识的应用也有专业的信息障碍。 另一方面,法律人,特别是实务部门的一线员工由于技术知识背景不足,技术逻辑非常陌生,如果不知道技术能处理那些业务问题,就不能向研发主体提出正确的大数据申诉。 另一方面,法律专家提出的该案同判、财产保全风险警报等很多业务诉讼对技术人员来说也经常有一定的理解障碍。 躺在法律大数据技术开发者面前的差距往往是法律专家的常识,而不是技术瓶颈。 (二)法律大数据行业知识壁垒的应对 对于法律大数据的行业知识壁垒,有必要用行业做法论来应对,通过推进法学和技术的有机融合,提高法律人在法律大数据研究开发中的地位。 然后根据法律大数据的行业特征开展自己的法律大数据技术创新。 更重要的是改变法学人才培养的模式,构建法律知识工程师的培养体系,形成打破法律大数据行业知识壁垒的生存力。 结束语 目前法律大数据的开发和应用还处于初级阶段。 相当一部分的研发主体没有充分意识到法律行业的特殊性。 实践中表现为利用通用大数据技术分解法律大数据,将法律大数据视为通用技术在法律行业中的平移运用。 另外,过劳者将以前传达的新闻化技术包装在法律的大数据和人工智能技术的制造环境中,引起了人们的关注。 放任这种现状的存在最终无助于法律大数据的迅速发展。 因此,识别法律大数据的真正特征,掌握其技术逻辑,进而从实践中造假是推动法律大数据健康快速发展的重要前提。 法律大数据行业理论的构建并不是因为妨碍大数据技术的应用。 相反,行业大数据理论的构建是从优化法律大数据的应用、提高效果的角度出发,推进共同和行业的有机结合。

标题:热点:论法律大数据“行业理论”的构建    地址:http://www.leixj.com/gy/2021/0409/47250.html

最近更新更多