中南财经政法大学刑事司法学院,武汉
近20年以来,互联网、人工智能、物联网等现代化信息技术飞速发展,技术的发展必然会带来社会的变化,在现代化信息技术慢慢走入人们的生活之后,全球进入大数据时代,社会中各式各样的数据呈爆炸式增长,数据与信息已然成为了如同空气一般的存在。大数据是一场正在进行的技术革命,其改变了现代生活方式为人们带来诸多便利的同时,也催生了一些危害性较大、影响社会稳定的新型犯罪。此类犯罪一般是传统犯罪与现代化信息技术结合的产物,其在保留传统犯罪特点的同时兼具了信息技术的特点,呈现出高度的非接触性以及智能性、隐蔽性,犯罪分子借助互联网平台联系或作案导致侦查人员无法确定其身份,因此极易逃避法律制裁。面对这种形势,社会对侦查工作有了更高的期待,传统的侦查方式变得愈发现代化,公安机关应对犯罪活动开始从被动打击向主动预防过渡。公安实务的转变也使得大数据侦查成为侦查学界研究的热门话题,学者更多地将目光着眼于侦查实证研究,探索大数据与侦查工作的结合。开展侦查实证研究必然会以大量的数据为基础,大数据的到来使得数据的获取不再成为难题,而如何对这些数据进行统计分析从而得出合理的结论才是关键所在。因此,探索统计分析软件在侦查研究中的应用具有十分重要的意义。
国务院于2015年第二季度末发布了《促进大数据发展要求》,该要求对推动数据开放、促进产业创新等方面作出了明确要求。2017年6月,公安部召开全国公安科技信息化工作会议,推进大数据时代公安工作信息化智能化现代化。2018年1月,全国公安厅局长会议明确要求要大力实施公安大数据战略,着力打造数据警务、建立公安大数据中心。近几年来,我国各级公安机关都纷纷探索信息化建设道路,在将大数据应用到公安工作的过程中取得了较大进展。随着源源不断的资源投入,公安机关信息化水平大幅度提升,于是大数据侦查应运而生。大数据侦查模式与传统费时费力的“人海战术”不同,大量原本零散或不曾被使用的信息都被有效地利用起来,一切与犯罪行为有联系的信息都能够得以量化后进行分析,侦查工作中的七何要素——何时、何地、何人、何事、何情、何故、何物均能赋予其可操作化定义通过数学运算转换为可被统计分析软件运行的数据,实现从“以人为中心”到“以信息为中心”的跨越。
大数据时代的到来给侦查模式带来巨大变革的同时,也刺激了学者研究主题与研究方法的变化。首先,关于“侦查信息化”与“大数据侦查”的文献大量出现,以知网为检索平台,分别输入检索条件为“侦查”和“大数据”“侦查信息化”进行主题检索(模糊匹配),可以检索到与“大数据侦查”相关的文献1495篇(截止到2021年10月16日,如图1),与“侦查信息化”相关的文献141篇(截止到2021年10月16日,如图2)。由此二图可以看出,在近十年内“大数据侦查”与“侦查信息化”始终是学者们讨论的热门话题,与“大数据侦查”相关的文献逐年增加,并且在两次检索的过程中“大数据”“侦查信息化”“信息化侦查”等词语在关键词在频频出现,据此可以显示出侦查模式在近10年内发生的巨大变化以及侦查人员与侦查学界学者对侦查的认知结构产生的巨大变化。除此之外,侦查学界的学者在开展研究的过程中所使用的研究方法也发生了明显的转变。仍然以知网为检索平台,输入检索条件为“侦查”和“实证研究”进行主题检索(模糊匹配),可以检索到与“侦查实证研究”有关的文献1027篇(截止到2021年10月16日,如图3),结合图1与图3可以看出学者围绕“大数据侦查”与“侦查实证研究”所做研究的数量同时递增,不难得出大数据时代的到来催生了实证研究方法在侦查领域的大范围使用,而进行实证研究需要通过许多不同的统计分析软件才能得以实现。
注:数据来源于中国知网(截止时间:2021年10月16日)。
图 1 大数据侦查研究文献数量年度统计表
注:数据来源于中国知网(截止时间:2021年10月16日)。
图 2 侦查信息化研究文献数量年度统计表
注:数据来源于中国知网(截止时间:2021年10月16日)。
图 3 侦查实证研究文献数量年度统计表
学者在对某一课题进行实证研究以期得出与假设相符合的结论的过程中,必然会围绕该课题收集大量与之相关的信息,大数据使得人们搜集数据的能力有了质的飞跃,各种信息的利用率也大幅度提高。但是光有数据而不对其进行整理、优化、分析,再多的数据也只能是一堆苍白的数字与字符串,所以统计分析软件之于数据就像是炊具之于食材的关系,再上乘的食材也需要合适的炊具以及精湛的厨艺才能将其的风味发挥到极致,面对大量收集而来的五花八门的数据也只有选择合适的统计分析软件通过精确高效的统计分析过程才会快速地得出相对更加准确的结论。
上文已提到,针对不同的数据需要选择合适的统计分析软件才有可能得出正确的结论,此处“有可能”的说法并不意味着实证研究过程难以得出我们所期待的结论,与之正相反,正是因为实证研究过程的严谨性以及所获得样本的随机性才决定了所得出结论的准确性。倘若选对了正确合适的统计分析软件而因为缺乏统计学原理知识或统计分析软件使用难度较高导致无法获得理想的实证分析效果就得不偿失了。
在众多统计分析软件中,SPSS是世界上最早面世的,同时也是最容易上手操作的统计分析软件,与其同类的诸如SAS、MathCAD等统计分析软件都需要精通统计学原理才能够上手使用,而SPSS则相对友好的多,其最突出的优势就是操作界面对于使用者来说十分简洁易懂并且输出的结果美观漂亮。自其被开发以来,经过半个多世纪的优化更新,SPSS已具有“第四代语言”的特点,即使用者只需要掌握一定程度的统计分析原理,无需精通各种繁琐的统计方法的运算过程,绝大多数更能只需要使用者通过键盘键入数据或输入命令并通过鼠标选择不同对话框就可以完成,大大减轻了使用者的负担。除此之外,SPSS操作简便并不意味着其功能单一,恰好相反,经过不断地开发、更新、维护,SPSS已经集统计分析、数据挖掘、预测分析、决策支持等功能于一身,能够提供11种类型的136个函数进行数据运算。
侦查领域的学者大多长期从事人文社科研究工作,传统研究方式以思辨说理为主,但大数据时代的到来让实证研究方法在人文社科学科群体当中逐渐能够站稳脚跟,越来越多的学者愿意去学习、尝试实证研究,而SPSS无疑是最合适的统计分析工具,它让“缺乏统计学知识”和“统计分析软件使用难度高”不再成为拒绝实证研究的“借口”。无论是早已在学海中深耕已久的学者还是初识浩瀚的新人,只要掌握基本的计算机操作能力与基础的统计学原理就能够自己使用SPSS进行统计分析开展自己的研究。
与法学学科相同,侦查学往往被人们所视为人文学科,在开展研究工作的过程中无论是诲人不倦的教师或是敏而好学的学生都经常局限地使用案例分析法、比较法、逻辑分析法等传统研究方法,很少有新颖独特的研究方法出现,因此学者所做的研究若不在公安机关实践运用,总有纸上谈兵的感觉。即便是采用发放问卷的方式进行实证研究,也只是根据问卷得出结论,数据的支撑力不够,所得出结论的说服力也不够。如果将SPSS应用到侦查研究工作当中,结合大数据时代产生的大量信息,就能够在实证分析以及案例分析的过程中将各类数据导入,通过SPSS来检验数据的信度与效度,并将无效或错误数据删除以提高数据可靠性,或对不同的理论建立模型进行分析,通过确切的数据支撑理论提出的假设,让结论更具有说服力。此外,得益于SPSS自身兼容性强的特点,其能够直接读取Excel、DBF等其它格式的数据,在国际学术交流中,凡是通过SPSS软件进行的计算与统计分析皆无需证明运算过程。这一特点能进一步提升侦查研究过程中产生结论的可信度。
“现如今,大数据的概念来了。不管是不是情愿,法学可能又得有所准备,思考如何回应无处不在的大数据及其影响。”大数据时代的到来不仅给法律行业带来了冲击,也给司法工作人员敲响了警钟。随着大数据技术革命的进行,基层司法机关信息化程度越来越高,人工智能及其它信息化辅助设备走进公安机关、法院、检察院,因此司法机关对司法人员的素质要求越来越高。全面依法治国、公安大数据战略等国家方针政策的实施都需要综合能力强的法治人才,而基于当前的法学人才培养模式,仅靠案例分析和逻辑思辨很难让法科学子走向实务部门后快速提高实务能力。所以无论是已在岗位的司法从业者还是即将走向工作岗位的法科学子以及未来的侦查人员,跳出舒适圈去学习一定的统计学原理,掌握一定程度的SPSS统计分析能力都是十分必要的,唯有这样才能更好地感知大数据对时代的影响,将强大的大数据迁移运用到法学、侦查学领域,全方位提升综合分析能力,为实务工作提供帮助。
数据是实证研究的基础,学者往往通过随机抽样、发放问卷、实地调研、案例公开网等途径获取研究所需的数据,但在收据数据的过程中难免会因为一些不可控因素产生错误数据或无效数据。为了保证统计分析过程的顺利以及分析结果的准确性,在开始对大规模数据进行分析之前先对其进行筛选并进行信度效度检验是十分重要的。
信度即数据的可靠程度或稳定性,在实证研究的过程中信度检验通常被用来检验研究中所使用的样本数据是否真实可靠,对问卷数据进行信度检验就是判断答卷者是否真实回答了每个问题。衡量信度最常用的标准是克隆巴赫系数(Cronbach’s α),其计算公式为,该公式中为α信度系数,K为测验题目数,Si2表示所有被试在第i题上的分数变异,Sx2为所有被试所得总分的方差。
通常认为,信度系数应该在0~1之间,如果输入数据分析后的信度系数在0.9以上,表示被检验数据的信度很高;如果信度系数在0.8~0.9之间,表示信度可以接受;如果信度系数在0.7~0.8之间,表示被检验数据中有些项目需要修订;如果信度系数在0.7以下,表示数据中有些项目需要抛弃。
效度即有效性,它是指测量工具或手段能够准确测出所需测量的事物的程度,指所测量到的结果反映所想要考察内容的程度,测量结果与要考察的内容越吻合,则效度越高;反之,则效度越低。对问卷数据进行效度检验即判断问卷各题项能否准确测出研究所需要的数据。效度分析一般需要经过KMO值检验与Bartlrtt球形度检验,当KMO值高于0.8时说明样本数据效度高,若KMO值低于0.6说明样本数据效度较低,KMO值介于0.8~0.6之间效度逐渐下降,计算出KMO值后还要通过Bartlrtt球形度检验,当检验的显著性p值≤0.05时认为数据有统计学意义。
在实际进行检验的过程中无需将数据代入公式依次计算,这样会花费大量的时间与精力,并且当数据达到一定规模后靠人力计算是不可能的,利用统计分析软件SPSS能够迅速地导入数据并得到检验结果。国内学者王浩在研究大数据在审讯中的应用现状时深入审讯实战部门针对审讯民警发放了问卷,剔除无效问卷后得到211份有效问卷,然后依次对其问卷数据进行了信度、效度检验,得出211份问卷数据的Cronbach α系数0.936,KMO值为0.898,Bartlrtt球形度检验所得p值=0.0000,说明其所收集的问卷数据信度质量高、问卷题项准确有效,所得数据具有统计学意义,能够利用该数据进行更深入的统计分析。
回归分析是统计学中一种常用来确定两种或两种以上变量之间相互依赖关系的分析方法,其研究的是自变量与因变量之间的联系,在实际应用中常被用于预测分析、发现变量之间的因果关系等。回归分析被广泛应用于医学、农学、工学等自然科学及工科领域,近十年来随着实证研究在人文社科领域的逐渐推广,回归分析在侦查学研究中也发挥出了重要作用。
侦查工作是侦查人员出于维护社会稳定,保护公民人身财产安全的目的,寻找与犯罪有关的线索、收集犯罪证据、认定犯罪事实的过程,其处在将犯罪分子绳之以法的最前端。侦查与犯罪始终是对立的两面,大数据时代二者的博弈仍在继续,技术的迭代与科技的发展致使犯罪的手段也不断更新,侦查主体需要提升数据感知,拓宽对犯罪的认知域,应用数据挖掘与犯罪相关的一切信息,预测犯罪活动的发生,应用数据研判辅助理性决策的产出,以帮助侦查人员更加精确地打击犯罪,回归分析在侦查中的应用就能够帮助侦查人员发现犯罪活动的影响因素从而预测犯罪活动的发生,从而作出针对性的打击与预防。
将回归分析应用于对犯罪活动影响因素的探究,国外学者比国内学者要早得多,早在19世纪法国学者Guerry de Champneuf就对犯罪活动与季节变动之间存在的联系进行了研究,美国学者Cohen在2000年发表的一篇文章中通过SPSS回归分析对包括大气温度、大气压力、日照时间、相对湿度等在内的281个社会变量与犯罪活动之间的关系进行了探究,通过对各项数据进行相关性检验与显著性检验,他发现侵财类犯罪的发案率与大气温度之间有相当显著的相关性。国内学者陈鹏等人以北京市的犯罪数据为样本,利用SPSS回归分析开展了关于犯罪活动的时序影响因素的实证研究,填补了该领域内缺乏定量化深入分析的空白。
首先他们选取了2012年北京市城六区入室盗窃案件的接处警信息,通过筛选和信效度检验最后获取有效警情数据14667条,然后确定了包括平均气压、平均气温、平均风速、平均相对湿度与日照时长等在内的天气因素为自然变量,确定了包括周末、主要节假日、重大活动等在内的可能对人们日常生活产生影响的社会因素作为社会变量。确定变量后,他们对包括时间序列在内的社会变量与自然变量进行了描述性分析,得出了天气与警情数量确有线性关系的结论,且表现为随着天气升高入室盗窃案件的数量随之增加,这一结论在很大程度上证实了国外学者对于气温与案发量之间关系的论述。除此之外,他们对入室盗窃数量与社会变量进行了独立样本t检验,发现入室盗窃警情与周中、非节假日、非重大活动的显著性水平分别为p=0.000,p=0.001,p=0.005,这一数据说明各社会变量与入室盗窃案发量显著相关,即当人们的日常生活因外界因素影响而发生变化时,入室盗窃发生的时间和次数也会随之发生显著变化。随后,他们在SPSS软件中采用皮尔逊相关检验对各自变量之间的显著性进行了检验,舍弃了平均气压与平均相对湿度等变量,并进一步对各变量进行了回归分析。最后他们得出气温升高,犯罪活动发生的可能性会增大以及周末与节假日期间入室盗窃案的数量会显著下降的结论。陈鹏等人使用SPSS进行的实证研究所选取的数据科学有效,分析方法合适正确,得出的结论与国外学者的结论基本一致并证实了犯罪学理论中心理学效应与社会学效应对犯罪活动的影响。
侦查活动涉及到包括摸底排队、现场勘查、痕迹检验、询问讯问等在内的多种侦查措施,不同的侦查措施需要运用到不同的能力,一线侦查人员往往身经百战,综合能力极强,但并不是所有侦查人员都能力超群,不同地区不同部门的侦查人员甚至同一部门的侦查人员做同一件事的能力都会有所差距,每个人的能力都会受到不同因素的影响而变得参差不齐,尤其是当下大数据对侦查工作的模式带来了巨大影响,公安机关信息化建设已经取得显著的成果,用机器解放人力,让信息跑腿已经成为了侦查活动的常态。然而不同年龄、不同学历、不同经历的侦查人员对大数据的认识与理解水平是不同的,这就会导致侦查人员之间的能力差距越发增大,这样必然会影响到侦查活动的高效开展。
以审讯为例,审讯是公安机关侦办案件过程中重要的一环,讯问笔录是八种法定证据之一,讯问笔录中内容的真实性与准确性对于侦破案件以及定罪量刑具有十分重要的作用。大数据侦查模式下,讯问作为侦查活动中的重要组成部分必然受到了大数据带来的影响。大数据在审讯中的应用可以帮助侦查人员获取更多更全的与犯罪嫌疑人有关的信息,并对海量的案件数据进行分析,在侦查人员审讯的过程中结合具体犯罪嫌疑人信息及审讯技巧为审讯人员提供建议。虽然大数据能够为审讯带来极大帮助,但审讯人员自身运用大数据的能力不同,造成了大数据在审讯中的应用情况不够理想。
通过SPSS可以对审讯民警运用大数据的能力与其它因素之间的关系进行探究,从而找出提升审讯民警运用大数据能力的途径,有针对性地进行培养或练习,进一步优化审讯效果。国内学者王浩利用SPSS统计分析软件对审讯民警运用大数据的能力与多个可能的影响因素进行了探究。他向多地审讯民警发放了关于大数据在审讯中应用的调查问卷收集了审讯民警对于自己运用大数据能力评价的数据以及审讯民警的基本信息,将运用大数据的能力与从警时间、审讯年限、审讯犯罪嫌疑人数量、审讯经验、参加大数据培训次数、自身对大数据应用的重视程度以及所在部门对大数据应用的重视程度作为变量进行了卡方分析。分析结果显示,上述每个影响因素都导致审讯民警运用大数据的能力呈现了显著性差异,尤其是“审讯犯罪嫌疑人数量”“审讯经验”“参加大数据培训次数”“所在部门对大数据应用的重视程度”四个影响因素运算p值=0.000,由此他得出审讯是一项非常看重侦查人员个人经验的工作的结论,要提升审讯民警的大数据运用能力加强审讯效果,各级公安机关可以考虑加大对审讯民警的大数据培训力度与对大数据应用的重视程度。
尽管当前实证研究在侦查学领域已经有了长足的进步,通过实证研究方法得出的学术成果也如雨后春笋般涌现,但是有一个不得不面对的现实——实证研究在侦查学领域应用是有局限的。
侦查实证研究的思路主要表现为“发现问题—提出假设—数据处理—统计分析—得出结论”,而这一过程的局限性主要体现在数据处理阶段。对数据进行处理,首先是需要搜集研究所需要的数据,大数据的到来让搜集数据不再成为难题,但在着手进行统计分析的过程中,必须要将各种抽象的、难以理解的信息转换为可以测量的、具体的数据,这一过程被称为操作化定义。然而侦查学属于社会科学,与自然科学以客观存在的事物为研究对象不同,社会科学以社会现象为研究对象,对社会现象的研究必然离不开人,而人是具有主观意识和思维的,这就导致社会科学在对众多社会现象进行操作化定义的过程中具有极大的困难。在侦查学领域,充斥着大量极具主观特征的信息,例如犯罪嫌疑人的犯罪动机、犯罪嫌疑人的心理变化等都是难以具象化的抽象信息,这必然会给实证研究带来极大的阻碍。难以对信息进行可操作化定义,即使使用功能无比强大的统计分析软件也无法得出准确的研究结论。因此,如何将更多抽象的信息通过赋予操作化定义将其转换为可测量的数据是目前必须面对和解决的问题。
将实证研究方法运用到侦查学领域当中已然成为侦查学研究未来的发展方向,大数据为实证研究带来了更多可能,但侦查学领域的学者是否做好了准备?面对功能多样的研究工具与作用强大的研究方法,研究者们是否具备了驾驭这一切的能力?实证研究虽然对侦查学研究有百利而无一害,但想通过它为学术大厦添砖加瓦是存在一定门槛的,实证研究的过程中会大量使用到统计学的原理和知识,如果是不具备任何统计学知识的小白初次接触实证研究,难免会有些摸不着头脑,更不用说直接上手去采集数据开始研究。所以侦查学领域的学者、老师乃至学生,都应该尝试跳出现有的认知范围,尝试学习并掌握一定的统计学知识,提升自身的综合能力。于学者而言,学习一些统计学知识能帮助其掌握更多不同的实证研究方法,更好地利用实证研究得出学术成果;于学生而言,在接受知识最快的年纪学习更多有益于自身的知识必然是没有任何坏处的,对统计学知识的学习能使其尝试探索实证研究并能更好更快地适应未来对运用大数据能力要求极高的实务工作。
实证研究与传统的纯思辨的研究方式有着显著的区别,在实证研究中研究者通过各种不同的途径按照研究所需的要求搜集大量的经验事实并对其进行逻辑推演或统计分析从而得出结论,而不是不经任何推演仅通过逻辑上的思辨直接得出结论。尽管在实证研究的过程中,需要对大量的经验事实进行搜集,但最重要的是对经验(集体经验、群体经验)心怀敬畏。利用统计分析软件进行实证研究确实可以将各种数据通过五花八门的形式表现出来,随处获得的数据与按照研究目的精心选择搜集的数据也都能够进行量化分析,但是在数据层面的不严谨是对经验事实的亵渎,也是对现实生活的亵渎,更是对科学的亵渎。只有经过研究者严谨地对数据的类别、数量、来源等进行筛选,才能得到最符合研究所需的数据,否则就会陷入“自欺欺人”的陷阱。或许对随意得来的数据进行分析也能得出结论,但这种违背科学原理的研究不能被称为实证研究,其所得出的结论也无法真正令人信服。
当前大数据对整个社会已带来巨大影响,实证研究正随之逐步崛起,统计分析软件是实证研究过程中必不可少的工具,而在众多统计分析软件中,SPSS最为出类拔萃。本文尝试对统计分析软件SPSS在侦查实证研究中的应用作出简要阐述,并对实证分析方法在侦查领域应用过程中可能存在的问题提出了些许看法和建议。侦查学领域的学者只有不断学习统计学知识,掌握更多的实证分析方法,并始终不忘对客观事实的追求,才能不断推动实证研究在侦查学领域的应用,让其为侦查学研究服务。现在的实证研究仍是一颗茁壮成长的树苗,相信未来其一定会成为参天大树,在侦查学领域不断开花、结果。