巧用tableau简化审计数据分析
一、大数据审计概述
大数据审计是指审计机关依照法律权限采集各公共管理部门、社会公开的海量数据,利用跨领域、跨层级、跨行业、跨系统的全维度数据,开展智能化的数据挖掘与分析,进行综合审计判断,形成审计结论的过程。
由于鉴证的进行需要依赖于数据,因此,“大数据”时代的到来对当今审计工作的发展是一次难得的机遇。可以看到,大数据与审计活动相结合,将大数据大量化、多样化和快速化的特点融入到审计监督活动中去,这种大数据审计的方式必将产生巨大的社会效用。
二、电子数据审计与可视化数据审计原理的对比分析
(一)电子数据审计原理
现如今大部分审计活动都采用了包括结构化数据以及半结构化数据在内的“大数据”思维来优化审计过程。在审计过程中,被审计单位的大量数据需要经过数据的存储及融合进入云数据库。出于规避风险的考量,审计单位一般不直接使用被审计单位的信息中心来进行分析查找,而是利用相应的审计软件来进行分析。而审计软件通过查询分析数据库中的数据来进行电子数据审计。
电子数据审计,就是对被审计单位的电子数据进行采集、预处理以及分析,从而发现审计线索,获得审计证据的过程。电子数据审计原理如下图所示:
(二)数据可视化原理
数据可视化主要是借助于图形化手段,清晰有效地传达信息并进行进一步的信息沟通。数据可视化技术的基本思路,是将数据库中每一个数据项作为单个图元元素表示,在大量数据集的基础上构成数据图像,同时将数据的各个属性值以多维数据的形式表示。数据可视化的模式使审计单位可以从不同的维度观察数据,从而为分析数据提供便利。数据可视化主要应用于报表,如JReport,Excel,水晶报表等。数据可视化的审计分析原理如下图:
三、电子数据审计与可视化数据审计对比分析——以案例为切入点
通过对比笔者认为,tableau可视化工具能简化审计数据分析流程,采用图像能清晰体现被审计数据的内部联系,从而迅速发现问题。下面笔者将以常用的电子审计工具来进行对比分析。
(一)案例引入
笔者采用某区地税局的2017年税款征收数据为例,将基于SQL的数据库查询方法和tableau可视化数据工具进行对比,来查找2017年一年内多次缴税的人员。
(二)基于SQL的数据查询方法的分析
一般情况下,采用常用的SQL数据库查询语句,查找多次缴税的纳税人名称和法人姓名,编写语句如下:
select [纳税人名称],[法定代表人姓名],COUNT(*) as 同年纳税次数
from [地税数据].[dbo].[税款征收数据表_SBF2017年新]
group by [纳税人名称],[法定代表人姓名]
having COUNT(*)>=2
order by COUNT(*) desc;
而在SQL数据库的操作过程是:点击新建查询,输入查询语句,然后点击“执行”按钮,便可得到需要的结果,如下图所示:
(三)基于数据可视化技术审计方法的分析
点击tableau,新建文件,引入sql数据源或excel的数据源,根据要分析的问题开始建模,在这里即挑选出我们需要的法定代表人姓名,纳税人名称等字段,然后放入工作表进行分析。根据智能显示选择呈现的合适的图案,比如树状图、气泡图、水平条等,使结果更形象化的展示出来。
下图所示依次是树状图可视化分析、气泡图可视化分析、水平条可视化分析。根据可视化分析中颜色的深浅和色块的大小,审计人员可以迅速找到“异常”。根据查看结果,我们可以做进一步的延伸分析。
下图是笔者根据上述案例分析出来的结果,分别选取了树状图、气泡图和水平条。这三个智能显示图例中色块颜色最深、面积最大的就是我们在审计过程中需要注意的地方。
(四)两种方法对比分析
审计方法 比较 |
对审计人员的专业要求 |
分析结果的理解性 |
方法的灵活程度 |
用户的接受程度 |
基于SQL的数据审计方法 |
高 |
一般 |
高 |
一般 |
数据可视化tableau方法 |
不需要,只需要拖入工作表即可 |
图形表现的形式容易理解 |
高 |
容易理解 |
四、总结
Tableau数据可视化工具只是对大数据在审计领域的应用作出了一点小小的尝试。在大数据环境下,通过充分利用电子数据审计技术对各种审计项目进行审计,而数据可视化工具可以用于乡镇村干部及其亲属是否参与五保的人员对比、可以用于查询重复领取保证金的人员等等审计项目中。虽然tableau在一定程度上能够优化审计分析,但是SQL语言仍是必须要掌握的电子数据处理技术,电子数据审计方法可以提高审计的效率和审计质量,多运用计算机辅助审计技术能够缩短审计工作时间,节约审计成本,增加数据核算的准确性。