| 數(shù)字化時(shí)代 | 信永中和數(shù)智丨數(shù)據(jù)分析技術(shù)驅(qū)動(dòng)的數(shù)據(jù)審計(jì)服務(wù)

信永中和數(shù)智丨數(shù)據(jù)分析技術(shù)驅(qū)動(dòng)的數(shù)據(jù)審計(jì)服務(wù)

2023年04月19日


一、數(shù)據(jù)能力介紹


信永中和是較早具備和提供數(shù)據(jù)分析技術(shù)相關(guān)服務(wù)的國(guó)內(nèi)專(zhuān)業(yè)服務(wù)機(jī)構(gòu)。自2017年成立大數(shù)據(jù)技術(shù)部,信永中和圍繞各類(lèi)內(nèi)外部審計(jì)場(chǎng)景不斷探索數(shù)據(jù)分析理論、方法和框架,不斷積累數(shù)據(jù)分析案例。
目前,工作領(lǐng)域涉及制造業(yè)、金融、電力、科技與傳媒、房地產(chǎn)、政企等8個(gè)大類(lèi)和16個(gè)小類(lèi)。在過(guò)去五年中,信永中和運(yùn)用流行的大數(shù)據(jù)框架形成了成熟的方法論,并具有將該方法論應(yīng)用于新行業(yè)、新領(lǐng)域的能力,其中相關(guān)工作成果已經(jīng)得到充分驗(yàn)證和價(jià)值肯定。




二、數(shù)據(jù)分析目標(biāo)


數(shù)據(jù)分析旨在審計(jì)執(zhí)行過(guò)程中更快速、更準(zhǔn)確地收集和分析數(shù)據(jù),構(gòu)建數(shù)據(jù)分析模型,對(duì)數(shù)據(jù)挖掘,提供全面的、有效的、可靠的審計(jì)證據(jù)、支持審計(jì)問(wèn)題發(fā)現(xiàn)和結(jié)論,降低審計(jì)作業(yè)風(fēng)險(xiǎn):

確認(rèn)數(shù)據(jù)的完整性和準(zhǔn)確性

通過(guò)對(duì)數(shù)據(jù)進(jìn)行收集、驗(yàn)證和比較,識(shí)別數(shù)據(jù)的缺陷、錯(cuò)誤和不一致之處,確認(rèn)數(shù)據(jù)的完整性和準(zhǔn)確性。

識(shí)別審計(jì)風(fēng)險(xiǎn)和異常交易

通過(guò)對(duì)數(shù)據(jù)進(jìn)行分析和挖掘,審計(jì)人員可以識(shí)別潛在的審計(jì)風(fēng)險(xiǎn)和異常交易,如內(nèi)部欺詐、虛假交易等。




三、數(shù)據(jù)分析能力介紹


信永中和數(shù)據(jù)分析服務(wù),采用總體分析方法,整合碎片化數(shù)據(jù),對(duì)所有數(shù)據(jù)計(jì)算并發(fā)掘數(shù)據(jù)隱藏的信息。
目前我們已完成多個(gè)千萬(wàn)級(jí)數(shù)據(jù)量的項(xiàng)目分析,同時(shí)結(jié)合市場(chǎng)成熟分析工具,自建數(shù)據(jù)分析平臺(tái),儲(chǔ)備了PB級(jí)別的數(shù)據(jù)全量分析技術(shù)能力??梢躁P(guān)聯(lián)多個(gè)數(shù)據(jù)庫(kù),打破數(shù)據(jù)孤島,覆蓋企業(yè)全部數(shù)據(jù),選取最有價(jià)值點(diǎn)的信息展開(kāi)多維度分析,以及根據(jù)數(shù)據(jù)之間的聯(lián)系,對(duì)比不同來(lái)源的多個(gè)數(shù)據(jù),完成數(shù)據(jù)一致性的檢驗(yàn)。

我們已具有如下能力



01 全面覆蓋用戶(hù)數(shù)據(jù)

我們可覆蓋絕大部分客戶(hù)系統(tǒng)的數(shù)據(jù)文件及類(lèi)型,校驗(yàn)客戶(hù)系統(tǒng)最細(xì)顆粒度數(shù)據(jù)的合理性,對(duì)Oracle或SQL Server等數(shù)據(jù)庫(kù)文件、系統(tǒng)導(dǎo)出的csv文件、excel文件和非結(jié)構(gòu)化數(shù)據(jù)(日志數(shù)據(jù))等有著豐富的數(shù)據(jù)處理和分析經(jīng)驗(yàn)。


02 懂行業(yè)、貼業(yè)務(wù)

數(shù)據(jù)分析人員具備流程管理、底層數(shù)據(jù)處理分析經(jīng)驗(yàn)以及豐富的數(shù)據(jù)建模知識(shí),能夠同專(zhuān)業(yè)審計(jì)團(tuán)隊(duì)協(xié)同工作,深度認(rèn)知業(yè)務(wù)場(chǎng)景,目前已根據(jù)不同行業(yè)風(fēng)險(xiǎn)點(diǎn),搭建1000+數(shù)據(jù)分析模型。


03 大數(shù)據(jù)量處理

我們會(huì)結(jié)合用戶(hù)數(shù)據(jù)量,選用適當(dāng)?shù)慕鉀Q方案或可視化工具,開(kāi)展數(shù)據(jù)挖掘和可視化分析,而借助于自建的大數(shù)據(jù)分析平臺(tái)已能夠勝任PB級(jí)別數(shù)據(jù)的分析服務(wù),滿(mǎn)足多客戶(hù)多場(chǎng)景的需求。


04 數(shù)據(jù)治理能力

我們已承接多個(gè)外部客戶(hù)的系統(tǒng)開(kāi)發(fā)項(xiàng)目,對(duì)數(shù)據(jù)治理有豐富的經(jīng)驗(yàn),具備系統(tǒng)底層的數(shù)據(jù)探源,梳理數(shù)據(jù)表關(guān)聯(lián)關(guān)系的能力,可基于最底層數(shù)據(jù)開(kāi)展數(shù)據(jù)分析工作。


四、數(shù)據(jù)分析實(shí)現(xiàn)


01

數(shù)據(jù)分析理念

我們的數(shù)據(jù)分析師通過(guò)創(chuàng)建一系列的數(shù)據(jù)分析模型,用數(shù)據(jù)復(fù)現(xiàn)企業(yè)客戶(hù)合規(guī)的、合理的業(yè)務(wù)場(chǎng)景,分辨真實(shí)交易、問(wèn)題交易亦或存疑待查交易。

數(shù)據(jù)分析師梳理清楚數(shù)據(jù)指標(biāo)之間的邏輯,建立數(shù)據(jù)指標(biāo)體系,基于政策制度、業(yè)務(wù)處理邏輯、數(shù)據(jù)間勾稽關(guān)系、審計(jì)經(jīng)驗(yàn)、內(nèi)外部數(shù)據(jù)關(guān)聯(lián)性等設(shè)計(jì)理念,使用結(jié)構(gòu)分析、標(biāo)簽分析、趨勢(shì)分析、極值分析、區(qū)間估計(jì)、回歸分析、相關(guān)性分析、聚類(lèi)分析等分析方法,設(shè)計(jì)數(shù)據(jù)分析模型及假設(shè)場(chǎng)景并加以驗(yàn)證。

如果“假設(shè)”被證實(shí)存在問(wèn)題或風(fēng)險(xiǎn),則進(jìn)一步探究原因,是數(shù)據(jù)完整性問(wèn)題、業(yè)務(wù)個(gè)例問(wèn)題、還是系統(tǒng)性問(wèn)題,循環(huán)往復(fù)驗(yàn)證,直至假設(shè)場(chǎng)景能夠經(jīng)得起各種檢驗(yàn)。
圖片


02

數(shù)據(jù)分析路徑

數(shù)據(jù)分析的基本步驟為:問(wèn)題及指標(biāo)確定數(shù)據(jù)獲取數(shù)據(jù)處理數(shù)據(jù)分析與建模數(shù)據(jù)可視化。
圖片


03

各階段常用技術(shù)


數(shù)據(jù)收集

針對(duì)不同數(shù)據(jù)源文件Web數(shù)據(jù)(如網(wǎng)頁(yè))、日志數(shù)據(jù)、數(shù)據(jù)庫(kù)數(shù)據(jù)、本地文件(excel、csv),制定相應(yīng)的數(shù)據(jù)采集的方法和技術(shù),如使用網(wǎng)絡(luò)爬蟲(chóng)或網(wǎng)站公開(kāi) API 將非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)從網(wǎng)頁(yè)中提取出來(lái),建立分布式架構(gòu)采集系統(tǒng)日志或是對(duì)接數(shù)據(jù)庫(kù),最終將數(shù)據(jù)存儲(chǔ)到關(guān)系型數(shù)據(jù)庫(kù)和非關(guān)系型數(shù)據(jù)庫(kù)。
圖片


數(shù)據(jù)清洗

使用Pandas、NumPy數(shù)據(jù)清洗或自研數(shù)據(jù)清洗工具,對(duì)數(shù)據(jù)整合、清洗。
圖片


數(shù)據(jù)分析與建模

采用Spark分布式計(jì)算處理、Clojure數(shù)據(jù)實(shí)時(shí)計(jì)算、Python分析建模等分析工具,將海量數(shù)據(jù)聚合匯總,建立描述性分析、梳理分析、建模分析、數(shù)據(jù)挖掘分析等數(shù)據(jù)模型。
圖片

數(shù)據(jù)可視化

采用可視化BI工具,Python可視化分析,自研報(bào)表平臺(tái)等可視化工具,建立美觀準(zhǔn)確的可視圖形,讓用戶(hù)輕松接受信息,具有及時(shí)響應(yīng)需求變化,圖形分享,數(shù)據(jù)高交互等優(yōu)點(diǎn)。

可視化圖表類(lèi)型:

  • 直方圖:探索變量的分布規(guī)律

  • 條形圖:展示數(shù)值變量的集中趨勢(shì)

  • 計(jì)數(shù)圖:探索每個(gè)類(lèi)別的具體數(shù)量

  • 散點(diǎn)圖:展示整體數(shù)據(jù)的分布規(guī)律

  • 箱線圖:數(shù)據(jù)的分散性,極數(shù)、中位數(shù)

  • 提琴圖:分位數(shù)的位置及數(shù)據(jù)密度

  • 回歸圖:數(shù)據(jù)之間的線性關(guān)系

  • 熱力圖:數(shù)值大小或相關(guān)性高低


大數(shù)據(jù)分析總體架構(gòu)

圖片


五、數(shù)據(jù)分析服務(wù)類(lèi)型


面向以風(fēng)險(xiǎn)合規(guī)為導(dǎo)向的全量數(shù)據(jù)審計(jì),服務(wù)于企業(yè)客戶(hù)的同時(shí),更受到會(huì)計(jì)師事務(wù)所(財(cái)務(wù)審計(jì))、保薦機(jī)構(gòu)(券商)、律師事務(wù)所等中介機(jī)構(gòu)的關(guān)注和信賴(lài),對(duì)企業(yè)經(jīng)營(yíng)數(shù)據(jù)、業(yè)財(cái)數(shù)據(jù)為基礎(chǔ)的全量數(shù)據(jù)進(jìn)行合規(guī)性和一致性校驗(yàn)和數(shù)據(jù)審計(jì)工作。

在全量數(shù)據(jù)審計(jì)類(lèi)服務(wù)執(zhí)行的過(guò)程中,我們結(jié)合被審計(jì)企業(yè)所屬行業(yè)特征、企業(yè)自身所在行業(yè)和業(yè)態(tài)情況,對(duì)關(guān)鍵業(yè)財(cái)系統(tǒng)數(shù)據(jù)在審計(jì)期間內(nèi)的數(shù)據(jù)源、數(shù)據(jù)處理流程、業(yè)財(cái)數(shù)據(jù)差異和問(wèn)題進(jìn)行校驗(yàn)、復(fù)測(cè)、分析和合理性解釋追溯。

我們?cè)趫?zhí)行此類(lèi)服務(wù)過(guò)程中,會(huì)將我們采用的分析方法、異常數(shù)據(jù)發(fā)現(xiàn)清單、被審計(jì)企業(yè)的解釋、追加樣本和復(fù)測(cè)的結(jié)果,以及合規(guī)性建議,編制至《底稿》《報(bào)告》中,作為監(jiān)管機(jī)構(gòu)、中介機(jī)構(gòu)、企業(yè)管理層可參考可追溯的記錄依據(jù)。


六、分析場(chǎng)景和關(guān)注點(diǎn)



我們的數(shù)據(jù)審計(jì)服務(wù)和數(shù)字咨詢(xún)服務(wù)已應(yīng)用到多種行業(yè)和多種業(yè)態(tài)的專(zhuān)項(xiàng)服務(wù)中,包括但不限于電力、建設(shè)地產(chǎn)、金融、科技與傳媒、消費(fèi)品和工業(yè)產(chǎn)品、運(yùn)輸與物流等行業(yè),列舉我們?cè)诓糠中袠I(yè)中設(shè)計(jì)的分析場(chǎng)景:

圖片


以下為我們?cè)诔薪雍蛨?zhí)行的全量數(shù)據(jù)審計(jì)類(lèi)服務(wù)、企業(yè)經(jīng)營(yíng)和業(yè)財(cái)數(shù)據(jù)一致性盡調(diào)類(lèi)服務(wù)項(xiàng)目中的關(guān)注要點(diǎn):


圖片


聯(lián)系方式


周峰 先生

大數(shù)據(jù)技術(shù)部合伙人

13701319333

zhou_feng@shinewing.com




李元元 女士

高級(jí)經(jīng)理

13911661149

liyuanyuan1_bj@shinewing.com




傅時(shí)君 先生

經(jīng)理

15901032372

fushijun_bj@shinewing.com


請(qǐng)聯(lián)絡(luò)我們獲取更多分析場(chǎng)景和要點(diǎn),及其應(yīng)用案例。

如有更多需求請(qǐng)“掃一掃”或點(diǎn)擊“閱讀原文”獲取財(cái)務(wù)數(shù)智化解決方案。



圖片