- 相關(guān)推薦
電子稅務(wù)局畢業(yè)論文
學(xué)校編碼:10384 分類號(hào) 密級(jí) 學(xué)號(hào):X20113287123 UDC
工 程 碩 士 學(xué) 位 論 文
某市稅收數(shù)據(jù)綜合應(yīng)用平臺(tái)
數(shù)據(jù)質(zhì)量監(jiān)控系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
Design and Implementation of Data Quality Monitoring system for Integrated Tax Data Application Platform
李正東
指 導(dǎo) 教 師: 林凡副教授
專 業(yè) 名 稱: 軟件工程
論文提交日期: 2011年9月
論文答辯日期: 2011年9月
學(xué)位授予日期: 年
指 導(dǎo) 教 師:__________
答辯委員會(huì)主席:__________
2015年*月 月
廈門大學(xué)學(xué)位論文原創(chuàng)性聲明
本人呈交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下,獨(dú)立完成的研究成果。本人在論文寫作中參考其他個(gè)人或集體已經(jīng)發(fā)表的研究成果,均在文中以適當(dāng)方式明確標(biāo)明,并符合法律規(guī)范和《廈門大學(xué)研究生學(xué)術(shù)活動(dòng)規(guī)范(試行)》。
另外,該學(xué)位論文為()課題(組)的研究成果,獲得( )課題(組)經(jīng)費(fèi)或?qū)嶒?yàn)室的資助,在( )實(shí)驗(yàn)室完成。(請(qǐng)?jiān)谝陨侠ㄌ?hào)內(nèi)填寫課題或課題組負(fù)責(zé)人或?qū)嶒?yàn)室名稱,未有此項(xiàng)聲明內(nèi)容的,可以不作特別聲明。)
聲明人(簽名):
年 月 日
廈門大學(xué)學(xué)位論文著作權(quán)使用聲明
本人同意廈門大學(xué)根據(jù)《中華人民共和國(guó)學(xué)位條例暫行實(shí)施辦法》等規(guī)定保留和使用此學(xué)位論文,并向主管部門或其指定機(jī)構(gòu)送交學(xué)位論文(包括紙質(zhì)版和電子版),允許學(xué)位論文進(jìn)入廈門大學(xué)圖書館及其數(shù)據(jù)庫(kù)被查閱、借閱。本人同意廈門大學(xué)將學(xué)位論文加入全國(guó)博士、碩士學(xué)位論文共建單位數(shù)據(jù)庫(kù)進(jìn)行檢索,將學(xué)位論文的標(biāo)題和摘要匯編出版,采用影印、縮印或者其它方式合理復(fù)制學(xué)位論文。
本學(xué)位論文屬于:
( )1.經(jīng)廈門大學(xué)保密委員會(huì)審查核定的保密學(xué)位論文,于 年 月 日解密,解密后適用上述授權(quán)。
(√)2.不保密,適用上述授權(quán)。
(請(qǐng)?jiān)谝陨舷鄳?yīng)括號(hào)內(nèi)打“√”或填上相應(yīng)內(nèi)容。保密學(xué)位論文應(yīng)是已經(jīng)廈門大學(xué)保密委員會(huì)審定過的學(xué)位論文,未經(jīng)廈門大學(xué)保密委員會(huì)審定的學(xué)位論文均為公開學(xué)位論文。此聲明欄不填寫的,默認(rèn)為公開學(xué)位論文,均適用上述授權(quán)。)
聲明人(簽名):
年 月 日
摘 要
稅收征管和納稅服務(wù)是稅收工作的兩大核心業(yè)務(wù)。強(qiáng)化核心業(yè)務(wù),關(guān)鍵在于提高稅源管理水平。稅源管理水平的高低,很大程度上取決于是否有效地解決“兩個(gè)不對(duì)稱”問題,即征納雙方之間的信息不對(duì)稱、稅務(wù)系統(tǒng)內(nèi)各部門之間的信息不對(duì)稱問題。這就要求稅務(wù)部門首先要打通稅務(wù)系統(tǒng)內(nèi)各部門之間的、稅務(wù)系統(tǒng)和各經(jīng)濟(jì)主管單位之間的信息交互渠道,整合來至其他社會(huì)部門的涉稅資源。并在此的基礎(chǔ)上,從稅收工作實(shí)際出發(fā),強(qiáng)化稅收情報(bào)綜合分析能力,打破“兩個(gè)不對(duì)稱”的信息藩籬,從源頭上提高稅源管理效益。
我國(guó)稅務(wù)系統(tǒng)經(jīng)過多年的信息化建設(shè),尤其是金稅工程的不斷推進(jìn),基本實(shí)現(xiàn)了稅收征管工作的數(shù)字化,但對(duì)海量稅收數(shù)據(jù)的監(jiān)、管、用缺乏全生命周期的規(guī)劃,這成為稅務(wù)部門有效發(fā)揮其職能作用的瓶頸。利用現(xiàn)代信息處理技術(shù),強(qiáng)化涉稅數(shù)據(jù)管理與應(yīng)用,已成為各國(guó)稅務(wù)部門提升稅源管理水平的突破口。
本文按照總局“信息管稅”的總體要求,針對(duì)基層稅務(wù)機(jī)關(guān)的開展稅收征管和納稅服務(wù)工作實(shí)際需要,結(jié)合某市國(guó)家稅務(wù)局稅收數(shù)據(jù)綜合應(yīng)用平臺(tái)的建設(shè)思路和要求,利用數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)挖掘等信息處理手段,進(jìn)行分析挖掘等技術(shù)手段,對(duì)多種來源的涉稅數(shù)據(jù)進(jìn)行全生命周期的質(zhì)量監(jiān)督和管理,全力確保涉稅信息“采集數(shù)據(jù)、挖掘信息、發(fā)現(xiàn)規(guī)律、獲取知識(shí)”的稅收數(shù)據(jù)分析利用鏈條的質(zhì)量,提升稅收數(shù)據(jù)信息和價(jià)值發(fā)現(xiàn)的有效性、可靠性,進(jìn)一步發(fā)揮信息化建設(shè)對(duì)推進(jìn)稅收事業(yè)發(fā)展的支撐作用,推進(jìn)征管體系現(xiàn)代化,服務(wù)經(jīng)濟(jì)、社會(huì)發(fā)展的“新常態(tài)”。
關(guān)鍵詞: 稅收數(shù)據(jù)綜合應(yīng)用平臺(tái);稅源管理;信息不對(duì)稱
I
Abstract
Tax revenue collection and management are two of the main businesses of taxation work。To strengthen the core business, the key is to raise the level of tax source management. And the level of tax source management depends on whether we can solve two kinds of the information asymmetric problem or not. In another words, we need to solve the information asymmetry problem between the taxpayers and collection department, and between different departments in tax system. Hence, this requires us to make ways for information exchange between different departments in tax system and between the tax system and various economic unites, to integrate the tax resources from other social sectors. Given on that, we should Starting from the reality of tax work, strengthening the comprehensive analysis ability in tax information, breaking the obstacles of two asymmetric, so as to improve the efficiency of tax source management from the beginning.
After years of information construction in our tax system, especially the continuing boosting of golden tax project, our county realizes the digitalization in tax collection work. But, for rapid development of social economic environment, it is
still lack of overall plan of tax data monitoring, management and using with the full data life-cycle, which becomes the bottleneck of effectively play functions in tax departments. So using modern information processing technology and strengthening the tax-related data management and application, has become the breach of the tax department to enhance the level of tax source management.
????? 缺33333
Keywords: Tax Data Integrated Application Platform;Tax Source Management; Tax Data Monitoring
目 錄
摘 要 ........................................................................................................... I Abstract .................................................................................................... II 目 錄 ........................................................................................................ IV
第1章
1.1
1.2
1.3
第2章
2.1
2.2
2.4.1
2.4.2
2.4.3
第3章
3.1
3.2
3.2.1
3.2.2
3.2.3
3.2.4
3.2.5
3.3
3.3.1
3.3.2
3.3.3
3.3.4
3.3.5
3.3.6
3.3.7 緒論........................................................................................... 1 項(xiàng)目開發(fā)的背景 ...................................................................................... 1 國(guó)內(nèi)外研究現(xiàn)狀綜述 .............................................................................. 2 本文的研究方向及主要工作 .................................................................. 2 項(xiàng)目整體架構(gòu) ....................................... 錯(cuò)誤!未定義書簽。 項(xiàng)目定位與目標(biāo) .................................................... 錯(cuò)誤!未定義書簽。 項(xiàng)目設(shè)計(jì)原則 ........................................................ 錯(cuò)誤!未定義書簽。 開放性與獨(dú)立性統(tǒng)一原則 .................................... 錯(cuò)誤!未定義書簽。 可持續(xù)發(fā)展原則 .................................................... 錯(cuò)誤!未定義書簽。 先進(jìn)性與成熟性結(jié)合原則 .................................... 錯(cuò)誤!未定義書簽。 需求分析 .................................................................................. 4 項(xiàng)目需求綜述 .......................................................................................... 4 業(yè)務(wù)需求 ..........................................http://www.stanzs.com........................................................ 8 查詢統(tǒng)計(jì) ................................................................ 錯(cuò)誤!未定義書簽。 報(bào)表管理 ................................................................ 錯(cuò)誤!未定義書簽。 報(bào)告管理 ................................................................ 錯(cuò)誤!未定義書簽。 OLAP分析 ............................................................... 錯(cuò)誤!未定義書簽。 數(shù)據(jù)挖掘應(yīng)用 ........................................................ 錯(cuò)誤!未定義書簽。 技術(shù)需求 ................................................................................................ 12 框架需求 ................................................................ 錯(cuò)誤!未定義書簽。 性能需求 ................................................................................................ 23 可擴(kuò)展性需求 ........................................................................................ 24 可操作性需求 ........................................................ 錯(cuò)誤!未定義書簽。 可靠性需求 ............................................................ 錯(cuò)誤!未定義書簽。 數(shù)據(jù)需求 ................................................................ 錯(cuò)誤!未定義書簽。 數(shù)據(jù)應(yīng)用對(duì)象需求 ................................................ 錯(cuò)誤!未定義書簽。
3.3.9
第4章
4.1
4.2
4.3
4.4
4.4.1
4.4.2
4.4.3
第5章
5.1
5.1.1
5.1.2
5.1.3
5.2
5.2.1
5.2.2
5.2.3
5.2.4
5.2.5
5.2.6
5.2.7
5.3
5.3.1
5.3.2
5.3.3
5.3.4
5.3.5
第6章
6.1
6.2
6.3 其他技術(shù)需求 ........................................................................................ 25 概要設(shè)計(jì) ................................................................................ 26 總體框架設(shè)計(jì) ........................................................ 錯(cuò)誤!未定義書簽。 數(shù)據(jù)架構(gòu)設(shè)計(jì) ........................................................ 錯(cuò)誤!未定義書簽。 應(yīng)用架構(gòu)設(shè)計(jì) ........................................................ 錯(cuò)誤!未定義書簽。 非功能設(shè)計(jì) ............................................................ 錯(cuò)誤!未定義書簽。 性能設(shè)計(jì) ................................................................ 錯(cuò)誤!未定義書簽。 可靠性設(shè)計(jì) ............................................................ 錯(cuò)誤!未定義書簽。 可維護(hù)性設(shè)計(jì) ........................................................ 錯(cuò)誤!未定義書簽。 數(shù)據(jù)支撐層的詳細(xì)設(shè)計(jì)與實(shí)現(xiàn) ........... 錯(cuò)誤!未定義書簽。 數(shù)據(jù)支撐層架構(gòu)規(guī)劃 ............................................ 錯(cuò)誤!未定義書簽。 生產(chǎn)系統(tǒng)數(shù)據(jù)層 .................................................... 錯(cuò)誤!未定義書簽。 數(shù)據(jù)倉(cāng)庫(kù)層 ............................................................ 錯(cuò)誤!未定義書簽。 分析應(yīng)用系統(tǒng)層 .................................................... 錯(cuò)誤!未定義書簽。 數(shù)據(jù)模型的設(shè)計(jì)與實(shí)現(xiàn) ........................................ 錯(cuò)誤!未定義書簽。 數(shù)據(jù)層次模型 ........................................................ 錯(cuò)誤!未定義書簽。 歷史區(qū)..................................................................... 錯(cuò)誤!未定義書簽。 原子區(qū)..................................................................... 錯(cuò)誤!未定義書簽。 匯總層..................................................................... 錯(cuò)誤!未定義書簽。 主題數(shù)據(jù)概念模型 ................................................ 錯(cuò)誤!未定義書簽。 邏輯模型實(shí)例 ........................................................ 錯(cuò)誤!未定義書簽。 模型管理工具 ........................................................ 錯(cuò)誤!未定義書簽。 數(shù)據(jù)的抽取、轉(zhuǎn)換和加載 .................................... 錯(cuò)誤!未定義書簽。 總體設(shè)計(jì) ................................................................ 錯(cuò)誤!未定義書簽。 數(shù)據(jù)同步 ................................................................ 錯(cuò)誤!未定義書簽。 OT-ETL ..................................................................... 錯(cuò)誤!未定義書簽。 數(shù)據(jù)加工 ................................................................ 錯(cuò)誤!未定義書簽。 數(shù)據(jù)反饋 ................................................................ 錯(cuò)誤!未定義書簽。 應(yīng)用支撐層的詳細(xì)設(shè)計(jì)與實(shí)現(xiàn) ............................................ 26 應(yīng)用層總體架構(gòu) .................................................................................... 55 應(yīng)用支撐功能模塊定義 ........................................ 錯(cuò)誤!未定義書簽。 應(yīng)用支撐層的實(shí)現(xiàn) ................................................ 錯(cuò)誤!未定義書簽。
6.3.2
6.3.3 分析引擎設(shè)計(jì) ........................................................ 錯(cuò)誤!未定義書簽。 通用分析工具設(shè)計(jì) ................................................ 錯(cuò)誤!未定義書簽。
第7章
7.1
7.1.1
7.1.2
7.1.3
7.1.4
7.1.5
7.2
7.2.1
7.2.2 重點(diǎn)功能模塊設(shè)計(jì)與實(shí)現(xiàn) ................... 錯(cuò)誤!未定義書簽。 一戶式管理子系統(tǒng) ................................................ 錯(cuò)誤!未定義書簽。 一戶式——整體設(shè)計(jì) ............................................ 錯(cuò)誤!未定義書簽。 邏輯結(jié)構(gòu) ................................................................ 錯(cuò)誤!未定義書簽。 一戶式——首頁(yè) .................................................... 錯(cuò)誤!未定義書簽。 一戶式——查詢統(tǒng)計(jì) ............................................ 錯(cuò)誤!未定義書簽。 界面設(shè)計(jì)與實(shí)現(xiàn) .................................................... 錯(cuò)誤!未定義書簽。 收入分析 ................................................................ 錯(cuò)誤!未定義書簽。 領(lǐng)導(dǎo)駕駛艙設(shè)計(jì) .................................................... 錯(cuò)誤!未定義書簽。 稅源地圖 ................................................................ 錯(cuò)誤!未定義書簽。
第8章
8.1
8.2
8.3
8.4
8.4.1
8.4.2
8.4.3
8.4.4
8.5 項(xiàng)目測(cè)試 ................................................................................ 56 測(cè)試目標(biāo) ................................................................................................ 56 測(cè)試規(guī)劃及方案 .................................................................................... 56 測(cè)試準(zhǔn)備 ................................................................................................ 57 測(cè)試內(nèi)容與結(jié)果 .................................................................................... 57 數(shù)據(jù)和數(shù)據(jù)庫(kù)完整性測(cè)試 .................................................................... 57 接口測(cè)試 ................................................................................................ 57 功能測(cè)試 ................................................................................................ 58 性能測(cè)試 ................................................................................................ 59 測(cè)試結(jié)果分析 ........................................................................................ 64
第9章
9.1
9.2 總結(jié)與展望 ............................................................................ 65 總結(jié)......................................................................................................... 65 展望......................................................................................................... 65
參考文獻(xiàn)................................................................................................... 67
致 謝 ....................................................................................................... 69
第1章 緒論
1.1 項(xiàng)目開發(fā)的背景
經(jīng)濟(jì)決定稅收,稅收影響經(jīng)濟(jì)。近年來,經(jīng)濟(jì)的發(fā)展逐漸呈現(xiàn)出從要素驅(qū)動(dòng)、投資驅(qū)動(dòng)轉(zhuǎn)向創(chuàng)新驅(qū)動(dòng)的“新常態(tài)”[1]。作為和經(jīng)濟(jì)密切相關(guān)的稅收工作,也必然會(huì)呈現(xiàn)出。在社會(huì)經(jīng)濟(jì)走向“新常態(tài)”的過程中,與之密切相關(guān)的稅收工作將會(huì)面臨更多的挑戰(zhàn)。目前,我國(guó)的稅制結(jié)構(gòu)仍然以間接稅為主,在由10%左右的高速經(jīng)濟(jì)增長(zhǎng)向7%左右的中高速經(jīng)濟(jì)增長(zhǎng)“新常態(tài)”轉(zhuǎn)變的過程中[2],稅收增長(zhǎng)率的減速幅度通常會(huì)大于經(jīng)濟(jì)增長(zhǎng)率的減速幅度。同時(shí),經(jīng)濟(jì)結(jié)構(gòu)變化必然帶來稅源結(jié)構(gòu)的深刻變化。一方面,經(jīng)濟(jì)實(shí)體的組織形式、經(jīng)營(yíng)方式不斷增加,發(fā)展速度不斷加快 [3]。稅源呈現(xiàn)出復(fù)雜性、隱蔽性和流動(dòng)性越來越突出、越來越普遍的特點(diǎn)[4]。另一方面,隨著房地產(chǎn)稅等涉及個(gè)人的直接稅改革的推進(jìn),納稅人的范圍將在現(xiàn)有企業(yè)、個(gè)體工商戶的基礎(chǔ)上增加自然人,納稅人數(shù)量將從“大量”變成“海量”;其高容量(Volume)、多樣性(Variety)、速度(Velocity)及價(jià)值(Value)的4V特性[5],直接導(dǎo)致了稅務(wù)部門的數(shù)據(jù)來源更加廣泛、數(shù)據(jù)類型多種多樣。這使得各級(jí)稅務(wù)機(jī)關(guān)如何更加有效的“監(jiān)、管、用”稅收信息,持續(xù)提高涉稅數(shù)據(jù)質(zhì)量的問題逐漸顯現(xiàn)出來。
同時(shí),在稅收“新常態(tài)”下,我國(guó)稅務(wù)系統(tǒng)不斷“加強(qiáng)稅收征收管理信息系統(tǒng)的現(xiàn)代化建設(shè)”[7]!敖鸲惾诠こ獭钡耐茝V建設(shè),一是在全國(guó)稅務(wù)系統(tǒng)的范圍內(nèi),包括國(guó)稅系統(tǒng)和地方稅務(wù)系統(tǒng),規(guī)范了涉稅數(shù)據(jù)的采集、處理和管理機(jī)制,為信息分析利用準(zhǔn)備了數(shù)據(jù)基礎(chǔ);二是金稅三期工程主體系統(tǒng)在國(guó)家稅務(wù)總局、國(guó)稅系統(tǒng)和地稅系統(tǒng)的全面應(yīng)用,實(shí)現(xiàn)了全國(guó)稅收管理信息系統(tǒng)的統(tǒng)一,為大范圍的涉稅信息分析利用提供了技術(shù)條件;三是全國(guó)、省級(jí)數(shù)據(jù)大集中、涉稅數(shù)據(jù)分類管和統(tǒng)一的稅收征管工作要求,為信息分析利用整合了統(tǒng)一的管理體系[8]。
綜上所述,現(xiàn)階段,我國(guó)稅務(wù)系統(tǒng)既存在強(qiáng)化稅收數(shù)據(jù)質(zhì)量監(jiān)督、規(guī)范涉稅數(shù)據(jù)使用的內(nèi)在要求,也具備了深度分析利用涉稅數(shù)據(jù)所需的物質(zhì)基礎(chǔ)、技術(shù)條件和管理體系。
1.2 研究現(xiàn)狀和問題
西方國(guó)家,如美國(guó)、德國(guó)、日本、意大利、澳大利亞等國(guó)家,稅收信息化建設(shè)起步早、發(fā)展快、歷時(shí)長(zhǎng)、技術(shù)沉淀和經(jīng)驗(yàn)積累深厚,已經(jīng)逐漸從簡(jiǎn)單的統(tǒng)計(jì)分析發(fā)展到有理論支撐、技術(shù)先進(jìn)、管理配套的現(xiàn)代稅收數(shù)據(jù)質(zhì)量管控系統(tǒng)。例如,美國(guó)聯(lián)邦稅務(wù)局(IRS)通過兩個(gè)全國(guó)性的總部計(jì)算機(jī)中心和10個(gè)區(qū)域性的大區(qū)服務(wù)中心實(shí)現(xiàn)了稅收數(shù)據(jù)的高度管理,在進(jìn)行業(yè)務(wù)管理、實(shí)現(xiàn)有效的稅源管理、征收率高達(dá)80%以上的同時(shí),稅收直接成本下降到0.4%左右[6]。
我國(guó)稅收信息化建設(shè)走過了以業(yè)務(wù)處理為主的、以“單機(jī)使用”、“稅網(wǎng)/新稅網(wǎng)”、“省級(jí)集中”為標(biāo)志的信息化建設(shè)歷程,進(jìn)入了以“金稅三期”為標(biāo)志的“業(yè)務(wù)處理系統(tǒng)和決策支持并重”、“統(tǒng)一系統(tǒng)、統(tǒng)一流程、統(tǒng)一數(shù)據(jù)”、全國(guó)涉稅數(shù)據(jù)總局/省局兩級(jí)集中的新的發(fā)展階段。全國(guó)各級(jí)稅務(wù)部門在不斷探索數(shù)據(jù)分析和稅源管理工作的過程中,都對(duì)如何通過技術(shù)手段提高數(shù)據(jù)質(zhì)量的問題進(jìn)行了不斷的研究和實(shí)踐。例如,XX國(guó)稅利用稅收數(shù)據(jù)綜合應(yīng)用平臺(tái),整合了金稅三期系統(tǒng)數(shù)據(jù)、防偽稅控系統(tǒng)數(shù)據(jù)、車輛購(gòu)置數(shù)據(jù)以及工商、海關(guān)、質(zhì)檢、能源、交通、公安等多個(gè)部門的涉稅,通過多方比對(duì)的方式排除疑點(diǎn),提高數(shù)據(jù)質(zhì)量。但是,由于局限于當(dāng)時(shí)現(xiàn)實(shí)條件,涉稅數(shù)據(jù)質(zhì)量的管理能力和效率都較為有限,無(wú)法滿足“新常態(tài)”下經(jīng)濟(jì)社會(huì)發(fā)展對(duì)稅收工作提出的時(shí)代要求。
1.3 本文的研究方向及主要工作
本文按照總局“以信息管稅為依托,努力構(gòu)建稅源專業(yè)化管理新體系”[9]的總體思路,立足金稅三期系統(tǒng),借鑒其他行業(yè)對(duì)業(yè)務(wù)數(shù)據(jù)質(zhì)量管控的實(shí)踐經(jīng)驗(yàn),針對(duì)涉稅數(shù)據(jù)質(zhì)量管理“沒人管”、“沒法管”等問題,在某市國(guó)家稅務(wù)局稅收數(shù)據(jù)綜合應(yīng)用平臺(tái)的整體框架下,從各種來源的涉稅數(shù)據(jù)的采集、整理、保存、流轉(zhuǎn)、使用等多個(gè)環(huán)節(jié)入手,【??????】利用 、 等現(xiàn)代信息處理技術(shù),采用。。。。。。。的手段,不斷豐富涉稅數(shù)據(jù)質(zhì)量的跟蹤監(jiān)控手段,預(yù)警數(shù)據(jù)使用風(fēng)險(xiǎn),完善涉稅信息“采集數(shù)據(jù)、挖掘信息、發(fā)現(xiàn)規(guī)律、獲取知識(shí)”的分析利用鏈條,進(jìn)一步發(fā)揮信息化建設(shè)對(duì)推進(jìn)稅收事業(yè)發(fā)展的支撐作用。本項(xiàng)目是XX市國(guó)
家稅務(wù)局強(qiáng)化數(shù)據(jù)質(zhì)量管控、深化數(shù)據(jù)分析利用,努力適應(yīng)稅收工作“新常態(tài)”的一次新的嘗試和努力。
1.4 本文的組織結(jié)構(gòu)
第1章是緒論。從內(nèi)部原因和外部原因,既經(jīng)濟(jì)發(fā)展“新常態(tài)”和稅收工作“新常態(tài)”,兩個(gè)方面分析了稅收數(shù)據(jù)質(zhì)量管控的必要性和可行性,介紹了當(dāng)前研究的概況以及主要的問題,明確了本文的研究方向,并對(duì)論文的組織結(jié)構(gòu)進(jìn)行了說明。
第2章是需求分析。從業(yè)務(wù)需求描述,采用流程圖和用例圖描繪了系統(tǒng)的功能需求,包括指標(biāo)管理需求分析、計(jì)劃管理需求分析、支付管理需求分析、銀行管理需求分析、公務(wù)卡管理需求分析、工資統(tǒng)發(fā)需求分析、數(shù)據(jù)報(bào)表需求分析和系統(tǒng)管理需求分析等。
第3章是系統(tǒng)設(shè)計(jì)。詳細(xì)的介紹了系統(tǒng)的總體框架設(shè)計(jì)、功能架構(gòu)設(shè)計(jì)圖,總體功能設(shè)計(jì)、數(shù)據(jù)庫(kù)設(shè)計(jì)和安全設(shè)計(jì)等。
第4章是系統(tǒng)實(shí)現(xiàn)。詳細(xì)介紹了系統(tǒng)的實(shí)現(xiàn)環(huán)境、主要界面設(shè)計(jì)以及關(guān)鍵功能模塊的實(shí)現(xiàn)過程,給出了重要功能的實(shí)現(xiàn)代碼。
第5章是系統(tǒng)測(cè)試。包括系統(tǒng)的測(cè)試環(huán)境,功能測(cè)試用例設(shè)計(jì)、功能測(cè)試結(jié)果分析以及性能測(cè)試場(chǎng)景設(shè)計(jì)和性能測(cè)試結(jié)果分析,并給出了具體的測(cè)試分析圖。
第6章是總結(jié)與展望部分?偨Y(jié)了本文所開展的研究工作,給出了后期系統(tǒng)需要改進(jìn)的地方。
第2章 需求分析
2.1 項(xiàng)目需求綜述
2.1.1 業(yè)務(wù)現(xiàn)狀分析
隨著稅務(wù)信息化建設(shè)不斷向深度和廣度發(fā)展,征管數(shù)據(jù)的采集和覆蓋范圍日益擴(kuò)大,就實(shí)際工作來看,在綜合征管軟件數(shù)據(jù)采集和處理過程中,出現(xiàn)了部分質(zhì)量低下、無(wú)效、冗余、不合法、不一致的數(shù)據(jù),稅務(wù)生產(chǎn)系統(tǒng)數(shù)據(jù)質(zhì)量現(xiàn)狀不容樂觀,而對(duì)于未來稅務(wù)大數(shù)據(jù)的應(yīng)用來說,數(shù)據(jù)質(zhì)量又是一個(gè)分析系統(tǒng)的生命力之源。作為目前稅務(wù)涉稅信息的數(shù)據(jù)質(zhì)量管控還未有信息化的支撐,往往在業(yè)務(wù)人員發(fā)現(xiàn)了數(shù)據(jù)質(zhì)量事故發(fā)生或被發(fā)現(xiàn)之后,由信息化人員采取人工的方式去排錯(cuò)、去清理。目前這種基于事后,人工管控的數(shù)據(jù)質(zhì)量治理手段基于以下流程展開:
目前基于上述流程的人工數(shù)據(jù)質(zhì)量管控有以下不足:
1. 所有數(shù)據(jù)質(zhì)量的問題發(fā)現(xiàn)只能靠事后,實(shí)際工作中業(yè)務(wù)人員被動(dòng)的發(fā)現(xiàn),
無(wú)法提前治理,導(dǎo)致質(zhì)量事故的發(fā)生。
2. 數(shù)據(jù)質(zhì)量問題即使分析到數(shù)據(jù)異常規(guī)則,由于無(wú)法獲知數(shù)據(jù)異常的生產(chǎn)
來源,數(shù)據(jù)質(zhì)量還會(huì)隨著生產(chǎn)數(shù)據(jù)的產(chǎn)生而產(chǎn)生,無(wú)法從根本解決數(shù)據(jù)質(zhì)量管控。
3. 整個(gè)質(zhì)量管控的過程成果維護(hù)起來費(fèi)時(shí)費(fèi)力,存在大量的返工,成本加
高。
4. 基于人工的數(shù)據(jù)質(zhì)量管控成果信息無(wú)法歸集,也無(wú)法進(jìn)行成果分析和宏
觀的預(yù)警,無(wú)法為輔助決策提供
2.1.2 業(yè)務(wù)流程分析
面對(duì)目前人工執(zhí)行數(shù)據(jù)質(zhì)量管控的弊端,為解決目前稅務(wù)局?jǐn)?shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)質(zhì)量管控,依賴信息化系統(tǒng)建設(shè),降低質(zhì)量管控的難度,在降低成本的同時(shí),增強(qiáng)數(shù)據(jù)分析的準(zhǔn)確性。原則上,可以將數(shù)據(jù)質(zhì)量按照業(yè)務(wù)約束和技術(shù)約束來區(qū)分,例如行業(yè)認(rèn)定和經(jīng)營(yíng)范圍不符合的異常數(shù)據(jù),直接影響群體分析的準(zhǔn)確性,所以對(duì)于這種限制于業(yè)務(wù)影響的,稱之為業(yè)務(wù)約束導(dǎo)致的數(shù)據(jù)質(zhì)量問題。對(duì)于重復(fù)記錄、字符類型不符、長(zhǎng)度不符的,編碼規(guī)范不符的,直接受數(shù)據(jù)庫(kù)技術(shù)約束,稱之為技術(shù)約束數(shù)據(jù)質(zhì)量問題。受技術(shù)約束的數(shù)據(jù)質(zhì)量問題,一般有估計(jì)的解決規(guī)則,發(fā)現(xiàn)異?梢园凑罩貜(fù)的規(guī)則處理。受業(yè)務(wù)約束的數(shù)據(jù)質(zhì)量問題,一般需要人工的治理,系統(tǒng)需要能自動(dòng)識(shí)別和任務(wù)推送即可。
將傳統(tǒng)人工數(shù)據(jù)質(zhì)量管控和信息化相結(jié)合的思路,就需要梳理出利用信息化分析的整個(gè)基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)質(zhì)量管控系統(tǒng)業(yè)務(wù)流程,目前結(jié)合傳統(tǒng)業(yè)務(wù),規(guī)劃整個(gè)業(yè)務(wù)系統(tǒng)的流程如下:
如上圖流程,同過引入信息化數(shù)據(jù)質(zhì)量管控流程后,和現(xiàn)狀業(yè)務(wù)相比,數(shù)據(jù)質(zhì)量管控具有以下優(yōu)點(diǎn):
1. 實(shí)現(xiàn)了數(shù)據(jù)質(zhì)量規(guī)則的維護(hù),成果會(huì)有數(shù)據(jù)保留,利于成果復(fù)用和規(guī)則
完善。
2. 增加了周期性的自動(dòng)化掃描分析,降低人工重復(fù)查找數(shù)據(jù)質(zhì)量難度和時(shí)
間,節(jié)省了人力和成本。
3. 增加了自動(dòng)清理環(huán)節(jié),對(duì)于分析出來的數(shù)據(jù)質(zhì)量問題,尤其針對(duì)生產(chǎn)數(shù)
據(jù)無(wú)法從源頭解決的數(shù)據(jù)質(zhì)量問題,一旦有確定的清理規(guī)則,可以結(jié)合周期掃描監(jiān)控來及時(shí)自動(dòng)化進(jìn)行數(shù)據(jù)異常數(shù)據(jù)清理。
4. 系統(tǒng)考慮到有些由于業(yè)務(wù)操作引起數(shù)據(jù)質(zhì)量問題,需要具體業(yè)務(wù)人員根
據(jù)實(shí)際具體治理的,則系統(tǒng)提供人工統(tǒng)籌流程,及時(shí)提醒提示治理。
5. 在系統(tǒng)流程實(shí)現(xiàn)數(shù)據(jù)質(zhì)量管控的基礎(chǔ)上,進(jìn)行各個(gè)環(huán)節(jié)的成果進(jìn)行分析,
含跟蹤管理和效應(yīng)分析。
6. 隨著數(shù)據(jù)質(zhì)量管控成果知識(shí)的積累,可以依賴成果數(shù)據(jù)進(jìn)行宏觀預(yù)警,
對(duì)高發(fā)的數(shù)據(jù)質(zhì)量問題或高發(fā)的群體,自動(dòng)化分析,提供預(yù)警信息。
2.1.3 系統(tǒng)角色分析
按照系統(tǒng)業(yè)務(wù)流程分析,系統(tǒng)流程可分為制定數(shù)據(jù)質(zhì)量模型、管控方案、掃描分析、任務(wù)統(tǒng)籌、質(zhì)量治理、成果分析、監(jiān)測(cè)預(yù)警等主要環(huán)節(jié)。掃描監(jiān)控為系統(tǒng)后臺(tái)功能,在系統(tǒng)流程上可以和管控方案合并為分析監(jiān)控環(huán)節(jié)。按照這樣的分析可以將系統(tǒng)共分為:質(zhì)量模型、分析監(jiān)控、任務(wù)統(tǒng)籌、質(zhì)量治理、成果分析、監(jiān)測(cè)預(yù)警核心業(yè)務(wù)模塊?紤]該系統(tǒng)需要單獨(dú)部署需要單獨(dú)的系統(tǒng)管理模塊。所以按照系統(tǒng)業(yè)務(wù)模塊,劃分系統(tǒng)角色如下:
圖2-1: 圖 2.2 業(yè)務(wù)需求
2.2.1 質(zhì)量模型需求
質(zhì)量模型是將數(shù)據(jù)質(zhì)量從業(yè)務(wù)轉(zhuǎn)化成技術(shù)實(shí)現(xiàn)的基礎(chǔ),是將平時(shí)業(yè)務(wù)人員能看懂的數(shù)據(jù)質(zhì)量業(yè)務(wù)規(guī)則通過質(zhì)量模型的維護(hù),轉(zhuǎn)化到具體數(shù)據(jù)表上的邏輯規(guī)則定義。質(zhì)量模型業(yè)務(wù)上的規(guī)劃可分為四層設(shè)計(jì)思路,分別為數(shù)據(jù)層、對(duì)接層、邏輯層、規(guī)則層,分別通過指標(biāo)元、指標(biāo)和模型來維護(hù)出數(shù)據(jù)質(zhì)量模型。應(yīng)實(shí)現(xiàn)數(shù)據(jù)質(zhì)量規(guī)則管理,在標(biāo)準(zhǔn)的數(shù)據(jù)質(zhì)量規(guī)范之上,通過數(shù)據(jù)質(zhì)量審計(jì)和數(shù)據(jù)一致性
比對(duì)來對(duì)數(shù)據(jù)質(zhì)量進(jìn)行檢查,發(fā)現(xiàn)數(shù)據(jù)出現(xiàn)差錯(cuò)的環(huán)節(jié)。質(zhì)量模型就是將示意圖如下:
2.2.2 分析監(jiān)控需求
分析監(jiān)控主要是將維護(hù)的質(zhì)量模型通過設(shè)定分析方案、分析規(guī)則、掃描監(jiān)控、數(shù)據(jù)質(zhì)量信息、審核,確定通過定義周期實(shí)現(xiàn)執(zhí)行風(fēng)險(xiǎn)模型自動(dòng)掃描,最總成果為數(shù)據(jù)質(zhì)量信息。分析方案可以維護(hù)自動(dòng)治理規(guī)則或者選擇人工質(zhì)量,需要有自動(dòng)的監(jiān)聽執(zhí)行功能和高效能的分析引擎。分析監(jiān)控的主要流程圖如下:
2.2.3 任務(wù)統(tǒng)籌需求
任務(wù)統(tǒng)籌實(shí)現(xiàn)對(duì)審核通過的數(shù)據(jù)質(zhì)量信息,進(jìn)行任務(wù)統(tǒng)籌下發(fā),主要存在多任務(wù)的合并和逐級(jí)下發(fā)功能。處理好任務(wù)統(tǒng)籌,就需要對(duì)市、區(qū)縣、分局三級(jí)的用戶人員功能進(jìn)行操作,任務(wù)統(tǒng)籌可以分為主要以下環(huán)節(jié):任務(wù)定義、任務(wù)下發(fā)、任務(wù)接收、任務(wù)合并、任務(wù)分配,通過分析可以樹立出目前任務(wù)統(tǒng)籌的一個(gè)整體流程如下:
2.2.4 質(zhì)量治理需求
質(zhì)量治理是最后管控過程的最后一道環(huán)節(jié),主要操作對(duì)象是科所級(jí)的用戶操作。質(zhì)量治理在方式上要提供給用戶任務(wù)辦理和處置的頁(yè)面,同時(shí)要有對(duì)處置結(jié)果的檢測(cè)功能,確保治理后的效果。同時(shí)考慮業(yè)務(wù)上的需求,該模塊還需要具有審核流程和辦結(jié)等處理。所以梳理的質(zhì)量治理需求流程圖如下:
2.2.5 成果分析需求
1. 過程跟蹤
主要實(shí)現(xiàn)質(zhì)量管控各個(gè)環(huán)節(jié)的成果進(jìn)行統(tǒng)計(jì)跟蹤,包括模型體系的指標(biāo)元、指標(biāo)、模型的建立數(shù)量;分析監(jiān)控的方案、掃描分析、數(shù)據(jù)質(zhì)量數(shù)據(jù)等;任務(wù)制發(fā)、流轉(zhuǎn)、超限的過程跟蹤;治理的進(jìn)度和成果進(jìn)行跟蹤。
2. 效應(yīng)分析
主要是對(duì)治理前的數(shù)據(jù)質(zhì)量問題和治理后數(shù)據(jù)質(zhì)量問題進(jìn)行宏觀比對(duì),通過比對(duì)算法,對(duì)不同業(yè)務(wù)指標(biāo)的計(jì)算準(zhǔn)確性等從治理前到治理后對(duì)比,對(duì)治理前后
的數(shù)據(jù)質(zhì)量問題遺漏情況進(jìn)行比對(duì)效應(yīng)分析。通過這些分析,驗(yàn)證業(yè)務(wù)系統(tǒng)完整性,不斷對(duì)質(zhì)量模型進(jìn)行優(yōu)化。
2.2.6 分析預(yù)警需求
數(shù)據(jù)質(zhì)量管控系統(tǒng)處理結(jié)果的積累上,可將數(shù)據(jù)質(zhì)量管控結(jié)果作為知識(shí)積累,一方面對(duì)大量的質(zhì)量數(shù)據(jù)進(jìn)行分析,找出問題突出的數(shù)據(jù)質(zhì)量問題和來源,有方向有側(cè)重點(diǎn)的在某些行業(yè)某些區(qū)域加大數(shù)據(jù)質(zhì)量管控,進(jìn)行宏觀的輔助決策。其次,利用整個(gè)質(zhì)量管控知識(shí)庫(kù),可以根據(jù)業(yè)務(wù)數(shù)據(jù)依賴規(guī)則、數(shù)理統(tǒng)計(jì)、二八原理、人工智能算法等進(jìn)行潛在的數(shù)據(jù)質(zhì)量問題預(yù)警,提高數(shù)據(jù)質(zhì)量管控的持續(xù)深入發(fā)展。核心的業(yè)務(wù)可以從分析和預(yù)警兩個(gè)方面考慮:
1. 數(shù)據(jù)質(zhì)量管控結(jié)果分析的分時(shí)間、稅務(wù)機(jī)關(guān)、分質(zhì)量模型、分行業(yè)等維度進(jìn)行宏觀分析,找出問題突發(fā)區(qū)域,進(jìn)行輔助決策。
2. 潛在數(shù)據(jù)質(zhì)量問題的預(yù)警,依賴進(jìn)行預(yù)警值測(cè)算和人工智能算法等方式進(jìn)行分析,進(jìn)行潛在關(guān)聯(lián)的數(shù)據(jù)質(zhì)量問題預(yù)警。
2.2.7 系統(tǒng)管理需求
系統(tǒng)管理主要是確保系統(tǒng)有獨(dú)立的權(quán)限控制系統(tǒng)和運(yùn)維監(jiān)控功能,主要分為權(quán)限管理和日志管理兩方面,對(duì)系統(tǒng)安全和優(yōu)化提供監(jiān)控?cái)?shù)據(jù)。
1. 用戶、崗位、角色管理,進(jìn)行系統(tǒng)用戶密碼、身份的維護(hù);
2. 日志管理,監(jiān)控系統(tǒng)登錄日志、菜單訪問日志、系統(tǒng)報(bào)錯(cuò)日志、流量監(jiān)控日志的查詢監(jiān)控。
2.3 功能需求
本章節(jié)采用UML建模中的用例建模來分析業(yè)務(wù)需求中的需要包含的系統(tǒng)功能需求分析。參照系統(tǒng)角色分析,系統(tǒng)中的用戶可按照角色對(duì)應(yīng)分別為:質(zhì)量模型維護(hù)和分析監(jiān)控管理工作交由各級(jí)信息中心技術(shù)人員操作;任務(wù)統(tǒng)籌環(huán)節(jié),由各級(jí)機(jī)關(guān)設(shè)置專門的數(shù)據(jù)質(zhì)量管控專員負(fù)責(zé)各級(jí)任務(wù)接收流轉(zhuǎn);質(zhì)量治理主要有各業(yè)務(wù)處室的業(yè)務(wù)操作人員執(zhí)行;成果分析用戶和分析預(yù)警用戶主要提供給各層級(jí)機(jī)關(guān)局領(lǐng)導(dǎo)使用,進(jìn)行宏觀輔助決策工作使用;設(shè)定單獨(dú)的專人做系統(tǒng)管理員。所以該系統(tǒng)的所有用戶為:技術(shù)人員、管控專員、業(yè)務(wù)操作人員、局領(lǐng)導(dǎo)和系統(tǒng)管理員。以下是對(duì)系統(tǒng)流程中核心功能模塊的功能需求分析,如下圖(系統(tǒng)整體
用例圖)。
局領(lǐng)導(dǎo)
2.3.1 模型體系管理
質(zhì)量模型體系在功能上是要將業(yè)務(wù)上的數(shù)據(jù)質(zhì)量規(guī)則和要求,通過系統(tǒng)功能進(jìn)行實(shí)現(xiàn)定義出來,分別建立功能點(diǎn)來實(shí)現(xiàn)對(duì)接層、邏輯層和規(guī)則層的功能,所以該模塊在功能上可以分為指標(biāo)元管理、指標(biāo)管理、模型管理三個(gè)功能來實(shí)現(xiàn)。
技術(shù)人員
2.3.1.1 指標(biāo)元維護(hù)
指標(biāo)元維護(hù)在功能上主要將數(shù)據(jù)層到應(yīng)用層的對(duì)接,是將來源數(shù)據(jù)表的字段定義成可視化的業(yè)務(wù)名詞,是對(duì)底層數(shù)據(jù)庫(kù)到業(yè)務(wù)層的名詞對(duì)照關(guān)系維護(hù),指標(biāo)元維護(hù)的主要功能有:指標(biāo)元新增、指標(biāo)元修改、指標(biāo)元移除、指標(biāo)元導(dǎo)出、批量新增和指標(biāo)元檢測(cè)等主要用例,如下圖所示:
技術(shù)人員
表2-1 指標(biāo)元維護(hù)用例表
2.3.1.2 指標(biāo)維護(hù)
指標(biāo)維護(hù)功能對(duì)照業(yè)務(wù)需求質(zhì)量模型的邏輯層維護(hù)功能,是將業(yè)務(wù)指標(biāo)的加工規(guī)則公式和部分?jǐn)?shù)據(jù)函數(shù)基于指標(biāo)元定義出來。指標(biāo)維護(hù)的主要功能有:指標(biāo)維護(hù)、指標(biāo)修改、指標(biāo)移除、指標(biāo)導(dǎo)出、批量維護(hù)和指標(biāo)檢測(cè)等主要用例,如下圖所示:
表2-2 指標(biāo)維護(hù)用例表
2.3.1.3 模型維護(hù)
模型維護(hù)功能對(duì)照業(yè)務(wù)需求質(zhì)量模型的規(guī)則層維護(hù)功能,基于指標(biāo),定義出來數(shù)據(jù)質(zhì)量業(yè)務(wù)判斷過濾的邏輯規(guī)則。模型維護(hù)的主要功能有:模型維護(hù)、模型修改、模型移除、模型檢查等主要用例,如下圖所示:
表2-3 模型維護(hù)用例表
2.3.2 分析監(jiān)控管理 2.3.2.1 管控方案管理
監(jiān)控方案管理是設(shè)置出數(shù)據(jù)質(zhì)量監(jiān)控的數(shù)據(jù)范圍和執(zhí)行規(guī)則,包括所使用的質(zhì)量模型、分析期間、是否周期掃描、行業(yè)、稅務(wù)機(jī)關(guān)、清理規(guī)則等。主要功能用例如下:
表2-4 監(jiān)控方案維護(hù)用例表
2.3.2.1 掃描監(jiān)控管理
掃描監(jiān)控主要是按照維護(hù)的質(zhì)量模型規(guī)則和方案規(guī)則進(jìn)行自動(dòng)化的監(jiān)控分析,包括觸發(fā)開始時(shí)間、結(jié)束時(shí)間、異常信息、結(jié)果信息等。掃描監(jiān)控功能上需要實(shí)現(xiàn)一個(gè)高能效的分析引擎來保障自動(dòng)調(diào)度和智能算法解析掃描,具體功能如下:
表2-4 掃描監(jiān)控維護(hù)用例表
2.3.3 任務(wù)統(tǒng)籌管理
任務(wù)統(tǒng)籌管理功能是實(shí)現(xiàn)了將數(shù)據(jù)質(zhì)量問題清單通過任務(wù)流轉(zhuǎn)方式,最終確定治理人員和質(zhì)量方式,確保管控流程閉環(huán)。主要功能實(shí)現(xiàn)省、市、(縣)區(qū)、科所人員間的任務(wù)流轉(zhuǎn),實(shí)現(xiàn)數(shù)據(jù)治理任務(wù)流轉(zhuǎn)到具體的處置人員。主要的功能用例如下:
表2-4 任務(wù)統(tǒng)籌維護(hù)用例表
2.3.4 數(shù)據(jù)質(zhì)量治理
數(shù)據(jù)質(zhì)量治理主要是在確定人員和確定方式后,對(duì)數(shù)據(jù)質(zhì)量問題進(jìn)行清理,清理后進(jìn)行下規(guī)則檢測(cè),確保數(shù)據(jù)清理的正確性。主要功能包括異常數(shù)據(jù)清理和規(guī)則檢驗(yàn)、提交審核、辦結(jié)處理。
異常數(shù)據(jù)清洗、清理、驗(yàn)證。
表2-4 數(shù)據(jù)質(zhì)量治理用例表
2.3.5 管控成果分析
在系統(tǒng)實(shí)現(xiàn)數(shù)據(jù)質(zhì)量管控的流程環(huán)節(jié)基礎(chǔ)上,對(duì)各個(gè)環(huán)節(jié)的過程成果和過程情況進(jìn)行分析和跟蹤,含跟蹤管理和效應(yīng)分析,主要功能用例如下:
表2-4 管控成果分析用例表
2.3.6 分析預(yù)警
分析預(yù)警主要包括兩部分功能,包括宏觀分析和潛在數(shù)據(jù)質(zhì)量問題預(yù)警,提供給管理者輔助決策信息。宏觀分析包括分稅務(wù)機(jī)關(guān)、分行業(yè)、分質(zhì)量模型等多維度的成果查詢統(tǒng)計(jì)分析。數(shù)據(jù)質(zhì)量預(yù)警主要通過預(yù)警算法維護(hù)、預(yù)警值測(cè)算和監(jiān)控預(yù)警。具體的分析預(yù)警用例如下:
分稅種、分行業(yè)、分月份、分事項(xiàng)等;
表2-4 分析預(yù)警用例表
2.3.7 系統(tǒng)管理
系統(tǒng)管理主要功能為權(quán)限管理和日志管理兩個(gè)模塊內(nèi)容,權(quán)限管理功能包括用戶管理、角色管理、崗位管理,日志管理主要是用戶登錄情況日志監(jiān)控、菜單訪問日志、系統(tǒng)報(bào)錯(cuò)日志、流量監(jiān)控日志的日志監(jiān)控功能。具體用例如下:
表2-4 系統(tǒng)管理用例表
2.4 非功能需求
2.4.1
性能需求
數(shù)據(jù)質(zhì)量管控系統(tǒng)用戶對(duì)象為所有內(nèi)部稅務(wù)人員,全局稅務(wù)人員6000名,其中主要的用戶群體為信息中心負(fù)責(zé)數(shù)據(jù)運(yùn)維人員使用,預(yù)計(jì)全局使用用戶為1000名。按照目前的規(guī)模評(píng)估用戶并峰值在100左右。系統(tǒng)登錄性能要求為平均登錄響應(yīng)時(shí)長(zhǎng)不能超過5s,最長(zhǎng)不能超過10s。系統(tǒng)核心是對(duì)大數(shù)據(jù)的質(zhì)量監(jiān)控,核心的性能問題會(huì)集中在數(shù)據(jù)統(tǒng)計(jì)和模型分析引擎的執(zhí)行性能,既包括分析引擎對(duì)服務(wù)器的資源占用,分析過程對(duì)數(shù)據(jù)庫(kù)的資源占用。性能過程需對(duì)應(yīng)用服務(wù)器和數(shù)據(jù)庫(kù)服務(wù)均進(jìn)行性能監(jiān)控和優(yōu)化,服務(wù)器的CPU占用不能高于60%,內(nèi)存占用不超過70%。
其他具體系統(tǒng)模塊的性能要求如下: 查詢類業(yè)務(wù)性能要求:
分析型業(yè)務(wù)性能要求:
2.4.2 安全性需求
系統(tǒng)接入安全:
1、渠道安全:應(yīng)用系統(tǒng)對(duì)所有的接入渠道進(jìn)行渠道安全校驗(yàn),只有被許可的接入渠道才能接入應(yīng)用系統(tǒng)。
2、身份認(rèn)證:應(yīng)用系統(tǒng)對(duì)所有的接入渠道需要通過口令認(rèn)證方式進(jìn)行身份認(rèn)證,只有被許可的接入渠道及提供正確的口令才能使用應(yīng)用系統(tǒng)提供的服務(wù)。
3、權(quán)限控制:應(yīng)用系統(tǒng)對(duì)所有的接入交易請(qǐng)求根據(jù)渠道進(jìn)行權(quán)限控制,只有被許可的渠道接入及被允許的交易請(qǐng)求才能正常使用應(yīng)用系統(tǒng)提供的服務(wù)。
系統(tǒng)數(shù)據(jù)安全:
1、傳輸安全:關(guān)鍵數(shù)據(jù)在傳輸過程中,必須加密傳輸,以保證數(shù)據(jù)的傳輸安全性。
2、存儲(chǔ)安全:根據(jù)國(guó)家稅務(wù)局等級(jí)保護(hù)三級(jí)要求,應(yīng)用系統(tǒng)必須保證數(shù)據(jù)的存儲(chǔ)安全。因此,在稅務(wù)局內(nèi)部網(wǎng)絡(luò)環(huán)境下,必須將與業(yè)務(wù)相關(guān)的數(shù)據(jù)保存在稅務(wù)局內(nèi)網(wǎng)區(qū)域(核心區(qū)域)。 2.4.3
可擴(kuò)展性需求
系統(tǒng)應(yīng)能適應(yīng)稅務(wù)數(shù)據(jù)應(yīng)用需求復(fù)雜多變的要求,考慮未來 3-5 年的可擴(kuò)展性,采用構(gòu)件化設(shè)計(jì)思想,系統(tǒng)框架與業(yè)務(wù)邏輯分離,具備開放的可擴(kuò)展體系
結(jié)構(gòu),支持在線升級(jí)和擴(kuò)展,支持多用戶和并行訪問。系統(tǒng)的設(shè)計(jì)應(yīng)確保在用戶
系統(tǒng)保存已有和未來至少五年的(共十年以上)最明細(xì)的業(yè)務(wù)數(shù)據(jù)。進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)應(yīng)與生產(chǎn)系統(tǒng)中的數(shù)據(jù)保持一致。經(jīng)過數(shù)據(jù)清洗、裝載、查詢、展現(xiàn)后為用戶提供準(zhǔn)確的數(shù)據(jù)。 2.4.4
其他技術(shù)需求
建立統(tǒng)一的數(shù)據(jù)模型標(biāo)準(zhǔn)。技術(shù)框架采用J2EE架構(gòu),JAVA語(yǔ)言為主要開發(fā)語(yǔ)言,基于B/S(Browser/Web Server)和關(guān)系型數(shù)據(jù)庫(kù)方式實(shí)現(xiàn)。具體需求如下:系統(tǒng)后臺(tái)采用WINDOWS SERVER、UNIX 等平臺(tái)、WEBLOGIC等應(yīng)用服務(wù)和 ORACLE大型數(shù)據(jù)庫(kù)。
第3章 系統(tǒng)設(shè)計(jì)
3.1 應(yīng)用體系設(shè)計(jì)
根據(jù)總體設(shè)計(jì),操作型業(yè)務(wù)與分析型業(yè)務(wù)需要進(jìn)行分離設(shè)計(jì)。本系統(tǒng)的模塊可劃分如下:
3.1.1操作型業(yè)務(wù)
操作型業(yè)務(wù)設(shè)計(jì)以生命周期管理為核心,以工作流的驅(qū)動(dòng)方式執(zhí)行全流程的閉環(huán)控制管理。
本子系統(tǒng)的操作型業(yè)務(wù)有模型體系管理告、任務(wù)統(tǒng)籌管理、數(shù)據(jù)質(zhì)量治理等業(yè)務(wù)。
下面重點(diǎn)闡述管控生命周期管理,其它模塊的設(shè)計(jì)重點(diǎn)為數(shù)據(jù)模型設(shè)計(jì),將在數(shù)據(jù)體系結(jié)構(gòu)中展開。
1. 數(shù)據(jù)質(zhì)量管控的生命周期管理 如下圖所示:
數(shù)據(jù)質(zhì)量掃描得到的掃描疑點(diǎn)的明細(xì)信息,進(jìn)入數(shù)據(jù)信息庫(kù)。 ? 處理
數(shù)據(jù)掃描疑點(diǎn)明細(xì)信息,需要進(jìn)入疑點(diǎn)風(fēng)險(xiǎn)評(píng)價(jià)環(huán)節(jié),該環(huán)節(jié)是疑點(diǎn)信息量化的主要步驟,將通過排序等手段,生成疑點(diǎn)數(shù)據(jù)等級(jí)等信息。
? 消除
數(shù)據(jù)疑點(diǎn)信息在應(yīng)對(duì)完畢之后,通過應(yīng)對(duì)系統(tǒng)的反饋,消除該數(shù)據(jù)疑點(diǎn)信息。 2. 數(shù)據(jù)質(zhì)量管理閉環(huán)控制
數(shù)據(jù)質(zhì)量管控管理是一個(gè)閉環(huán)操作,圍繞數(shù)據(jù)疑點(diǎn)管理戰(zhàn)略目標(biāo)實(shí)施,通過疑點(diǎn)數(shù)據(jù)識(shí)別、分析、評(píng)價(jià)、應(yīng)對(duì)、管理全程監(jiān)控及結(jié)果評(píng)估構(gòu)成閉環(huán),同時(shí)通
過不斷的監(jiān)控、分析報(bào)告對(duì)整個(gè)管理過程進(jìn)行持續(xù)改進(jìn)。
閉環(huán)需要較為完備的流程控制,以上描述的生命周期管理,將以工作流的驅(qū)動(dòng)方式進(jìn)行管理,工作流程圖如下所示:
說明:
綜合分析數(shù)據(jù)質(zhì)量管控的主要功能模塊,以及數(shù)據(jù)質(zhì)量管控與其他子系統(tǒng)的關(guān)聯(lián)使用,得到以下體系結(jié)構(gòu)圖:
數(shù)據(jù)質(zhì)量管控體系結(jié)構(gòu)圖
說明:
1. 總體技術(shù)架構(gòu)
公司的技術(shù)架構(gòu),包含前端、web、框架、通信各個(gè)層面解決手段。 2. 指標(biāo)管理平臺(tái)
數(shù)據(jù)質(zhì)量管控基于指標(biāo)管理平臺(tái)設(shè)計(jì),指標(biāo)管理平臺(tái)提供豐富的支撐功能。 3. 核心服務(wù)
系統(tǒng)的核心服務(wù),如組件管理,運(yùn)維管理等。 4. 業(yè)務(wù)邏輯層
業(yè)務(wù)邏輯的封裝,隔離底層與界面層的交互。 5. Web應(yīng)用功能 1) 界面層
數(shù)據(jù)質(zhì)量管控主要分為7個(gè)模塊:
6. 接口
數(shù)據(jù)質(zhì)量管控的接口層,與外部系統(tǒng)的接口都在此層面規(guī)劃。
3.1.2分析型業(yè)務(wù)
數(shù)據(jù)質(zhì)量管控的分析型業(yè)務(wù)主要有指標(biāo)預(yù)警值測(cè)算和風(fēng)險(xiǎn)掃描等,這兩個(gè)業(yè)務(wù)都是依賴指標(biāo)管理平臺(tái),如下圖所示:
指標(biāo)預(yù)警值測(cè)算是數(shù)據(jù)掃描的一個(gè)必要輸入,在掃描過程中,可能會(huì)使用到指標(biāo)的預(yù)警信息如均值、上下限等,這些都是需要事先預(yù)處理的,指標(biāo)管理平臺(tái)提供相關(guān)的指標(biāo)測(cè)算服務(wù)。
掃描是對(duì)掃描方案的執(zhí)行過程,在分解了掃描方案之后,主要的工作就是調(diào)用指標(biāo)管理平臺(tái)的分析引擎服務(wù),執(zhí)行相關(guān)的操作,并保存結(jié)果。
3.2 架構(gòu)設(shè)計(jì)
3.2.1技術(shù)架構(gòu)
本項(xiàng)目采用J2EE相關(guān)的架構(gòu)進(jìn)行開發(fā),技術(shù)架構(gòu)圖如下:
31
架構(gòu)說明:
1. 整個(gè)架構(gòu)主要由客戶層、中間層(web層、架構(gòu)層、EJB層)、資源層組成。
2. 客戶層:系統(tǒng)最終用戶的使用界面和設(shè)備。一般為基于瀏覽器的瘦客戶端,比如IE等;本項(xiàng)目中使用了SUI來實(shí)現(xiàn)展現(xiàn)效果。
3. 中間層:用戶和系統(tǒng)之間的交互管理,提供用戶層的展現(xiàn)邏輯和對(duì)資源層的訪問接口。該層主要采用Front Controller, Request Processor, Command, View Dispatcher,DAO、工廠等設(shè)計(jì)模式來實(shí)現(xiàn)。本項(xiàng)目在WEB層使用Webfaster,在架構(gòu)層使用SOA。
4. 資源層(EIS):各種信息系統(tǒng)資源,在本系統(tǒng)中主要用到了:RDBMS(數(shù)據(jù)庫(kù)),以及文件數(shù)據(jù)容器(主要是在分析引擎中使用)。
3.2.2體系架構(gòu)
界面管理模塊的執(zhí)行過程如下圖所示:
32
展現(xiàn)層
說明:
1.
用戶通過操作界面與系統(tǒng)進(jìn)行交互。
2. 用戶操作的數(shù)據(jù)經(jīng)過展現(xiàn)層、接口層、核心層,最終存儲(chǔ)到數(shù)據(jù)層中。 3. 展現(xiàn)層包括了傳統(tǒng)架構(gòu)分層中的界面層、web層、架構(gòu)層、業(yè)務(wù)邏輯層
的一部分。
4. 接口層、業(yè)務(wù)核心層是對(duì)傳統(tǒng)業(yè)務(wù)邏輯層的進(jìn)一步細(xì)化,業(yè)務(wù)核心層包
含了傳統(tǒng)業(yè)務(wù)邏輯層的大部分內(nèi)容;部分功能遵循此結(jié)構(gòu)。
應(yīng)用執(zhí)行體系將設(shè)計(jì)期和運(yùn)行期分離設(shè)計(jì),將部分功能充分松耦合,達(dá)到靈活性、可擴(kuò)展性和復(fù)用性,如下圖所示:
說明:
掃描方案執(zhí)行器接收到掃描方案實(shí)體對(duì)象,將對(duì)象解析后調(diào)用指標(biāo)管理平臺(tái)
33
提供的算法和子系統(tǒng)內(nèi)部處理邏輯,完成掃描,輸出掃描結(jié)果信息。
在設(shè)計(jì)期,系統(tǒng)只需要生成樣掃描方案等內(nèi)容,將這些內(nèi)容存于數(shù)據(jù)庫(kù)即可。 在運(yùn)行期,通過手動(dòng)觸發(fā)或者系統(tǒng)自動(dòng)任務(wù)監(jiān)聽,讀取并解析設(shè)計(jì)期的成果,生成相關(guān)的執(zhí)行實(shí)例,調(diào)用分析引擎等工具,執(zhí)行得到結(jié)果,寫入執(zhí)行結(jié)果相關(guān)數(shù)據(jù)庫(kù)表。
方案是數(shù)據(jù)質(zhì)量管控的關(guān)鍵數(shù)據(jù)對(duì)象,是掃描的基礎(chǔ),它需要滿足風(fēng)掃描這一動(dòng)態(tài)執(zhí)行功能的業(yè)務(wù)和技術(shù)兩方面的要求,這個(gè)要求如果再做一個(gè)邏輯抽象,可以很直觀地將方案劃分為兩個(gè)執(zhí)行部分:方案的執(zhí)行實(shí)體和方案執(zhí)行參數(shù)。
除此之外,方案還要能提交到知識(shí)庫(kù)與大家分享,方案可以方便展現(xiàn)出來。 綜上分析,這個(gè)關(guān)鍵數(shù)據(jù)對(duì)象的劃分如下圖所示:
執(zhí)行實(shí)體指明的是掃描執(zhí)行的具體業(yè)務(wù)對(duì)象、風(fēng)險(xiǎn)分析算法等內(nèi)容,執(zhí)行參數(shù)則是用于支撐動(dòng)態(tài)執(zhí)行所必須的周期頻率、執(zhí)行時(shí)間等參數(shù)。
更具體的設(shè)計(jì)內(nèi)容見“關(guān)鍵設(shè)計(jì)”章節(jié)。
風(fēng)險(xiǎn)方案執(zhí)行器在接收到掃描方案實(shí)體對(duì)像后,先進(jìn)行對(duì)象的檢測(cè),以確定對(duì)象是否適應(yīng)當(dāng)前的執(zhí)行環(huán)境。
檢測(cè)通過之后,執(zhí)行對(duì)象的解析,產(chǎn)生可以計(jì)算的實(shí)體對(duì)象,如指標(biāo)信息,計(jì)分規(guī)則信息等。然后依據(jù)對(duì)象的類別調(diào)用不同的執(zhí)行器實(shí)現(xiàn)類執(zhí)行運(yùn)算,運(yùn)算過程中根據(jù)需要調(diào)用指標(biāo)管理平臺(tái)提供的算法,最終完成運(yùn)算結(jié)果的輸出。
具體實(shí)現(xiàn)流程如下圖所示:
34
35
說明:
方案如果想正確執(zhí)行,我們需要知道,方案是否適應(yīng)當(dāng)前的環(huán)境,因此,方案執(zhí)行的時(shí)候系統(tǒng)將自動(dòng)觸發(fā)方案的檢測(cè),方案的檢測(cè)產(chǎn)物主要是方案的檢測(cè)狀態(tài)和檢測(cè)報(bào)告。
掃描方案的實(shí)體對(duì)象在檢測(cè)通過之后,進(jìn)入分解環(huán)節(jié),該環(huán)節(jié)主要的分解結(jié)果是模型、指標(biāo)和運(yùn)行所需的參數(shù)。任務(wù)監(jiān)聽程序會(huì)監(jiān)聽運(yùn)行參數(shù),在合適的時(shí)候啟動(dòng)掃描流程。
掃描方案執(zhí)行流程中,首先要處理的就是分解環(huán)節(jié)的模型、指標(biāo)信息,這是風(fēng)險(xiǎn)掃描的關(guān)鍵所在,預(yù)處理通過之后才執(zhí)行相關(guān)的處理流程。
3.3 數(shù)據(jù)體系設(shè)計(jì)
3.3.1 概念模型
在設(shè)計(jì)數(shù)據(jù)模型時(shí),必須從基于合乎業(yè)務(wù)基本原理的業(yè)務(wù)規(guī)則出發(fā),根據(jù)業(yè)務(wù)內(nèi)涵來設(shè)計(jì)數(shù)據(jù)存儲(chǔ)的模型。這點(diǎn)能夠大大提升單位數(shù)據(jù)的處理效率,是有效解決該問題的基礎(chǔ)。合理的數(shù)據(jù)分層規(guī)劃和數(shù)據(jù)分布設(shè)計(jì),能夠更好的理順數(shù)據(jù)間的關(guān)系,從而可以簡(jiǎn)化數(shù)據(jù)的存儲(chǔ)、數(shù)據(jù)的處理,從而提升效率。 在設(shè)計(jì)數(shù)據(jù)模型時(shí)必須遵循以下原則:
? 完整性原則:全面覆蓋稅務(wù)業(yè)務(wù)
? 穩(wěn)定性原則:實(shí)現(xiàn)在保持全局穩(wěn)定的前提下的持續(xù)改進(jìn) ? 適應(yīng)性原則:適應(yīng)各個(gè)層級(jí)、不同用戶的需求 ? 高效性原則:實(shí)現(xiàn)數(shù)據(jù)的高效訪問
數(shù)據(jù)質(zhì)量管控的概念模型設(shè)計(jì),主要是從業(yè)務(wù)處理流程展開,并考慮輔助系統(tǒng)的其他必須數(shù)據(jù),總體概念模型設(shè)計(jì)如下圖:
36
說明:
4 數(shù)據(jù)質(zhì)量疑點(diǎn)識(shí)別的核心是數(shù)據(jù)特征庫(kù),主要包含數(shù)據(jù)指標(biāo)與模型,其中疑
點(diǎn)數(shù)據(jù)特征指標(biāo),在獲取指標(biāo)管理平臺(tái)的指標(biāo)相關(guān)基本屬性之外,還享有數(shù)據(jù)管理所需專用屬性。
5 指標(biāo)預(yù)警值是指標(biāo)預(yù)處理的結(jié)果,供后續(xù)數(shù)據(jù)疑點(diǎn)分析環(huán)節(jié)使用。 6 疑點(diǎn)數(shù)據(jù)分析方案是分析的基礎(chǔ),是風(fēng)險(xiǎn)疑點(diǎn)數(shù)據(jù)掃描的支撐。 7 人員權(quán)限信息,用于管理系統(tǒng)的人員權(quán)限控制。 8 監(jiān)控信息,保存系統(tǒng)運(yùn)維的監(jiān)控?cái)?shù)據(jù)。
9 日志記錄,數(shù)據(jù)質(zhì)量分析流程相關(guān)處理操作統(tǒng)一保存在日志信息實(shí)體中,便
于操作查看和追溯。
10 配置控制,數(shù)據(jù)質(zhì)量管理業(yè)務(wù)處理過程中將一些系統(tǒng)參數(shù)信息保存到配置信
息實(shí)體中,方便修改維護(hù)。
37
3.3.3 數(shù)據(jù)結(jié)構(gòu)
表分類說明
平臺(tái)的數(shù)據(jù)庫(kù)表可分為以下幾類:
在數(shù)據(jù)質(zhì)量管控系統(tǒng)中,分析監(jiān)控是最核心的業(yè)務(wù)功能需求,包括方案定義維護(hù)和分析監(jiān)考,這2塊的數(shù)據(jù)庫(kù)設(shè)計(jì)如下圖:
模型體系及分析監(jiān)控
38
3.4 部署體系設(shè)計(jì)
3.4.1 部署結(jié)構(gòu)圖設(shè)計(jì)
管理部署結(jié)構(gòu)如下圖所示:
部署風(fēng)險(xiǎn)管理應(yīng)用服務(wù)器、文件服務(wù)器、緩存服務(wù)器,數(shù)據(jù)庫(kù)服務(wù)器。部署策略如下:
1. 數(shù)據(jù)管控管理應(yīng)用服務(wù)器:管理應(yīng)用完成界面和流程類操作。 2. 數(shù)據(jù)庫(kù)服務(wù)器:數(shù)據(jù)庫(kù)分為:數(shù)據(jù)倉(cāng)庫(kù),風(fēng)險(xiǎn)管理庫(kù),指標(biāo)管理庫(kù),統(tǒng)
39
一權(quán)限庫(kù)。
3. 緩存服務(wù)器集群:負(fù)責(zé)存在子系統(tǒng)產(chǎn)生的實(shí)體數(shù)據(jù)對(duì)象。
4. 監(jiān)聽服務(wù)器:風(fēng)險(xiǎn)系統(tǒng)所有的監(jiān)聽服務(wù)獨(dú)立部署一個(gè)但節(jié)點(diǎn)的應(yīng)用。 3.4.2 部署硬件設(shè)計(jì) 建議配置如下:
3.5 模塊設(shè)計(jì)
3.5.1 模塊功能結(jié)構(gòu)
通過對(duì)業(yè)務(wù)需求和業(yè)務(wù)架構(gòu)梳理,歸納數(shù)據(jù)質(zhì)量管控功能模塊框架。數(shù)據(jù)質(zhì)量管控功能模塊框架總體上分為三大部分,一部分是數(shù)據(jù)質(zhì)量管控業(yè)務(wù)流程實(shí)現(xiàn)部分,其中包括數(shù)據(jù)疑點(diǎn)識(shí)別、疑點(diǎn)分析、數(shù)據(jù)疑點(diǎn)評(píng)價(jià);第二部分是應(yīng)對(duì)管理部分,其中包括應(yīng)對(duì)管理、疑點(diǎn)處置;第三部分是質(zhì)效評(píng)價(jià)。 從界面模塊以及后臺(tái)模塊角度考慮,得到以下模塊結(jié)構(gòu)圖:
40
【電子稅務(wù)局畢業(yè)論文】相關(guān)文章:
稅務(wù)局電子檔案管理工作經(jīng)驗(yàn)交流材料04-29
稅務(wù)局介紹信01-23
稅務(wù)局工作總結(jié)04-26
稅務(wù)局季度工作計(jì)劃04-29
稅務(wù)局工作計(jì)劃8篇12-09
稅務(wù)局工作計(jì)劃四篇12-02
稅務(wù)局工作計(jì)劃10篇11-30
關(guān)于稅務(wù)局實(shí)習(xí)報(bào)告4篇08-29
稅務(wù)局信訪工作總結(jié)01-27
稅務(wù)局工作計(jì)劃九篇11-23