- 相關(guān)推薦
淺析軟件工程數(shù)據(jù)挖掘研究進(jìn)展論文
摘要:隨著計(jì)算機(jī)信息網(wǎng)絡(luò)的快速發(fā)展,數(shù)據(jù)挖掘在軟件工程中的地位越來(lái)越突出。軟件工程數(shù)據(jù)挖掘是在冗余的數(shù)據(jù)中發(fā)現(xiàn)有用的數(shù)據(jù),從而得到更好地利用。社會(huì)的發(fā)展,科技的進(jìn)步使得社會(huì)進(jìn)入了網(wǎng)絡(luò)信息熱時(shí)代,隨之計(jì)算機(jī)軟件也不斷增加,人們獲取的信息大部分是人手動(dòng)操作軟件獲得的,這樣的信息量具有一定的局限性。因此,為了滿足當(dāng)今社會(huì)的需要,必須借助于軟件工程數(shù)據(jù)挖掘的手段。
關(guān)鍵詞:軟件工程;數(shù)據(jù)挖掘;研究現(xiàn)狀
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2017)26-0020-02
利用數(shù)據(jù)挖掘技術(shù)對(duì)大量冗余的數(shù)據(jù)進(jìn)行篩選從而得到少量精確的信息。冗余的數(shù)據(jù)是指既包含有用信息有包含無(wú)用信息,利用數(shù)據(jù)挖掘技術(shù)剔除掉多余的無(wú)用信息留下有用信息,這樣既可以提高手機(jī)數(shù)據(jù)的質(zhì)量又可以提高工作效率。所以,數(shù)據(jù)挖掘技術(shù)在當(dāng)前的軟件工程中起著越來(lái)越重要的作用。數(shù)據(jù)挖掘技術(shù)提取、篩選、分析和整理數(shù)據(jù)比人工操作軟件獲得的數(shù)據(jù)更精確更高效。同時(shí),使用這種技術(shù)為軟件開(kāi)發(fā)者提供了有利的條件,它可以給軟件開(kāi)發(fā)者提供一些對(duì)其開(kāi)發(fā)軟件有用的信息。軟件開(kāi)發(fā)者想要更有效率的開(kāi)發(fā)出更高質(zhì)量的軟件,就必須獲得更多的更有用的數(shù)據(jù),而想要收集和整理出有用數(shù)據(jù)就需要借助數(shù)據(jù)挖掘技術(shù)來(lái)實(shí)現(xiàn),進(jìn)而提高工作效率。
1 數(shù)據(jù)挖掘的基本概述
軟件工程數(shù)據(jù)主要是指開(kāi)發(fā)軟件過(guò)程中所涉及的各類數(shù)據(jù),如需求分析、可行性分析、設(shè)計(jì)等文檔,開(kāi)發(fā)商通信、軟件注釋、代碼、版本、測(cè)試用例和結(jié)果、使用說(shuō)明、用戶反饋等信息數(shù)據(jù),一般情況下其是軟件開(kāi)發(fā)者獲取軟件數(shù)據(jù)的唯一來(lái)源;而數(shù)據(jù)挖掘是指在海量數(shù)據(jù)中集中發(fā)現(xiàn)有用知識(shí)或信息的過(guò)程。
軟件工程數(shù)據(jù)挖掘的工作原理 主要包括數(shù)據(jù)預(yù)處理階段、挖掘階段以及評(píng)估階段三個(gè)方面。在挖掘階段主要是運(yùn)用分類、統(tǒng)計(jì)、關(guān)聯(lián)、聚類、異常檢測(cè)等一系列算法的過(guò)程。在評(píng)估階段數(shù)據(jù)挖掘的意義主要在于其結(jié)果應(yīng)易被用戶理解,其結(jié)果評(píng)估主要有兩個(gè)環(huán)節(jié)分別是模式過(guò)濾和模式表示。
數(shù)據(jù)挖掘在計(jì)算機(jī)軟件工程中的研究相當(dāng)多,它是分析數(shù)據(jù)的一種新穎方式。目前,隨著社會(huì)工作的復(fù)雜度,需要更加完善的軟件,因此對(duì)于軟件代碼的數(shù)量也在急劇增加進(jìn)而導(dǎo)致了數(shù)據(jù)量的快速增長(zhǎng)。而傳統(tǒng)的數(shù)據(jù)計(jì)算方式已經(jīng)不能滿足目前對(duì)于大量數(shù)據(jù)進(jìn)行分析的要求,所以,研究者希望能夠發(fā)掘出一種新的數(shù)據(jù)分析方式更高效的整理出有用的數(shù)據(jù)信息。軟件開(kāi)發(fā)中會(huì)積累大量的數(shù)據(jù),比如說(shuō)文本數(shù)據(jù),測(cè)試數(shù)據(jù),用戶信息數(shù)據(jù)以及用戶體驗(yàn)反饋數(shù)據(jù)等等,軟件開(kāi)發(fā)者為了開(kāi)發(fā)出更好的軟件就必須分析和整理這些數(shù)據(jù)。但是,目前軟件工程開(kāi)發(fā)的軟件越來(lái)越大,其數(shù)據(jù)越累越復(fù)雜對(duì)于數(shù)據(jù)的處理已經(jīng)超出了人工處理的能力的范疇,所以說(shuō)繼續(xù)使用傳統(tǒng)數(shù)據(jù)處理的方式來(lái)收集,整理和分析數(shù)據(jù)已經(jīng)不可能實(shí)現(xiàn)。因此,推動(dòng)了人們對(duì)于新的數(shù)據(jù)處理方式的研究,所以才提出了軟件工程數(shù)據(jù)挖掘技術(shù)。
2 軟件工程數(shù)據(jù)挖掘的應(yīng)用
隨著計(jì)算機(jī)軟件工程的發(fā)展,可以發(fā)現(xiàn)傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)具有很多的不足,存在一定的缺陷。傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)的定位系統(tǒng)不完善,定位不精確,并沒(méi)有體現(xiàn)出數(shù)據(jù)挖掘技術(shù)的高性能,它不足以滿足當(dāng)代對(duì)于數(shù)據(jù)處理的要求,因此需要對(duì)傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)進(jìn)行改進(jìn)和完善,這是我們目前的首要任務(wù)之一。為了迎合現(xiàn)代化網(wǎng)絡(luò)信息技術(shù)的快速發(fā)展,需要發(fā)掘出新的數(shù)據(jù)處理模式,就是在這樣的背景條件下,誕生了軟件工程數(shù)據(jù)挖掘技術(shù)。相比于存在很多缺陷與不足的傳統(tǒng)軟件工程而言,軟件工程數(shù)據(jù)挖掘技術(shù)更加簡(jiǎn)單、方便、高效以及精確。軟件工程數(shù)據(jù)挖掘技術(shù)并不需要特定的技術(shù)平臺(tái),體現(xiàn)了其普適性。當(dāng)前,我國(guó)已經(jīng)開(kāi)始深入的研究軟件工程數(shù)據(jù)挖掘技術(shù),但是,仍然需要更深的開(kāi)發(fā)其性能以便更好地滿足社會(huì)的需求。
3 軟件工程數(shù)據(jù)挖掘面臨的挑戰(zhàn)
軟件工程數(shù)據(jù)相比于普通數(shù)據(jù)更加復(fù)雜,所以對(duì)于軟件工程數(shù)據(jù)進(jìn)行處理具有很大的挑戰(zhàn)性。處理軟件工程的大量數(shù)據(jù)具有:軟件工程數(shù)據(jù)復(fù)雜性,軟件工程的數(shù)據(jù)處理非傳統(tǒng)以及需要嚴(yán)格精確的軟件工程數(shù)據(jù)的分析結(jié)果等三方面的困難。
3.1 對(duì)數(shù)據(jù)復(fù)雜性的分析
軟件工程數(shù)據(jù)包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。軟件工程中所產(chǎn)生的缺陷報(bào)告以及各種版本信息構(gòu)成了結(jié)構(gòu)化數(shù)據(jù)信息;而軟件工程處理過(guò)程中所產(chǎn)生的代碼信息和文本文檔信息構(gòu)成了非結(jié)構(gòu)化數(shù)據(jù)信息。由于這兩類數(shù)據(jù)包含的具體內(nèi)容不同,所以需要分別處理這兩種數(shù)據(jù),需要使用不同的算法對(duì)他們進(jìn)行處理。雖然說(shuō)需要不同方式處理這兩種數(shù)據(jù)但是并不表示這兩種數(shù)據(jù)之間沒(méi)有任何聯(lián)系,事實(shí)上,它們之間存在著重要的對(duì)應(yīng)關(guān)系。例如:代碼中存在著缺陷報(bào)告,版本信息中存在著對(duì)應(yīng)的文檔信息,由于它們之間存在著這樣的對(duì)應(yīng)關(guān)系,所以使得人們不能很好地對(duì)其進(jìn)行整體分析,這就促使了人們開(kāi)發(fā)出一種新的算法,新的數(shù)據(jù)分析技術(shù)能夠同時(shí)將結(jié)構(gòu)化信息和非結(jié)構(gòu)化信息這兩種對(duì)應(yīng)數(shù)據(jù)一起挖掘出來(lái)。
3.2 對(duì)數(shù)據(jù)處理非傳統(tǒng)的分析
分析和評(píng)估軟件工程數(shù)據(jù)挖掘出來(lái)的信息,這是數(shù)據(jù)挖掘過(guò)程的最后一步。客戶是軟件工程數(shù)據(jù)挖掘數(shù)據(jù)處理的最后宿體,軟件開(kāi)發(fā)者需要對(duì)最終挖掘出來(lái)的數(shù)據(jù)進(jìn)行轉(zhuǎn)變,格式轉(zhuǎn)變是為了滿足廣大客戶對(duì)于數(shù)據(jù)不同的要求。但是,由于需要對(duì)數(shù)據(jù)進(jìn)行格式轉(zhuǎn)變,相當(dāng)于增加了一定的工作量,那么軟件工程數(shù)據(jù)挖掘的效率則會(huì)被大大降低。對(duì)于客戶而言,他們需要的信息各種各樣并不單一,比如說(shuō)客戶可能會(huì)同時(shí)需要具體的例子和編程代碼等;或者說(shuō)需要具體例子和缺陷報(bào)告等;或者三者皆需要。由此可見(jiàn),我們?nèi)匀恍枰倪M(jìn)和完善軟件工程數(shù)據(jù)挖掘技術(shù)來(lái)提高其效率。怎樣才能做到讓客戶得到滿意的數(shù)據(jù)挖掘結(jié)果呢?那么就需要高效的數(shù)據(jù)挖掘技術(shù)將各類信息進(jìn)行歸納總結(jié),改變其格式。這樣的技術(shù),不僅僅可以滿足客戶需求而且還可以使軟件開(kāi)發(fā)者從中得到更大的利益。
3.3 對(duì)數(shù)據(jù)挖掘結(jié)果好壞的評(píng)價(jià)標(biāo)準(zhǔn)
對(duì)于傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)而言,它也有一套自己的對(duì)于數(shù)據(jù)結(jié)果處理好壞的分析標(biāo)準(zhǔn),而這個(gè)標(biāo)準(zhǔn)對(duì)于傳統(tǒng)數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)處理的分析較準(zhǔn)確。但是,在當(dāng)前的軟件工程所要處理的數(shù)據(jù)量很大,傳統(tǒng)的評(píng)價(jià)標(biāo)準(zhǔn)已經(jīng)不能滿足現(xiàn)在的數(shù)據(jù)分析要求;使用不同的數(shù)據(jù)結(jié)果評(píng)價(jià)標(biāo)準(zhǔn)來(lái)評(píng)判不同的數(shù)據(jù)挖掘結(jié)果。然而不同的評(píng)價(jià)標(biāo)準(zhǔn)之間的聯(lián)系并不緊密,因此就需要開(kāi)發(fā)者針對(duì)不同的數(shù)據(jù)類型做出不同的評(píng)價(jià)分析標(biāo)準(zhǔn)以便滿足客戶需求。想要對(duì)數(shù)據(jù)分析結(jié)果是否準(zhǔn)確,數(shù)據(jù)挖掘的信息是否合理等等這些不同的問(wèn)題進(jìn)行更加深刻的了解,就要求開(kāi)發(fā)者有獨(dú)特的見(jiàn)解,對(duì)于數(shù)據(jù)結(jié)果是否精確有一定的判斷能力。總之,獲取準(zhǔn)確的信息就是軟件工程數(shù)據(jù)挖掘的目的。所以,最后獲得的數(shù)據(jù)是否滿足要求就是評(píng)判軟件工程數(shù)據(jù)挖掘結(jié)果是否完美的標(biāo)準(zhǔn)。endprint
4 對(duì)軟件工程數(shù)據(jù)挖掘應(yīng)用進(jìn)行分析
4.1 對(duì)軟件數(shù)據(jù)挖掘技術(shù)進(jìn)行分析
在軟件開(kāi)發(fā)的過(guò)程中,數(shù)據(jù)挖掘技術(shù)包括兩個(gè)方面:(1)程序編寫(xiě);(2)程序成果。在這個(gè)過(guò)程中,程序結(jié)構(gòu)和程序功能技術(shù)的主要作用就是檢索出有效的信息。提升信息的有效性需要聯(lián)系到客戶的實(shí)際需要,同時(shí)也需要對(duì)程序編寫(xiě)過(guò)程進(jìn)行智能化培訓(xùn)。將調(diào)用、重載和多重繼承等關(guān)系家合起來(lái)進(jìn)行有效的記錄各種相關(guān)信息,重視靜態(tài)規(guī)則的同時(shí)利用遞歸測(cè)試的方式來(lái)分配工作,從而更有效的掌握關(guān)聯(lián)度之間的可信性。
4.2 做好軟件維護(hù)中的軟件工程數(shù)據(jù)挖掘工作
在軟件維護(hù)的過(guò)程中,軟件修復(fù)和軟件改善工作依賴于數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘技術(shù)在軟件缺陷以及軟件結(jié)構(gòu)等也起到了重要的作用。軟件修復(fù)即維護(hù)者通過(guò)依據(jù)缺陷分派進(jìn)行有效的評(píng)估并改善缺陷程序進(jìn)而確定修復(fù)級(jí)別或者維護(hù)者可以選擇缺陷修復(fù)方式,無(wú)論哪種方式最終目的都是進(jìn)行軟件修復(fù)來(lái)保證數(shù)據(jù)挖掘的高效性。缺陷分派即將缺陷轉(zhuǎn)化為文本類型,采取有效措施來(lái)進(jìn)行修復(fù)。但是,這樣的方式它的實(shí)際準(zhǔn)確率并不高,因而需要利用強(qiáng)化檢測(cè)來(lái)完善缺陷報(bào)告技術(shù)。
4.3 注重高性能數(shù)據(jù)挖掘技術(shù)開(kāi)發(fā)工作
數(shù)據(jù)挖掘技術(shù)體現(xiàn)在軟件開(kāi)發(fā)工作中的創(chuàng)新性不可或缺,在實(shí)際的工作過(guò)程中,目前的軟件工程數(shù)據(jù)挖掘更加重視兩個(gè)工作:(1)規(guī)則分析方式;(2)項(xiàng)目檢索工作?偠灾,想要高效快速地尋找病毒,并對(duì)其進(jìn)行全方位分析和評(píng)估得到準(zhǔn)確的病毒數(shù)據(jù)需要高性能數(shù)據(jù)挖掘技術(shù)。只有提升數(shù)據(jù)分析的可行性,提升軟件開(kāi)發(fā)安全性能,才能更好地實(shí)現(xiàn)軟件工程的良好發(fā)展。
5 總結(jié)
綜上所述,數(shù)據(jù)挖掘技術(shù)的應(yīng)用非常廣泛,比如說(shuō)分析代碼、軟件故障檢測(cè)以及軟件項(xiàng)目管理等三個(gè)方面應(yīng)用較多。值得關(guān)注的是,當(dāng)前對(duì)于數(shù)據(jù)挖掘技術(shù)的研究還不夠成熟。因此,研究者需要對(duì)軟件工程數(shù)據(jù)挖掘技術(shù)進(jìn)行深入的研究,從而能夠促進(jìn)軟件更好地開(kāi)發(fā)和管理。相信在不久的將來(lái),我們一定可以在數(shù)據(jù)挖掘方面取得非常好的優(yōu)化效果。
參考文獻(xiàn):
[1] 江義晟.軟件工程數(shù)據(jù)挖掘研究進(jìn)展[J].電子技術(shù)與軟件工程,2016(22).
[2] 胡金萍.探析軟件工程數(shù)據(jù)挖掘研究進(jìn)展[J].電腦知識(shí)與技術(shù),2017(34).
[3] 馬保平.關(guān)于對(duì)軟件工程中的數(shù)據(jù)挖掘技術(shù)的探討[J].電子技術(shù)與軟件工程,2015(19).
[4] 徐琳,王寧.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析[J].數(shù)字通信世界,2015(8).
【淺析軟件工程數(shù)據(jù)挖掘研究進(jìn)展論文】相關(guān)文章:
軟件工程數(shù)據(jù)挖掘進(jìn)展分析論文04-27
數(shù)據(jù)挖掘論文04-29
軟件工程數(shù)據(jù)挖掘開(kāi)發(fā)測(cè)試技術(shù)論文04-27
數(shù)據(jù)挖掘技術(shù)在軟件工程的運(yùn)用工程論文04-27
淺析水利工程管理中數(shù)據(jù)挖掘技術(shù)應(yīng)用論文05-02
數(shù)據(jù)挖掘技術(shù)的研究論文05-02
物聯(lián)網(wǎng)數(shù)據(jù)挖掘研究論文05-02
數(shù)據(jù)挖掘04-29