數(shù)據(jù)挖掘考研怎么準備?其實從數(shù)據(jù)挖掘的起源可以發(fā)現(xiàn),它并不是一門嶄新的科學(xué),而是綜合了統(tǒng)計分析、機器學(xué)習、人工智能、數(shù)據(jù)庫等諸多方面的研究成果而成,同時與專家系統(tǒng)、知識管理等研究方向不同的是,數(shù)據(jù)挖掘更側(cè)重于應(yīng)用的層面。
因此來說,數(shù)據(jù)挖掘融合了相當多的內(nèi)容,試圖全面了解所有的細節(jié)會花費很長的時間。因此我建議你的第一步是用大概三個月的時間了解數(shù)據(jù)挖掘的幾個常用技術(shù):分類、聚類、預(yù)測、關(guān)聯(lián)分析、孤立點分析等等。這種了解是比較粗的,目標是明白這些技術(shù)是用來干什么的,典型的算法大致是怎樣的,以及在什么情況下應(yīng)該選用什么樣的技術(shù)和算法。
經(jīng)過初步了解之后,就要進入選題的階段,選擇自己感興趣的某個具體方向,然后通讀該方向的經(jīng)典論文(綜述、主要發(fā)展方向、應(yīng)用成果)。選題階段可能會花費較長的時間,比如一年。此時,要逐漸明確突破點,也就是將來你論文的創(chuàng)新點。創(chuàng)新對于研究來說非常重要,一方面該創(chuàng)新的確比原來的方法要好,另一方面該創(chuàng)新的確具有實用的價值。
隨后,就要來實現(xiàn)自己的想法。通常對于碩士論文來說,需要建立原型系統(tǒng),進行試驗,并用試驗結(jié)果來支持自己的論文主題。原型系統(tǒng)就是對自己創(chuàng)新點的實現(xiàn),需要很好地設(shè)計和開發(fā)。需要注意的是,原型系統(tǒng)的建立和開發(fā)商用系統(tǒng)不同,需要體現(xiàn)比較好的理論基礎(chǔ)。也就是說,原型系統(tǒng)并不是簡單地用于實現(xiàn)功能,而是將你的一整套理論付諸實現(xiàn)。這種理論基礎(chǔ)也將會包含在你的論文中,以體現(xiàn)論文的理論高度。
原型系統(tǒng)的搭建以及產(chǎn)生令人信服試驗結(jié)果,這個過程一般需要至少一年的時間。所以要集中精力于核心部分(體現(xiàn)論文創(chuàng)新點的部分),外圍的界面等等不應(yīng)投入太多的精力,以免進度失控。
最后是論文的整理和寫作了。建議你在之前的階段中逐步先寫出一些篇幅較短的論文(用于發(fā)在期刊、會議上),比如綜述、體系框架、算法內(nèi)核、應(yīng)用等等。這樣在最后寫畢業(yè)論文時就有了足夠多的內(nèi)容,會寫得更好更快一些。
以上只是泛泛而談。其實我覺得其中的關(guān)鍵點在于選題,而選題的好壞取決于你對數(shù)據(jù)挖掘研究現(xiàn)狀的了解、你的興趣和專長、以及該方向在應(yīng)用上的意義。建議你和導(dǎo)師、同行多交流,能夠讓自己的方向更清晰。
至于數(shù)據(jù)挖掘領(lǐng)域的就業(yè),應(yīng)該來說還是前景不錯的。如果你對研究有興趣,象微軟研究院、Google、高校研究所都是不錯的地方;如果你對實際應(yīng)用有興趣,很多大的公司包括IBM、Accenture、亞信等等都有相應(yīng)的人力需求,當然一些甲方的單位比如證券、保險、金融等等單位也都需要分析人才。
以上就是【數(shù)據(jù)挖掘考研】的全部解答,如果你想要學(xué)習【考研專業(yè)】更多這方面的知識,歡迎大家前往高頓考研考試頻道!