真人一对一直播,chinese极品人妻videos,青草社区,亚洲影院丰满少妇中文字幕无码

0
首頁 精品范文 遺傳學條件概率

遺傳學條件概率

時間:2023-11-30 11:23:11

開篇:寫作不僅是一種記錄,更是一種創造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇遺傳學條件概率,希望這些內容能成為您創作過程中的良師益友,陪伴您不斷探索和進步。

第1篇

關鍵詞:數據挖掘;圖書館;數字圖書館

中圖分類號:G250 文獻標志碼:A 文章編號:1673-291X(2012)27-0241-03

數據挖掘技術是信息世界發展所得的一種新興事務,應用領域越來越廣。從早期的商業應用,發展到科學研究、金融行業、教育教學等多個領域。并且有了許多成功的應用:在科學實驗中,有專家應用決策樹和基于規則的方法發現了新的類星體;在零售行業,貨籃分析幫助商店確定貨架布局以促進銷售;在金融領域,孤立點的發現用以預測和預防可疑信用卡交易、惡意透支等;在銷售行業,用來提高銷售的成功率;在制造業,用來控制產品生產,降低次品率。

一、數據挖掘的定義

數據挖掘技術是一門交叉學科,涉及數據庫、統計學、人工智能和機器學習等多個領域?!皵祿诰颉备拍钭钤缡怯蒛sama Fayaad 1995年提出的。因為數據挖掘技術所涉及的領域比較廣,所以現在還不能有一個能包括所有領域的全面的定義。但是比較完整的定義要算是從技術方面給其定義的。數據挖掘的技術定義是這樣描述的:數據挖掘(Data Mining)又稱數據庫中的知識發現(Knowledge Discovery in Database,KDD),就是從大量數據中獲取有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過程,簡單地說,數據挖掘就是從大量數據中提取或“挖掘”知識。

這里要說明的是,數據挖掘的目的并不僅僅是在數據庫中查找記錄。它跟信息檢索的任務是有區別的。數據挖掘和信息檢索的相同點是從數據抽取數據和信息。不同之處在于數據挖掘尋找現象之間事先未知的關系和關聯。也就是說在數據挖掘任務進行之前我們是沒法兒預測結果的。信息檢索是帶有一定目的、用戶預先可以感知至少是可以在腦海中想象一個抽象的結果的而檢索的結果也不會與用戶事先想象的結果有很大差別。信息檢索是需要用戶明確地提出查詢要求。通俗地來講是信息檢索的目的是幫助用戶從大量的文件中查找到其想要的文檔而數據挖掘是為了揭示文件中所隱藏的知識。這兩個是相輔相成的。我們可以使用數據挖掘研究出來的結果來提高信息檢索的精確度提高檢索結果的“親近性”,從而使信息檢索系統有更高的境界。

二、數據挖掘中的幾種重要算法

(一)關聯規則算法

關聯規則數據挖掘是幫助發現大量數據庫中項集之間的關聯關系。目前這項技術已成為數據挖掘中最成熟、最重要、最活躍的研究內容。這種算法已發展到如教育、科研、醫學等各大領域。

1.關聯規則算法的定義

設I={i1,i2…,im}為所有項目的集合,設A是一個由項目構成的集合,稱為項集。事務T是一個項目子集,每一個事務具有唯一的事務標識Tid。事務T包含項集A,當且僅當AT。如果項集A中包含k個項目,則稱其為k項集。D為事務數據庫,項集A在事務數據庫D中出現的次數占D中總事務的百分比叫做項集的支持度。如果項集的支持度超過用戶給定的最小支持度閾值,就稱該項集是頻繁項集。

關聯規則就是形如XY的邏輯蘊涵關系,其中XI,YI且XY=Φ,X稱作規則的前件,Y是結果,對于關聯規則XY,存在支持度和信任度。

支持度是指規則中所出現模式的頻率,如果事務數據庫有s%的事務包含XY,則稱關聯規則XY在D中的支持度為s%,實際上,可以表示為概率P(XY),即support(XY)=

P(XY)。信任度是指蘊涵的強度,即事務D中c%的包含X的交易同時包含XY。若X的支持度是support(x),規則的信任度為即為:support(XY)/support(X),這是一個條件概率

P(Y|X),即confidence(XY)= P(Y|X)。

2.關聯規則分類

關聯規則有很多的分類方法,基于規則中處理的變量的類別,可以分為布爾型和數值型關聯規則?;谝巹t中抽象層次,可以分為單層和多層關聯規則。基于規則中涉及的數據維數,可以分為單維和多維關聯規則。還有時態、加權、多支持度、負關聯和混合關聯規則等。

在圖書館數據挖掘應用中,可以使用關聯規則算法對圖書館中讀者借閱數據進行挖掘,挖掘出具有置信度和支持度的關聯規則從而快速挖掘出讀者借閱數據中的關聯關系,最終可以達到發現學科間的隱性關聯這樣一個目的。

(二)遺傳算法

遺傳算法是模擬達爾文的遺傳選擇和自然淘汰的生物進化過程的計算模型。當前,遺傳算法已表現出良好的應用前景,遺傳算法的兩個主要特點是群體搜索策略和群體中個體之間的信息交換,它實際上是模擬由個體組成群體的整體學習過程,其中每個個體都是給定問題搜索空間的一個解點。

主站蜘蛛池模板: 张掖市| 安义县| 宁安市| 松江区| 呼和浩特市| 宜川县| 永修县| 博湖县| 南川市| 扎鲁特旗| 张家界市| 临澧县| 察雅县| 昌乐县| 滕州市| 贵定县| 日照市| 西城区| 青田县| 榕江县| 桦甸市| 兴山县| 油尖旺区| 西乌珠穆沁旗| 即墨市| 乡城县| 江西省| 缙云县| 乌兰浩特市| 迁安市| 鲜城| 渭源县| 班玛县| 广昌县| 静安区| 乐清市| 云林县| 阿尔山市| 清丰县| 达州市| 清徐县|