詞條
詞條說明
隨著計算機技術的革新,互聯網新媒體的快速發展,人們的生活已經進入高速信息時代。我們每天的生活都要產生大量數據,因此我們獲取數據的速度和規模不斷增長,大量數據不斷的被存入存儲介質中形成海量數據。海量數據的存儲、應用及挖掘已成為人們急需解決的難題。 數據挖掘是一門新興的學科,它誕生于20世紀80年代,主要面向商業應用的人工只能研究領域。大數據是無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的
在信息化高度發達的今天,互聯網已經成為人們獲取信息,即時溝通的重要媒介之一,給人們工作生活帶來了很大的便利。但是由于其**性、開放性、即時性的特點,互聯網也成為眾多信息傳播的重要途徑,與傳統媒體相比較為棘手。如何對互聯網進行有效的管理,過濾其中的不良信息,凈化網絡環境成為苛待解決的問題。 目前網絡中70%的信息是以文本形式存在,網頁文本過濾成為目前網絡監控的較重要手段。文本過濾方法有很多,關鍵字
隨著Internet上文檔信息的迅猛發展,文本挖掘成為處理和組織大量文檔數據的關鍵技術。存儲信息使用較多的是文本,所以文本挖掘被認為比數據挖掘具有較高的商業潛力. 當數據挖掘的對象完全由文本這種數據類型組成時,這個過程就稱為文本數據挖掘. 事實上,較近研究表明公司信息有80 %包含在文本文檔中。 數據挖掘(Data Mining),就是從存放在數據庫,數據倉庫或其他信息庫中的大量的數據中獲取有效
近年來,隨著Internet?的迅猛發展以及人們利用信息技術生產和搜集數據能力的大幅度提高,大規模的網絡文本庫不斷涌現。為了便于在海量文本庫中搜尋、過濾、管理這些文本,基于人工智能技術的文本大數據挖掘成為人們研究的焦點。 數據挖掘(KD)是從數據中自動抽取模型。數據挖掘包括許多步驟:從大規模數據庫中(或從其他來源)**數據;選擇合適的特征屬性;挑選合適的樣本策略;剔除數據中不正常的數據并補足不夠
公司名: 靈玖中科軟件(北京)有限公司
聯系人: 張寶
電 話: 010-62648216
手 機: 13681251543
微 信: 13681251543
地 址: 北京海淀北京市海淀區蘇州街49-3號盈智大廈5層
郵 編: