少妇午夜啪爽嗷嗷叫视频-久久精品欧美伊人婷婷1024-泰国大鸡吧猛操日日本大骚逼-国产精品高清一区二区不卡-熟女少妇一区二区三区四区-中文字幕午夜人妻久久一区-天美传媒麻豆蜜桃飘香-国产做a爰片久久毛片95-欧美亚洲另类在线日韩国产

思億歐觀點(diǎn)

什么是Web數(shù)據(jù)挖掘

發(fā)布時(shí)間:2009-07-30

Web挖掘的目標(biāo)是從Web的超鏈接結(jié)構(gòu)、網(wǎng)頁(yè)內(nèi)容和使用日志中探尋有用的信息。

Web挖掘的目標(biāo)是從Web的超鏈接結(jié)構(gòu)、網(wǎng)頁(yè)內(nèi)容和使用日志中探尋有用的信息。雖然Web挖掘使用了許多數(shù)據(jù)挖掘技術(shù),但它并不僅僅是傳統(tǒng)數(shù)據(jù)挖掘的一個(gè)簡(jiǎn)單應(yīng)用。在過(guò)去20年中,許多新的挖掘任務(wù)和算法被相繼發(fā)明。依據(jù)在挖掘過(guò)程中使用的數(shù)據(jù)類別,Web挖掘任務(wù)可以被劃分為三種主要類型:Web結(jié)構(gòu)挖掘、Web內(nèi)容挖掘和Web使用挖掘。

·Web結(jié)構(gòu)挖掘:Web結(jié)構(gòu)挖掘從表征Web結(jié)構(gòu)的超鏈接(簡(jiǎn)稱鏈接)中尋找有用的知識(shí)。例如:從這些鏈接中,我們可以找出哪些是重要的網(wǎng)頁(yè),這是一項(xiàng)搜索引擎采用的重要技術(shù)。我們也可以發(fā)掘具有共同興趣的用戶社區(qū)。這些任務(wù)在傳統(tǒng)的數(shù)據(jù)挖掘中并不存在,因?yàn)樵陉P(guān)系型表格中并沒(méi)有鏈接結(jié)構(gòu)。

·Web內(nèi)容挖掘:Web內(nèi)容挖掘從網(wǎng)頁(yè)內(nèi)容中抽取有用的信息和知識(shí)。例如:根據(jù)網(wǎng)頁(yè)的主題,我們可以進(jìn)行自動(dòng)的聚類和分類。雖然這些任務(wù)與傳統(tǒng)數(shù)據(jù)挖掘的任務(wù)相似,但是我們依然可以為了各種不同的目的從網(wǎng)頁(yè)中根據(jù)模式抽取有用的信息,例如商品描述、論壇回帖等。而這些信息可以被用作進(jìn)一步分析來(lái)挖掘用戶態(tài)度。這些任務(wù)也不是傳統(tǒng)的數(shù)據(jù)挖掘任務(wù)。

·Web使用挖掘:Web使用挖掘從記錄每位用戶點(diǎn)擊情況的使用日志中挖掘用戶的訪問(wèn)模式。這項(xiàng)任務(wù)也使用了許多數(shù)據(jù)挖掘的算法。其中一項(xiàng)重要的議題是點(diǎn)擊流數(shù)據(jù)的預(yù)處理,以便生成可以用來(lái)挖掘的合適數(shù)據(jù)。

搜索引擎優(yōu)化研究是與WEB數(shù)據(jù)挖掘比較相關(guān)的一門技術(shù),因?yàn)榇蟛糠值乃阉饕婀こ處熢谒伎既绾卧O(shè)計(jì)搜索引擎的時(shí)候,同時(shí)也會(huì)注重或者很大一部分是要解決搜索結(jié)果排序公正的問(wèn)題。

分享至share
  • pin
  • weibo
  • wechat
email

tel 24小時(shí)免費(fèi)服務(wù)咨詢熱線:400-080-3010

立即咨詢立即咨詢 聯(lián)系我們聯(lián)系我們