所屬欄目:高等教育論文 發(fā)布日期:2011-01-20 17:13 熱度:
摘要:隨著手機(jī)的多樣化發(fā)展以及在人群中迅速普及,使手機(jī)領(lǐng)域知識(shí)涉及到的學(xué)科知識(shí)多、知識(shí)量大,如何使這些知識(shí)共享和重用,目前仍是一個(gè)重大的挑戰(zhàn),通過(guò)構(gòu)建手機(jī)領(lǐng)域本體庫(kù)來(lái)解決這一問(wèn)題。本文首先給出領(lǐng)域(移動(dòng)電話)知識(shí)獲取及管理的需求分析,然后分析了現(xiàn)有的本體構(gòu)建方法體系及工具,最后通過(guò)屬性獲取算法得到一個(gè)上下位關(guān)系的概念體系。手機(jī)領(lǐng)域知識(shí)庫(kù)的構(gòu)建不僅提高手機(jī)領(lǐng)域的廣大參與者對(duì)手機(jī)領(lǐng)域知識(shí)獲取的效率和可靠性,而且也為本體知識(shí)在實(shí)踐領(lǐng)域的應(yīng)用奠定堅(jiān)實(shí)的基礎(chǔ)。
關(guān)鍵詞:本體,知識(shí)庫(kù),手機(jī),檢索
1.引言
手機(jī)作為一種科技產(chǎn)品它有著更新?lián)Q代快的特點(diǎn),導(dǎo)致形形色色的手機(jī)種類(lèi)越來(lái)越多,也就是手機(jī)領(lǐng)域知識(shí)量不斷擴(kuò)大,這給手機(jī)設(shè)計(jì)者和維修者帶來(lái)了一定困難,也給手機(jī)購(gòu)買(mǎi)者在這樣龐大的手機(jī)種類(lèi)當(dāng)中難以選擇。同時(shí)現(xiàn)有網(wǎng)絡(luò)上有很多介紹手機(jī)參數(shù)的網(wǎng)站,但有的只籠統(tǒng)的簡(jiǎn)單介紹手機(jī)的部分屬性,有的對(duì)手機(jī)的功能分類(lèi)十分粗糙,有的對(duì)手機(jī)同一屬性卻冠以不同的名稱(chēng),知識(shí)的管理缺乏科學(xué)性。
為了解決這一系列困難,我們必須構(gòu)建手機(jī)領(lǐng)域本體庫(kù)使這些知識(shí)共享和重用,給手機(jī)設(shè)計(jì)者和維修者提供工業(yè)設(shè)計(jì)的全面知識(shí),提高他們的工作效率,也使手機(jī)購(gòu)買(mǎi)者能夠在該本體庫(kù)的導(dǎo)購(gòu)基礎(chǔ)上僅需最短時(shí)間就可選擇一款合心意的手機(jī),同時(shí)也可作為各大手機(jī)門(mén)戶網(wǎng)站的有力支撐。本體庫(kù)的構(gòu)建本身也是語(yǔ)義WEB的重要基礎(chǔ)和必要組成部分,基于手機(jī)領(lǐng)域本體庫(kù)的共享和重用的特點(diǎn),其他研究者也可以使用筆者創(chuàng)建好的本體庫(kù)進(jìn)行研究。
2.相關(guān)工作
2.1.構(gòu)建本體的方法體系
當(dāng)前典型的本體構(gòu)建方法都是從具體的本體構(gòu)建項(xiàng)目中總結(jié)經(jīng)驗(yàn)而獲得的。盡管在實(shí)際應(yīng)用階段已經(jīng)利用了本體,但是本體的構(gòu)建并沒(méi)有固定的模式。最早出現(xiàn)的是1995年根據(jù)企業(yè)本體(EnterpriseOntology)和TOVE本體的開(kāi)發(fā)過(guò)程獲得的經(jīng)驗(yàn)總結(jié),此后,陸續(xù)出現(xiàn)了一些新的本體構(gòu)建方法。下面介紹的本體構(gòu)建方法已經(jīng)得到大家認(rèn)可的經(jīng)典方法。
骨架法[1],也稱(chēng)為EO工程法,是Uschold和King在1995年開(kāi)發(fā)EO(EnterpriseOntology,關(guān)于企業(yè)建模過(guò)程的本體,是相關(guān)商業(yè)企業(yè)間術(shù)語(yǔ)和定義的集合)中的經(jīng)驗(yàn)總結(jié),它提出了一種本體開(kāi)發(fā)的具體步驟,其基本流程如圖1所示:
圖1骨架法(EO工程法)的本體構(gòu)建基本流程
TOVE法[2],是Grüninger和Fox等開(kāi)發(fā)TOVE工程本體的經(jīng)驗(yàn)總結(jié)。這種方法先建立本體的非形式化描述說(shuō)明,然后將這種描述形式化。Meth方法[3]由馬德里技術(shù)大學(xué)(PolytechnicUniversityofMadrid,UPM)工藝分校開(kāi)發(fā)人工智能圖書(shū)館使用。采用Meth方法開(kāi)發(fā)的本體有(Onto)Agent[4]:基于本體的WWW代理,關(guān)于本體使用參考本體作為知識(shí)源進(jìn)行一定約束條件的重新知識(shí)獲取。該方法[5]是斯坦福大學(xué)醫(yī)學(xué)院提出的基于Protégé本體構(gòu)建工具的一種領(lǐng)域本體構(gòu)建方法。
其他的本體方法體系還包括KACTUS工程法[6]、IDEF5法[7]、AFM法(Activity-FirstMethod)[8]等。
2.2.構(gòu)建本體的常用開(kāi)發(fā)工具
OntoEdit[9]是基于On-To-Knowledge項(xiàng)目(該項(xiàng)目起源于KADS工程)的本體構(gòu)建方法。在本體精煉階段則需要開(kāi)發(fā)者使用編輯器精煉本體結(jié)構(gòu)和概念及關(guān)系的定義。OntoEdit以F-Logic作為其推理引擎,用于在本體精煉和評(píng)價(jià)階段處理公理。
WebODE[10]是西班牙馬德里技術(shù)大學(xué)開(kāi)發(fā)的一個(gè)綜合性的本體建模工具,它集成了本體開(kāi)發(fā)過(guò)程中的大多數(shù)行為,支持METHONTOLOGY本體構(gòu)建方法論。KAON[11]是德國(guó)Karlsruhe大學(xué)編制的一套用于語(yǔ)義網(wǎng)和本體研究的工具,包含各種模塊用于本體的構(gòu)建、存儲(chǔ)、檢索、維護(hù)以及應(yīng)用,它是當(dāng)前比較好的本體構(gòu)建和維護(hù)工具之一。
Protégé[12]是斯坦福大學(xué)為知識(shí)獲取而開(kāi)發(fā)的一個(gè)工具,主要應(yīng)用于知識(shí)的獲取以及現(xiàn)存本體合并和排列,可以免費(fèi)下載并公開(kāi)源代碼,再加上其支持中文,Protégé已經(jīng)成為目前國(guó)內(nèi)使用最為廣泛的本體編輯工具和基于知識(shí)的框架。
3面向手機(jī)網(wǎng)站的知識(shí)獲取
分析網(wǎng)站的結(jié)構(gòu),網(wǎng)站中需要的信息都是在一個(gè)表格中,因此在提取時(shí),根據(jù)關(guān)鍵字可以提取出信息。關(guān)鍵字為:手機(jī)類(lèi)型、操作系統(tǒng)、上市日期、硬件系統(tǒng)、基本配置、屏幕、網(wǎng)絡(luò)頻率、外觀設(shè)計(jì)、產(chǎn)品尺寸、產(chǎn)品天線、視頻播放、音樂(lè)播放、攝像功能描述、攝像頭、藍(lán)牙功能、數(shù)據(jù)線接口、內(nèi)容容量、Wi-Fi功能、情景模式、待機(jī)圖片、鬧鐘功能、日歷功能、計(jì)算器、無(wú)線數(shù)據(jù)、日程表、其它功能。
針對(duì)專(zhuān)業(yè)手機(jī)網(wǎng)站,網(wǎng)頁(yè)的標(biāo)題也是手機(jī)的型號(hào),從這里可以提取到根,而下面的屬性是它的孩子,屬性的值又可以作為屬性的孩子,因此一個(gè)頁(yè)面就可以形成一棵樹(shù)。每一顆樹(shù)代表了一個(gè)一個(gè)手機(jī)也是一個(gè)頁(yè)面。而這棵樹(shù)的形式可以用這樣的二元關(guān)系來(lái)表示,(手機(jī)類(lèi)型、只能)(手機(jī)類(lèi)型、音樂(lè)手機(jī))(無(wú)線數(shù)據(jù),GPRS)(無(wú)線數(shù)據(jù),EDGE)(產(chǎn)品尺寸,59*108*12毫米)(外觀設(shè)計(jì),直板)。
為了實(shí)現(xiàn)這個(gè)功能,只要把獲得的文本信息與關(guān)鍵字匹配,再將緊隨其后的字符作為它的值就可以實(shí)現(xiàn)。其流程如下:將文本中的字符串按照空格分割為多個(gè)字符串,將這些字符串與關(guān)鍵字匹配,如果匹配成功,則將后面緊跟隨的字符串保存到achieve.txt文檔中。其中關(guān)鍵字的選擇有賴(lài)于網(wǎng)頁(yè)文本,例如上面的例子,其中的關(guān)鍵字有:手機(jī)類(lèi)型、操作系統(tǒng)、上市日期、硬件系統(tǒng)、基本配置、屏幕、主屏尺寸、屏幕材質(zhì)、主屏參數(shù)、手機(jī)制式、支持頻段、外觀設(shè)計(jì)、產(chǎn)品尺寸、產(chǎn)品天線、視頻播放、音樂(lè)播放、攝像頭、攝像頭、拍照功能描述、攝像頭像素、數(shù)據(jù)功能、藍(lán)牙功能、數(shù)據(jù)線接口、內(nèi)存容量、情景模式、待機(jī)圖片、鬧鐘功能、日歷功能、計(jì)算器、無(wú)線數(shù)據(jù)等,這些關(guān)鍵字可由程序讀入或刪除并以一定的格式保存在key.txt文檔中。當(dāng)匹配完成時(shí),能夠?qū)崿F(xiàn)將二元組輸出。
屬性關(guān)系的表達(dá)
針對(duì)大量的Web頁(yè)面,提取所需文本信息。采用字符串處理方式提取包含“是一種”和“是一類(lèi)”特征詞的上下位概念。提取出的文本特定信息存儲(chǔ)在一起,完成文本特定信息的提取過(guò)程。從提取出的特定信息中,得到用戶感興趣的特定文本,最終用于表達(dá)屬性的上下位關(guān)系。
以手機(jī)屬性為例,在網(wǎng)絡(luò)上下載大量的有關(guān)手機(jī)的Web頁(yè)面,然后分析網(wǎng)頁(yè)上文本的上下位關(guān)系,提取出“是一個(gè)”和“是一種”的特征詞的句子。
1、摩托羅拉L7是一種于2005年12月上市的手機(jī)。
在上面的一段文本中,手機(jī)屬性是上位概念,摩托羅拉、L7、2005年12月是下位概念。
2、XX手機(jī)是一種有拍照、音樂(lè)播放、視頻播放、游戲這些娛樂(lè)功能,支持藍(lán)牙、數(shù)據(jù)接口的數(shù)據(jù)功能。
在上面的一段文本中,手機(jī)屬性是上位概念,娛樂(lè)功能、數(shù)據(jù)功能是下位概念,而拍照、音樂(lè)播放、視頻播放、游戲是娛樂(lè)功能的下位概念;藍(lán)牙、數(shù)據(jù)接口是數(shù)據(jù)功能的下位概念,如圖2所示。
圖2:手機(jī)屬性上下位關(guān)系圖
3、作為一款全能型的商務(wù)機(jī)型,網(wǎng)絡(luò)配置也是不可或缺的一部分,所以其在無(wú)線網(wǎng)絡(luò)功能方面表現(xiàn)的也應(yīng)當(dāng)是非常出色的,除了可以提供高速下載速率的PHS網(wǎng)絡(luò)之外,該機(jī)還支持WLAN(IEEE802.11b/g)無(wú)線局域網(wǎng)功能,并且在支持藍(lán)牙V2.0的基礎(chǔ)上還提供了對(duì)IrSS高速紅外功能的支持。此外,該機(jī)這次還內(nèi)置Gmail及Yahoo郵箱,支持Flash3.0播放,同時(shí)裝載的全能瀏覽器可以在使用OperaMobile9.5和InternetExplorer網(wǎng)頁(yè)時(shí)可實(shí)現(xiàn)上下卷動(dòng)及觸摸變焦功能。
在上面一段文本中,網(wǎng)絡(luò)配置是上位的關(guān)系,提供高速下載速率的PHS網(wǎng)絡(luò)、WLAN(IEEE802.11b/g)無(wú)線局域網(wǎng)、藍(lán)牙V2.0、IrSS高速紅外功能、內(nèi)置Gmail及Yahoo郵箱、裝載的全能瀏覽器是下位的關(guān)系,如圖3所示。
圖3:網(wǎng)絡(luò)配置上下位關(guān)系圖 圖4:手機(jī)屬性上下位關(guān)系圖
4、這款夏普WS020SH在其它娛樂(lè)功能的配置上卻變成了"非主流",尤其是在攝像頭的配置上,在現(xiàn)在這個(gè)500萬(wàn)像素滿天飛的時(shí)代,這款產(chǎn)品依然配備了一枚200萬(wàn)像素的攝像頭,雖然支持自動(dòng)對(duì)焦,但像素?cái)?shù)決定了這款手機(jī)的成像質(zhì)量。而為商務(wù)人士量身定制的功能有QC編碼和名片識(shí)別功能,支持ExcelMobile、OneNoteMobile、PowerPointMobile、WordMobile、WindowsMediaPlayer10Mobile等等等等,可以說(shuō)是一應(yīng)俱全了。
在上面一段文本中,娛樂(lè)功能是上位關(guān)系,200萬(wàn)像素的攝像頭、QC編碼、名片識(shí)別是下位關(guān)系。
5、夏普WS020SH的尺寸為50×116×17.9毫米,重135克。在配備標(biāo)準(zhǔn)電池的情況下,手機(jī)可獲得420小時(shí)的待機(jī)時(shí)間和6小時(shí)的連續(xù)通話時(shí)間。除此之外其為用戶提供黑×金、黑×螢光綠、黑×桃紅等三種機(jī)身色彩選擇,并預(yù)計(jì)于6月上市,建議空機(jī)零售價(jià)格為63120日元,約合人民幣4288元左右。假如夏普把WS020SH改一下網(wǎng)絡(luò)制式,讓它兼容WCDMA/GSM,并且把攝像頭索性弄到500萬(wàn)像素再拿到全球市場(chǎng)上去賣(mài),不知道索尼愛(ài)立信的X1屆時(shí)會(huì)怎么樣?
手機(jī)屬性是上位關(guān)系,尺寸、重量、色彩、待機(jī)時(shí)間和通話時(shí)間、售價(jià)是下位關(guān)系。等等許多的例子提取出許多的上下位關(guān)系如圖4所示。
根據(jù)算法的實(shí)驗(yàn),整合提取的大量信息,合理的處理上下位關(guān)系圖,得到一張手機(jī)參數(shù)的上下位關(guān)系圖。
圖5:手機(jī)各種屬性上下位關(guān)系總結(jié)圖
從表上可以看出手機(jī)的各種上下位關(guān)系可以整合在一起。得到最終的上下位關(guān)系圖:手機(jī)屬性是上位,則型號(hào)、廠商、價(jià)格等等就是下位;娛樂(lè)功能是上位,則拍照、音樂(lè)、網(wǎng)絡(luò)功能則是下位;網(wǎng)絡(luò)功能是上位,則郵件、瀏覽器、WLAN功能等就是下位。
4結(jié)束語(yǔ)
本文從手機(jī)知識(shí)領(lǐng)域擁有涉及手機(jī)種類(lèi)繁多、知識(shí)量大的特點(diǎn)的角度出發(fā),探討了手機(jī)制造者、使用者、維修者對(duì)于手機(jī)領(lǐng)域知識(shí)的高效可靠提取的需求,提出了需要通過(guò)本體方法論構(gòu)建可重用和可共享的手機(jī)知識(shí)庫(kù)來(lái)滿足他們的要求。同時(shí),給出了一種手機(jī)領(lǐng)域知識(shí)的上下位關(guān)系獲取與表示方法。
然而由于不同本體構(gòu)建者所表示的本體知識(shí)庫(kù)只是分散的或異質(zhì)的,為了使不同構(gòu)建者對(duì)于相同領(lǐng)域能夠表示成正確的統(tǒng)一的全面的知識(shí)庫(kù),需要做本體推理和本體集成等方面的工作,本體映射作為本體集成的基礎(chǔ),這些都是今后的進(jìn)一步研究方向。 期刊論文
文章標(biāo)題:一種領(lǐng)域知識(shí)獲取與管理方法
轉(zhuǎn)載請(qǐng)注明來(lái)自:http://m.optiwork.cn/fblw/jiaoyu/gaodeng/6562.html
攝影藝術(shù)領(lǐng)域AHCI期刊推薦《Phot...關(guān)注:106
Nature旗下多學(xué)科子刊Nature Com...關(guān)注:152
中小學(xué)教師值得了解,這些教育學(xué)...關(guān)注:47
2025年寫(xiě)管理學(xué)論文可以用的19個(gè)...關(guān)注:192
測(cè)繪領(lǐng)域科技核心期刊選擇 輕松拿...關(guān)注:64
及時(shí)開(kāi)論文檢索證明很重要關(guān)注:52
中國(guó)水產(chǎn)科學(xué)期刊是核心期刊嗎關(guān)注:54
國(guó)際出書(shū)需要了解的問(wèn)題解答關(guān)注:58
合著出書(shū)能否評(píng)職稱(chēng)?關(guān)注:48
電信學(xué)有哪些可投稿的SCI期刊,值...關(guān)注:66
通信工程行業(yè)論文選題關(guān)注:73
SCIE、ESCI、SSCI和AHCI期刊目錄...關(guān)注:121
評(píng)職稱(chēng)發(fā)論文好還是出書(shū)好關(guān)注:68
復(fù)印報(bào)刊資料重要轉(zhuǎn)載來(lái)源期刊(...關(guān)注:51
英文期刊審稿常見(jiàn)的論文狀態(tài)及其...關(guān)注:69
Web of Science 核心合集期刊評(píng)估...關(guān)注:59
教育論文范文
教育技術(shù)論文 特殊教育論文 影視教育論文 藝術(shù)教育論文 體育科學(xué)教育論文 人文教育論文 成人教育論文 職業(yè)教育論文 教育學(xué)論文 學(xué)前教育論文 小學(xué)教育論文 中學(xué)教育論文 初等教育論文 高等教育論文 天文學(xué)論文 數(shù)學(xué)論文 物理論文 化學(xué)論文
SCI期刊分析
copyright © m.optiwork.cn, All Rights Reserved
搜論文知識(shí)網(wǎng) 冀ICP備15021333號(hào)-3