電話:13691762133
手機(jī):13691762133
郵件:andy@ownlikes.cn
QQ:317779813
地址:深圳市龍華新區(qū)觀瀾大道35號1棟3樓
網(wǎng)址 : greezubamboo.cn
RFID數(shù)據(jù)管理基于語義的匹配
基于語義的對象發(fā)現(xiàn)是建立在描述邏輯(Description Logic, DL)的基礎(chǔ)上的。DL支持OWL語言的語義。此外, OWL-DL語法和 DIG(Description Logic Imple-mentation Group, 描述邏輯實現(xiàn)小組)之間存在嚴(yán)格的對應(yīng)關(guān)系, 其中 DIG為基于HTTP接口的開發(fā)者。特別是, 當(dāng)面向?qū)崿F(xiàn)問題時, DIG 2. 0 公式表達(dá)請求和資源描述, 因其簡潔、緊湊, 為移動Ad Hoc應(yīng)用程序所必需。總之, 采用 DL語法可增強(qiáng)語法的可讀性。
DL 為一簇知識表示語言, 以邏輯形式化的方法表示特定應(yīng)用領(lǐng)域的知識。其基本語法元素包括概念名、角色名以及個體名。其中, 概念解釋為該領(lǐng)域內(nèi)目標(biāo)對象的集合; 角色則為不同概念子集內(nèi)目標(biāo)對象的屬性; 而個體則用于概念中特殊命名的元素。正式場合下, 概念被解釋為解析8領(lǐng)域的子集, 關(guān)系則理解為Δx4子集的一種二元關(guān)系。
DL公式通過每個構(gòu)造定義解析函數(shù)1給出了語義的含義。例如, 如果A和D為兩個一般的概念, 則AND為集合的交集, 即(AND)'=A'nD', 當(dāng)存在其他的布爾連接符U和-時, 就會給出合集與補集的慣用理論集的注釋。概念可用于包含斷言0≤D和定義0=D, 根據(jù)為特定域引發(fā)的知識, 便可對可能的注釋施以約束。DL理論(又名 TBox 或者本體論)基本上是一系列的包含斷言和定義。TBox 的模型T是對該模型中滿足所有包含關(guān)系和定義的解釋說明。許多其他結(jié)構(gòu)符的定義也有助于提高DL的表達(dá)能力。但是, 這樣通常會增加推理服務(wù)的計算復(fù)雜度。因此, 推理服務(wù)的計算復(fù)雜度與 DL 表達(dá)能力之間的權(quán)衡非常重要的。
語義網(wǎng)的核心思想是基于XML, 如RDF、RDFS和OWL, 用標(biāo)記語言注釋信息。RDF、RDFS和OWL等語言已經(jīng)為機(jī)器可理解的語言, 通過創(chuàng)建域的本體來明確表示W(wǎng)eb內(nèi)容, 增強(qiáng)了 WWW 的開放性和互操作性。DL和以上語言的密切聯(lián)系在OWL的子語言中有明顯體現(xiàn)。
1)OWL-Lite:允許類與類關(guān)系的分類層次和簡單約束。
2) OWL-DL:以DL理論研究為基礎(chǔ), OWL-DL保證計算的完整性和可判定性。
3)OWL-Full:它具有自由的語法靈活性和強(qiáng)大的表達(dá)能力。這種自由是以犧牲計算性保證為代價的。
本章將對具有數(shù)值約束且 DL范圍具體的 ALN(D)DL進(jìn)行介紹。ALN(D)DL為OWL-DL的一個子集, 且在標(biāo)準(zhǔn)和非標(biāo)準(zhǔn)的推理服務(wù)中都具有一個復(fù)雜的多項式。ALN(D)DL的構(gòu)造如下:
1)丁, 通用概念。域內(nèi)所有的對象。
2)上, 底部概念。空集。
3)A原子概念。屬于集合A的所有對象。
4)-A, 原子否定。不屬于集合A的所有對象。
5)CnD, 交集。既屬于集合C又屬于集合D的對象。
6)VR. C, 通用約束。與關(guān)系R有關(guān)的所有對象, 其中, 關(guān)系R的范圍為所有屬于集合C的對象。
7)彐R, 不合格的存在約束。至少有一個對象與關(guān)系R有關(guān)。
8)(≥nR)(≤nR)(=nR), 不合格的數(shù)值約束。與關(guān)系R有關(guān)的對象的最小值、最大值和確切的數(shù)字。
9)f, 具體特征。向基本DL的擴(kuò)展, 基本的 DL 通過一組一元謂語p實現(xiàn)概念到某一具體域D(例如, 整數(shù)、實數(shù)、時間域等)的鏈接, 每一個具體的特征f 可以表示為P(0), 其中p:8=D, 8為特征域。本章僅考慮整數(shù)的實域和一元謂詞(≥kg), (《kg), (=kg), 其中g(shù)一個特征, k為整數(shù)值。知識表示(Knowledge Representation, KR)法通常利用推理服務(wù)即分類(也稱為類別)和一致性(即可滿足性)進(jìn)行匹配。給定一組通用參考本體語言的請求或資源對的注釋, 通過分類可以檢查是否所有的請求規(guī)范都包含在資源描述中。而
一致性則對請求中的一些規(guī)范與資源注釋中的規(guī)范進(jìn)行一致性驗證。這兩種情況下的輸出結(jié)果均為二進(jìn)制值:true/false。盡管這些推理服務(wù)對于一個發(fā)現(xiàn)過程的早期階段非常有效, 但無法對請求相關(guān)的一組資源進(jìn)行等級排列。
假設(shè)請求R和提議0都包含于本體T相容, 基于邏輯的匹配方法在以下五個類別使用分類和一致性進(jìn)行等級匹配:
1)精確。R中請求的所有特征都完全由0提供, 反之亦然。用公式表示為TFR=0。
2)全部歸類。R中請求的所有特征都包含在0中, 即TF0=R。
3)插件。0中提議的所有特征都包含在R中, 即TFR=0
4)可能的交集。0中提議的特征和R中請求的特征之間存在一個交集, 即T k-(RAO)。
5)部分不相交。R中請求的一些特征和在0中提議的一些特征有沖突, 即T卡一(RAO)。
當(dāng)不存在精確且完全的匹配時, 用戶可能會得到一些可能的匹配和部分匹配。然后由基于邏輯的匹配器提供關(guān)于請求的現(xiàn)有資源的邏輯排序, 但是使用分類和一致性得到的是布爾答案。部分匹配的結(jié)果可能只是“有驚無險”(例如, 只有一個請求發(fā)生了沖突), 然而一個純粹的一致性檢查可能返回一個錯誤的結(jié)果。這個錯誤結(jié)果由于與請求相似, 可以對“并不太壞”的資源進(jìn)行檢索。
假設(shè)概念R和0以及本體T, 如果出現(xiàn)部分匹配, 即如果資源關(guān)于本體T互不兼容, 將對R中的一些規(guī)范進(jìn)行檢索, G(Give up)用來獲得概念K(Keep), 則Kn0在本體T下是可滿足的。新因Colucci 等人對概念收斂問題(Concept Contraction Problem, CCP)的定義如下所述。設(shè)L為一個DL, R和0為七中的兩個概念, T是L中的一套定理, 其中R和0在T下是可滿足的?!禠, R, 0, I)定義的CCP就是找出使TF R=GNK成立、Kno關(guān)于T可滿足的一對《G, K)ELxL。那么K就是根據(jù)0和T關(guān)于R的一個收斂。
如果在收斂的過程中, 沒有任何資源可以保留在R中, 從匹配的角度看, 此時的結(jié)果最糟糕《G, K》=《R, T》, 即放棄R中所有的資源。相反, 如果Rn0在T下是可滿足, 則可能出現(xiàn)可能的匹配, 此時無需放棄R中任何資源并得到《T, R》。因此, 概念收斂問題相當(dāng)于可滿足性問題的擴(kuò)展。由于人們通常希望放棄盡可能少的東西, 因此必須為收斂定義一些標(biāo)準(zhǔn)。以協(xié)的中如果提議的資源0是關(guān)于R的一個可能的匹配, 在0中為了完全滿足R, 有必要對0中的假說H進(jìn)行評估, 使得H完全滿足R并轉(zhuǎn)換成完全匹配。Di Noia 等人對概念試推問題(Concept Abduction Problem, CAP)進(jìn)行了定義。
設(shè)L是一個DL, R和0是L中的兩個概念, T是L中的一套定理, 其中0和R在T下是可滿足的。H是根據(jù)R和T的一個關(guān)于0的假說?!禠, R, 0, 1》確定的CAP就是找出概念HEL, 使TFOnHCR成立, 且OnH在T下是可滿足的。若OCR成立, 則H=T為CAP的解決方法。因此, 概念試推問題等效于擴(kuò)展容量問題。另一方面, 若0=T成立, 則HCR成立。
2、RFID數(shù)據(jù)管理表示
任何 RFID 應(yīng)用程序通常都會產(chǎn)生一個三元組(E, 1, t)形式的元組流。其中:E為EPC編號。例如, 存儲于標(biāo)簽內(nèi)并且與每一個標(biāo)識對象相關(guān)的一個標(biāo)識碼; 表示 RFID閱讀器掃描 EPC 編號為E的產(chǎn)品的地理位置;
由于一個單一標(biāo)簽在同一個位置的讀數(shù)可能有多個, 從而產(chǎn)生大量的原的原始數(shù)據(jù)轉(zhuǎn)換成(E, 1, tim, “out)表示形式, 其中, tim為標(biāo)識對象進(jìn)入位置! 儲的數(shù)據(jù)量, 但會造成對象轉(zhuǎn)換信息的丟失。于是Lee和Chung提出了一種RFID代表閱讀事件發(fā)生的時間。
據(jù), 因此運用數(shù)據(jù)清洗技術(shù)可對數(shù)據(jù)進(jìn)行清洗。最常用的壓縮技術(shù)將駐留記錄中。間 time-in, 是標(biāo)識對象離開位置! 的時間 time-out。盡管該方法能夠減少待衣數(shù)據(jù)表示方法, 該方法主要用到產(chǎn)品的運動軌跡記錄, 其表達(dá)形式為
E:4[i'in, t'out, ]=.. =l[in, r*out]
式中, 山, ·, 么為由EEPC 標(biāo)簽沿某路徑的位置; in為進(jìn)人位置, 的時間, out 是離開位置! 的時間; 數(shù)據(jù)序列按“'in 進(jìn)行排列。這種數(shù)據(jù)表示的缺點在于對路徑依賴, 因此該方法適用于沿標(biāo)識對象的移動路徑的查詢(例如, 在羅馬, 查詢一批夾克從裁縫店出手到商店人庫的平均時間)為克服這個缺陷, 引入了登記記錄的概念, 對用于多維分析的產(chǎn)品信息進(jìn)行描述, 表示形式為
E:[A1, 01], [A2, V2], "., [An, v, ]
式中, A; 描述了E EPC 標(biāo)識對象的屬性; v; 為相應(yīng)標(biāo)識對象的值, 與A; 有關(guān)。注意:①一條登記記錄可用來表示來自不同細(xì)節(jié)級別的 RFID 數(shù)據(jù)的收集(如原始數(shù)據(jù)或登記記錄); ②聚合以屬性A; 的不同組合為基礎(chǔ)。
3、 供應(yīng)鏈索引
在供應(yīng)鏈管理中, 需要對對象轉(zhuǎn)換進(jìn)行分析。一個RFID標(biāo)簽標(biāo)識的產(chǎn)品可以經(jīng)過一條供應(yīng)鏈中的多個位置。為追蹤產(chǎn)品的活動狀態(tài), 可將轉(zhuǎn)換表示為圖表中的一條路徑4, ·“, 么, 在供應(yīng)鏈中利用圖表進(jìn)行自我描述。為了有效計算標(biāo)簽的活動路徑, 提出了DBMS物理優(yōu)化支持的方法和工藝用于供應(yīng)鏈索引。據(jù)Ban等人和Gonzalez等人開發(fā)了 EPC數(shù)據(jù)的特征來對標(biāo)簽進(jìn)行分組, 并通過位圖索引排列標(biāo)簽。Lee 和 Chung 提出了一種編碼方案, 為每個路徑分配一對(元素列表編碼號 (ELEN)一順序編碼號(OEN))。通過為供應(yīng)鏈中的每個節(jié)點分配一個素數(shù), 將路徑節(jié)點與該節(jié)點對應(yīng)的相關(guān)值相乘, 得到ELEN。通過這種方式, 標(biāo)簽路徑的計算就是對分配給該路徑的整數(shù)進(jìn)行因子分解, 而被分配數(shù)的素性保證了結(jié)果的正確性。另外, OEN 為能夠?qū)β窂街泄?jié)點間的排列進(jìn)行編碼的一個數(shù)值。 以上方案都存在一些不可忽視的缺點。