電話:13691762133
手機:13691762133
郵件:andy@ownlikes.cn
QQ:317779813
地址:深圳市龍華新區(qū)觀瀾大道35號1棟3樓
網(wǎng)址 : greezubamboo.cn
RFID數(shù)據(jù)管理基于語義的匹配
基于語義的對象發(fā)現(xiàn)是建立在描述邏輯(Description Logic, DL)的基礎(chǔ)上的。DL支持OWL語言的語義。此外, OWL-DL語法和 DIG(Description Logic Imple-mentation Group, 描述邏輯實現(xiàn)小組)之間存在嚴格的對應(yīng)關(guān)系, 其中 DIG為基于HTTP接口的開發(fā)者。特別是, 當面向?qū)崿F(xiàn)問題時, DIG 2. 0 公式表達請求和資源描述, 因其簡潔、緊湊, 為移動Ad Hoc應(yīng)用程序所必需??傊? 采用 DL語法可增強語法的可讀性。
DL 為一簇知識表示語言, 以邏輯形式化的方法表示特定應(yīng)用領(lǐng)域的知識。其基本語法元素包括概念名、角色名以及個體名。其中, 概念解釋為該領(lǐng)域內(nèi)目標對象的集合; 角色則為不同概念子集內(nèi)目標對象的屬性; 而個體則用于概念中特殊命名的元素。正式場合下, 概念被解釋為解析8領(lǐng)域的子集, 關(guān)系則理解為Δx4子集的一種二元關(guān)系。
DL公式通過每個構(gòu)造定義解析函數(shù)1給出了語義的含義。例如, 如果A和D為兩個一般的概念, 則AND為集合的交集, 即(AND)'=A'nD', 當存在其他的布爾連接符U和-時, 就會給出合集與補集的慣用理論集的注釋。概念可用于包含斷言0≤D和定義0=D, 根據(jù)為特定域引發(fā)的知識, 便可對可能的注釋施以約束。DL理論(又名 TBox 或者本體論)基本上是一系列的包含斷言和定義。TBox 的模型T是對該模型中滿足所有包含關(guān)系和定義的解釋說明。許多其他結(jié)構(gòu)符的定義也有助于提高DL的表達能力。但是, 這樣通常會增加推理服務(wù)的計算復(fù)雜度。因此, 推理服務(wù)的計算復(fù)雜度與 DL 表達能力之間的權(quán)衡非常重要的。
語義網(wǎng)的核心思想是基于XML, 如RDF、RDFS和OWL, 用標記語言注釋信息。RDF、RDFS和OWL等語言已經(jīng)為機器可理解的語言, 通過創(chuàng)建域的本體來明確表示W(wǎng)eb內(nèi)容, 增強了 WWW 的開放性和互操作性。DL和以上語言的密切聯(lián)系在OWL的子語言中有明顯體現(xiàn)。
1)OWL-Lite:允許類與類關(guān)系的分類層次和簡單約束。
2) OWL-DL:以DL理論研究為基礎(chǔ), OWL-DL保證計算的完整性和可判定性。
3)OWL-Full:它具有自由的語法靈活性和強大的表達能力。這種自由是以犧牲計算性保證為代價的。
本章將對具有數(shù)值約束且 DL范圍具體的 ALN(D)DL進行介紹。ALN(D)DL為OWL-DL的一個子集, 且在標準和非標準的推理服務(wù)中都具有一個復(fù)雜的多項式。ALN(D)DL的構(gòu)造如下:
1)丁, 通用概念。域內(nèi)所有的對象。
2)上, 底部概念??占?。
3)A原子概念。屬于集合A的所有對象。
4)-A, 原子否定。不屬于集合A的所有對象。
5)CnD, 交集。既屬于集合C又屬于集合D的對象。
6)VR. C, 通用約束。與關(guān)系R有關(guān)的所有對象, 其中, 關(guān)系R的范圍為所有屬于集合C的對象。
7)彐R, 不合格的存在約束。至少有一個對象與關(guān)系R有關(guān)。
8)(≥nR)(≤nR)(=nR), 不合格的數(shù)值約束。與關(guān)系R有關(guān)的對象的最小值、最大值和確切的數(shù)字。
9)f, 具體特征。向基本DL的擴展, 基本的 DL 通過一組一元謂語p實現(xiàn)概念到某一具體域D(例如, 整數(shù)、實數(shù)、時間域等)的鏈接, 每一個具體的特征f 可以表示為P(0), 其中p:8=D, 8為特征域。本章僅考慮整數(shù)的實域和一元謂詞(≥kg), (《kg), (=kg), 其中g(shù)一個特征, k為整數(shù)值。知識表示(Knowledge Representation, KR)法通常利用推理服務(wù)即分類(也稱為類別)和一致性(即可滿足性)進行匹配。給定一組通用參考本體語言的請求或資源對的注釋, 通過分類可以檢查是否所有的請求規(guī)范都包含在資源描述中。而
一致性則對請求中的一些規(guī)范與資源注釋中的規(guī)范進行一致性驗證。這兩種情況下的輸出結(jié)果均為二進制值:true/false。盡管這些推理服務(wù)對于一個發(fā)現(xiàn)過程的早期階段非常有效, 但無法對請求相關(guān)的一組資源進行等級排列。
假設(shè)請求R和提議0都包含于本體T相容, 基于邏輯的匹配方法在以下五個類別使用分類和一致性進行等級匹配:
1)精確。R中請求的所有特征都完全由0提供, 反之亦然。用公式表示為TFR=0。
2)全部歸類。R中請求的所有特征都包含在0中, 即TF0=R。
3)插件。0中提議的所有特征都包含在R中, 即TFR=0
4)可能的交集。0中提議的特征和R中請求的特征之間存在一個交集, 即T k-(RAO)。
5)部分不相交。R中請求的一些特征和在0中提議的一些特征有沖突, 即T卡一(RAO)。
當不存在精確且完全的匹配時, 用戶可能會得到一些可能的匹配和部分匹配。然后由基于邏輯的匹配器提供關(guān)于請求的現(xiàn)有資源的邏輯排序, 但是使用分類和一致性得到的是布爾答案。部分匹配的結(jié)果可能只是“有驚無險”(例如, 只有一個請求發(fā)生了沖突), 然而一個純粹的一致性檢查可能返回一個錯誤的結(jié)果。這個錯誤結(jié)果由于與請求相似, 可以對“并不太壞”的資源進行檢索。
假設(shè)概念R和0以及本體T, 如果出現(xiàn)部分匹配, 即如果資源關(guān)于本體T互不兼容, 將對R中的一些規(guī)范進行檢索, G(Give up)用來獲得概念K(Keep), 則Kn0在本體T下是可滿足的。新因Colucci 等人對概念收斂問題(Concept Contraction Problem, CCP)的定義如下所述。設(shè)L為一個DL, R和0為七中的兩個概念, T是L中的一套定理, 其中R和0在T下是可滿足的。《L, R, 0, I)定義的CCP就是找出使TF R=GNK成立、Kno關(guān)于T可滿足的一對《G, K)ELxL。那么K就是根據(jù)0和T關(guān)于R的一個收斂。
如果在收斂的過程中, 沒有任何資源可以保留在R中, 從匹配的角度看, 此時的結(jié)果最糟糕《G, K》=《R, T》, 即放棄R中所有的資源。相反, 如果Rn0在T下是可滿足, 則可能出現(xiàn)可能的匹配, 此時無需放棄R中任何資源并得到《T, R》。因此, 概念收斂問題相當于可滿足性問題的擴展。由于人們通常希望放棄盡可能少的東西, 因此必須為收斂定義一些標準。以協(xié)的中如果提議的資源0是關(guān)于R的一個可能的匹配, 在0中為了完全滿足R, 有必要對0中的假說H進行評估, 使得H完全滿足R并轉(zhuǎn)換成完全匹配。Di Noia 等人對概念試推問題(Concept Abduction Problem, CAP)進行了定義。
設(shè)L是一個DL, R和0是L中的兩個概念, T是L中的一套定理, 其中0和R在T下是可滿足的。H是根據(jù)R和T的一個關(guān)于0的假說。《L, R, 0, 1》確定的CAP就是找出概念HEL, 使TFOnHCR成立, 且OnH在T下是可滿足的。若OCR成立, 則H=T為CAP的解決方法。因此, 概念試推問題等效于擴展容量問題。另一方面, 若0=T成立, 則HCR成立。
2、RFID數(shù)據(jù)管理表示
任何 RFID 應(yīng)用程序通常都會產(chǎn)生一個三元組(E, 1, t)形式的元組流。其中:E為EPC編號。例如, 存儲于標簽內(nèi)并且與每一個標識對象相關(guān)的一個標識碼; 表示 RFID閱讀器掃描 EPC 編號為E的產(chǎn)品的地理位置;
由于一個單一標簽在同一個位置的讀數(shù)可能有多個, 從而產(chǎn)生大量的原的原始數(shù)據(jù)轉(zhuǎn)換成(E, 1, tim, “out)表示形式, 其中, tim為標識對象進入位置! 儲的數(shù)據(jù)量, 但會造成對象轉(zhuǎn)換信息的丟失。于是Lee和Chung提出了一種RFID代表閱讀事件發(fā)生的時間。
據(jù), 因此運用數(shù)據(jù)清洗技術(shù)可對數(shù)據(jù)進行清洗。最常用的壓縮技術(shù)將駐留記錄中。間 time-in, 是標識對象離開位置! 的時間 time-out。盡管該方法能夠減少待衣數(shù)據(jù)表示方法, 該方法主要用到產(chǎn)品的運動軌跡記錄, 其表達形式為
E:4[i'in, t'out, ]=.. =l[in, r*out]
式中, 山, ·, 么為由EEPC 標簽沿某路徑的位置; in為進人位置, 的時間, out 是離開位置! 的時間; 數(shù)據(jù)序列按“'in 進行排列。這種數(shù)據(jù)表示的缺點在于對路徑依賴, 因此該方法適用于沿標識對象的移動路徑的查詢(例如, 在羅馬, 查詢一批夾克從裁縫店出手到商店人庫的平均時間)為克服這個缺陷, 引入了登記記錄的概念, 對用于多維分析的產(chǎn)品信息進行描述, 表示形式為
E:[A1, 01], [A2, V2], "., [An, v, ]
式中, A; 描述了E EPC 標識對象的屬性; v; 為相應(yīng)標識對象的值, 與A; 有關(guān)。注意:①一條登記記錄可用來表示來自不同細節(jié)級別的 RFID 數(shù)據(jù)的收集(如原始數(shù)據(jù)或登記記錄); ②聚合以屬性A; 的不同組合為基礎(chǔ)。
3、 供應(yīng)鏈索引
在供應(yīng)鏈管理中, 需要對對象轉(zhuǎn)換進行分析。一個RFID標簽標識的產(chǎn)品可以經(jīng)過一條供應(yīng)鏈中的多個位置。為追蹤產(chǎn)品的活動狀態(tài), 可將轉(zhuǎn)換表示為圖表中的一條路徑4, ·“, 么, 在供應(yīng)鏈中利用圖表進行自我描述。為了有效計算標簽的活動路徑, 提出了DBMS物理優(yōu)化支持的方法和工藝用于供應(yīng)鏈索引。據(jù)Ban等人和Gonzalez等人開發(fā)了 EPC數(shù)據(jù)的特征來對標簽進行分組, 并通過位圖索引排列標簽。Lee 和 Chung 提出了一種編碼方案, 為每個路徑分配一對(元素列表編碼號 (ELEN)一順序編碼號(OEN))。通過為供應(yīng)鏈中的每個節(jié)點分配一個素數(shù), 將路徑節(jié)點與該節(jié)點對應(yīng)的相關(guān)值相乘, 得到ELEN。通過這種方式, 標簽路徑的計算就是對分配給該路徑的整數(shù)進行因子分解, 而被分配數(shù)的素性保證了結(jié)果的正確性。另外, OEN 為能夠?qū)β窂街泄?jié)點間的排列進行編碼的一個數(shù)值。 以上方案都存在一些不可忽視的缺點。