電話:13691762133
手機(jī):13691762133
郵件:andy@ownlikes.cn
QQ:317779813
地址:深圳市龍華新區(qū)觀瀾大道35號1棟3樓
網(wǎng)址 : greezubamboo.cn
RFID數(shù)據(jù)管理要求
結(jié)合兩個國家示范項目的實踐經(jīng)驗, 我們?yōu)橐粋€有效的RFID數(shù)據(jù)管理系統(tǒng)定義了若干關(guān)鍵要求。需要注意的是, 一條 EPCIS 記錄中的傳統(tǒng)日志是一個隨機(jī)事件流,數(shù)據(jù)流存在于該公司的所有EPCIS記錄中。由于供應(yīng)鏈(如FM. CG供應(yīng)鏈)的運營是面向全球的, 于是 EPCglobal 的核心服務(wù)被用于數(shù)據(jù)分享而EPCIS的使用, 可實現(xiàn)所有地點發(fā)生的事件數(shù)據(jù)的分享和交換。成功的關(guān)鍵效在于恰當(dāng)?shù)貥?gòu)建 RFID 數(shù)據(jù)以支持這些服務(wù)。
1、 RFID 數(shù)據(jù)質(zhì)量
RFID數(shù)據(jù)管理的整個過程以數(shù)據(jù)為中心。由于RFID設(shè)備可能會產(chǎn)生錯誤。增加了 RFID 數(shù)據(jù)的預(yù)處理和清洗流程的難度。相比其他傳統(tǒng)關(guān)系的數(shù)據(jù), RFID數(shù)據(jù)具有以下獨特的特征。
1)原始數(shù)據(jù)元組結(jié)構(gòu)簡單:RFID數(shù)據(jù)元組結(jié)構(gòu)為(EPC, 時間, 地點)。一個RFID元組代表著某一物品對象的時間和空間信息。給定應(yīng)用的元組是唯一的。
2)隱含語義:同一個EPC編號在不同 RFID元組中的語義可能不同。例如, 同一超市內(nèi), 不同時間或地點閱讀的同一個EPC, 讀取的數(shù)據(jù)可能代表不同的事件背景, 如店鋪盜竊、結(jié)賬離開或物品在貨架上。
3)重復(fù)讀數(shù)或漏讀:貼有 RFID 標(biāo)簽的物品因被同一閱讀器反復(fù)讀數(shù)多次或不能被閱讀器正確讀取, 導(dǎo)致數(shù)據(jù)的錯誤多讀或錯誤漏讀。
4)噪聲和不一致性:對RFID數(shù)據(jù)質(zhì)量而言, 對指定 RFID標(biāo)記物品的路徑追蹤是要解決的首要問題。RFID 數(shù)據(jù)序列可能是錯亂的, 或讀數(shù)不一致(例如, 在相同時間、不同地點讀取/發(fā)現(xiàn)同一個EPC)。在特定時間內(nèi), 對指定的一組物品的位置跟蹤是一個難題。在RFID的應(yīng)用中, 由于貼有RFID 標(biāo)簽的物品被大型集裝箱、貨車、船舶和托盤等交通工具進(jìn)行批量運輸, 因此多個RFID標(biāo)簽標(biāo)記物品被一起讀取。那么如何有效、高效地處理和管理這些讀取數(shù)據(jù)成為一個難題。理解批處理與物品之間的
關(guān)系是實現(xiàn)時間和空間這兩個維度跟蹤的關(guān)鍵。要野(NDP項目中, 全球EPCIS 都開發(fā)了訂單修正功能, 能夠成功讀取EPCs, 并建立與特定運輸工具內(nèi)運載的集裝箱或貨盤之間的鏈接。
結(jié)果表明, 當(dāng)貨物通過Metcash 倉庫出 入口時, 并不能達(dá)到100%的識讀率。但是, 由于所有物品被全部打包并強(qiáng)制執(zhí)行登記, 因此對全球EPCIS而言, 可利用一些成功的讀數(shù)將丟失的EPC與裝運訂單聯(lián)系起來。某船只運載了13件貨物, 并且都在貨位挑選程序中進(jìn)行了登記。在倉庫出入口閱讀點處, 除貨盤標(biāo)簽iteam 13 和產(chǎn)品標(biāo)簽iteam“5之外, 其他的標(biāo)簽至部被成功識讀, 并利用訂單整合功能將成功的讀數(shù)修正為一個裝運訂單。相比GRAI標(biāo)簽可能出現(xiàn)的讀數(shù)而言, SGTIN標(biāo)簽成功識讀可能性更大。各表明, 一些數(shù)據(jù)處理規(guī)則應(yīng)該支持處理數(shù)據(jù), 例如, 對RFDD 數(shù)據(jù)質(zhì)量不準(zhǔn)確的數(shù)據(jù)進(jìn)行修正。
2、 亂序事件流(UnES)
序列和序列長度是處理復(fù)雜事件的兩個重要特征。然而, 通常情況下到達(dá)事件的順序可能與物理世界中發(fā)生的事件順序不一致。我們以NDP中的一個實例進(jìn)谷
舉例說明。事件的 EPC 記錄為 urn: epc:id:sgtin. 0041333. 141501. 27900731。緊跟其后是揀選貨位和包裝中心處的記錄信息, 該物品在倉庫出入口處被記錄了3次。這此事件都在短時間內(nèi)(4分鐘以內(nèi))發(fā)生。人們不禁會問:實際發(fā)生了什么? 該貨物是人庫還是出庫? 發(fā)生時間為11:44:20的事件記錄是否意味著貨物在該時刻被裝運離開現(xiàn)場? 發(fā)生在 19/06/2006 的最后 一個事件和下一個事件之間的中間時刻, EPC到底發(fā)生了什么變化?
說明了一種現(xiàn)象, 即亂序事件流(UnES)。UnES 可能由網(wǎng)絡(luò)路由延遲導(dǎo)致, 也可能是由于一個標(biāo)簽被多個閱讀器同時閱讀時的任意記錄選擇引起的, 這與因特網(wǎng)通信過程中數(shù)據(jù)包無序到達(dá)系統(tǒng)應(yīng)用層的情形類似。UnES就是對那些亂序到達(dá)系統(tǒng)的事件記錄進(jìn)行管理。目前, 解決UnES問題的方法有兩種。一種方法是假設(shè)錄入系統(tǒng)的事件記錄的順序與其在物理世界發(fā)生的順序是一致的, 通過這種假設(shè)可以簡單忽略 UnES問題, 如SASE。另一種方法是根據(jù)提取復(fù)雜事件模型之前的事件時間戳, 如 Cayuga, 使用 Srivastava 和 Widom 提出的方法對事件數(shù)據(jù)進(jìn)行整理和分類。然而, 這兩種方法都存在缺點。對于第一種方法, 由于RFID讀寫器分布廣之且存在一定的時延, 事件記錄被存人 RFID 系統(tǒng)的順序不能總是與這些事件發(fā)生的先后順序相一致。此外, RFID 標(biāo)簽可被不同的閱讀器同時閱讀, 但是閱讀器可能在不同的時間將這些原始事件發(fā)送至系統(tǒng)。同時, 即使事件記錄被送至系統(tǒng)后, 它們可能還需要在不同的進(jìn)程中排隊等候。顯然, 對大多數(shù)RFID應(yīng)用而言, 忽視 UnES問題是不切實際的。第二種方法要求事件記錄進(jìn)入系統(tǒng)的時間點必須不超過界定的時間延遲范圍。同時, 該方法利用同一時間延遲界限處理所有的應(yīng)用。如果系統(tǒng)同時處理多個應(yīng)用, 那么單一的界定范圍就不足以應(yīng)對所有輸入數(shù)據(jù)造成的綜合影響。
3、 大規(guī)模復(fù)雜事件的追蹤
通常, 一個RFID閱讀器的一次讀數(shù)被認(rèn)為是一個原始事件。閱讀設(shè)備的廣泛 部署將產(chǎn)生大量的事件。為檢測與終端用戶應(yīng)用相對應(yīng)的語義層復(fù)雜事件, 需要對這些原始事件進(jìn)行過濾和關(guān)聯(lián)處理。而復(fù)雜事件則是對輸入的原始事件的一組連續(xù)查詢。在復(fù)雜事件的處理過程中, 所有新輸人的原始事件需要記錄在序列構(gòu)建的結(jié)構(gòu)中進(jìn)行存儲。但問題是, 當(dāng)原始事件輸入系統(tǒng)的速度比復(fù)雜事件的中間狀態(tài)輸入系統(tǒng)內(nèi)存的速度快時, 如何有效檢索所有復(fù)雜事件的中間狀態(tài)。
RFID事件管理系統(tǒng)應(yīng)具備對復(fù)雜事件的處理功能。Franklin 等人提出了 HiFi系統(tǒng)結(jié)構(gòu)。HiFi沿著樹形結(jié)構(gòu)的網(wǎng)絡(luò)在不同時間和地點上聚合事件。Mansouri-Sa-
mani和Sloman等人也充分考慮了時間約束限制。然而, 這些時間受限的管理系統(tǒng)不適用于特殊的 RFID 事件模式, 如在事件間隔或否定事件(即不可能發(fā)生的事件)間隔上具有時間約束的事件序列。此外, Brenna等人提出了 Cayuga 系統(tǒng)處理發(fā)布/訂購系統(tǒng)中的復(fù)雜事件。Cayuga 語言與 RFID 數(shù)據(jù)管理系統(tǒng)所要求的語言表達(dá)類似。它可以處理多種類型的復(fù)雜事件, 包括 Kleene 閉包模式序列。然而, Ca-yuga 不支持兩個連續(xù)事件之間的時間間隔的限制。
4、基于流數(shù)據(jù)的模式識別
根據(jù)系統(tǒng)要求, 在EPCIS中, 不同實施方案的過濾規(guī)則是不相同的。EPCIS 可根據(jù)其中的過濾規(guī)則忽略規(guī)定時間窗口內(nèi)的相同標(biāo)簽的信息。通過設(shè)置“忽略”時間窗口, 可降低標(biāo)簽被漏讀的概率, 而時間窗口長度的設(shè)置對盡可能多地捕獲標(biāo)簽至關(guān)重要。如果時間窗口設(shè)置得太長, EPCIS 可能會忽略對很多標(biāo)簽的識讀并嚴(yán)重影響識讀速度。如果時間窗口設(shè)置得太短, 將產(chǎn)生多個事件記錄。為保證捕獲標(biāo)簽的概率, 項目組決定減少“忽略”時間。
在NDP項目實踐期間, 項目組對不同的窗口時間值進(jìn)行了反復(fù)實驗。不采用 過濾規(guī)則的情況下, 在1s內(nèi)最多能對一個標(biāo)簽(周圍有100個標(biāo)簽)記錄18個閱讀事件。對EPC 數(shù)據(jù)流的研究發(fā)現(xiàn), 同一標(biāo)簽在同一秒內(nèi)被多次讀數(shù), 即同一標(biāo)簽的兩個讀數(shù)事件發(fā)生的時間間隔為零。這個過程不會對數(shù)據(jù)的記錄過程造成較大
影響, 但對已經(jīng)處理過的數(shù)據(jù)不利。
因此, 基于RFID數(shù)據(jù)管理系統(tǒng)的查詢, 應(yīng)能夠識別復(fù)雜事件模式。給定查詢條件下的查詢輸出結(jié)果為對應(yīng)事件的事件模式。查詢的執(zhí)行過程是對網(wǎng)絡(luò)上的 RFID 數(shù)據(jù)流進(jìn)行搜索。事件模式有多種表示形式, 如聯(lián)合、關(guān)聯(lián)、集群、序列事件, 或原始事件之間的依賴關(guān)系。RFID 數(shù)據(jù)流的模式識別主要有以下性質(zhì):
1)數(shù)據(jù)處理的速度必須比數(shù)據(jù)的到達(dá)速度快。因此, 模式識別算法只對數(shù)據(jù)進(jìn)行一次掃描。復(fù)雜事件模式的構(gòu)造必須穩(wěn)定, 以避免重復(fù)掃描舊數(shù)據(jù)。
2)為保證事件處理過程中事件模式的統(tǒng)計意義, 必須有足夠多的數(shù)據(jù)。
3)算法必須能夠應(yīng)對模式的變化-一發(fā)現(xiàn)的模式可能會隨時間的變化而改變。換句話講, 確定的模式才是真正的模式。因此, 系統(tǒng)必須能夠不斷地監(jiān)視數(shù)據(jù)流的變化。