軌跡數據

軌跡數據就是時空環境下,通過對一個或多個移動對象運動過程的採樣所獲得的數據信息,包括採樣點位置、採樣時間、速度等,這些採樣點數據信息根據採樣先後順序構成了軌跡數據。例如具有定位功能的智慧型手機,軌跡數據反映了手機持有者某一時間段的行動狀況,移動網際網路可以通過無線信號定位手機所在位置,進而採樣記錄,通過連線採樣點形成手機持有者的運動軌跡數據;GPS定位終端,固定採樣頻率的記錄終端所在位置的經緯度信息,通過無線網路將數據收集到伺服器上;RFID標籤技術,對物體進行標記,將物體的移動線路通過RFID識別器完成定位和位置數據記錄,形成物體的移動軌跡。

隨著衛星、無線網路,以及定位設備的發展,大量移動物體的軌跡數據呈急速增長的趨勢,如交通軌跡數據、動物遷徙數據、氣候氣流數據、人員移動數據等。

軌跡數據是基於時間和空間的位置序列和採樣點語義標註,對軌跡數據的研究,獲取物體有關運動的未知知識,將成為未來的研究熱點和套用增長點。

軌跡數據挖掘

軌跡挖掘是數據挖掘的一個新興分支,其研究熱點集中於軌跡聚類、軌跡分類、離群點檢測、興趣區域、隱私保護、位置推薦等方面。如果將時間看做是一維數據,大多數傳統高維數據聚類算法可以很好的適應於當前的軌跡聚類。多維數據距離測量和有效計算方面的研究已經展開。將軌跡數據看做為混契約束模型生成的有序點序列,並套用統計學方法進行研究也已展開。而所有這些軌跡聚類方法都是以軌跡作為整體進行的,並沒有對子軌跡聚類給及足夠重視。韓家煒教授提出一種“劃分-合併”聚類模型,試圖解決這個問題。該模型首先將軌跡劃分為多條軌跡段,之後對這些軌跡段進行密度聚類。聚類結果中,除去聚類簇以外,還獲得大量的離群點。這些離群點一般來講,都遠離任意一個聚類簇中心。最近,針對更加複雜情況下的聚類方法也被提出,比如多維信息集成和離群點檢測方法等。當前,雖然有大量聚類和離群點檢測算法,但套用於移動對象模式的分類算法還不是很多。在根據時間序列分類的關聯區域研究中,單一最近鄰對象方法得到了廣泛的套用,而一種基於Shapelet的分類方法也被證明非常有效。時間序列研究主要用於解決一維數據,而移動對象分類研究面對的往往是二維空間數據,所以前者的研究方法套用於後者有一定的局限性。基於區域和軌跡聚類的分類方法,將區域和聚類結果作為軌跡的特徵進行分類研究,可以得到更為有效的結果。

相關詞條

熱門詞條

聯絡我們