Oldal kiválasztása


Probléma megfogalmazása

Utazási tevékenységi zónák az egyén utazási pályájának lábnyomaiból összesítve (u) tartalmaz egy grafikont:

$$\begin{aligned} G_{u} = (V_{u},E_{u}), \end{aligned}$$

(1)

ahol \(V_{u}\) gráf csomópontok halmazát képviseli:

$$\begin{aligned} V_{u}=\{v_{u,i}|i \in [0,n]\}, \end{aligned}$$

(2)

és minden csomópont (\(v_{u,i}\)) egy egyedi reprezentatív utazási tevékenységi zónát (azaz tevékenységi csomópontot) képvisel, amely az egyéni utazási lábnyomok összesítéséből adódik. Ugyanannak az egyénnek a tevékenységi csomópontjai a gráfélek halmazán keresztül kapcsolódnak egymáshoz, amelyeket a következőképpen jelölünk:

$$\begin{aligned} E_{u}=\{e_{u,j}|j \in [0,m]\}. \end{aligned}$$

(3)

Minden él (\(e_{u,j}\)) egy irányított utazást jelöl két végponti tevékenység csomópont között. Az utazási pályák tér-időbeli tulajdonságait reprezentáló általános statisztikák tehát csomóponti jellemzőkként vannak kódolva (\(X_{v}\)) és élsúlyok (\(Y_{e}\)). A környező POI-k eloszlásai szintén csomóponti jellemzőkként vannak kódolva. A kódolási mechanizmust a következő két alfejezet ismerteti. Minden tevékenység csomópontnak kétféle szomszédja van, nevezetesen a szomszédok (\(N_{in}\)) és a külső szomszédok (\(N_{out}\)). Tevékenységi csomóponthoz \(v’\) tevékenységcsomópont szomszédos csomópontjaként v,

$$\begin{aligned}&{if (v’,v) \in E, v’ \in N_{in}}, \end{aligned}$$

(4)

$$\begin{aligned}&{if (v,v’) \in E, v’ \in N_{out}}. \end{aligned}$$

(5)

Az utazási tevékenység grafikonja alapján a Gstp2Vec az 1. ábrán látható. Lényegében két teljesen összekapcsolt előrecsatolt neurális hálózat (NN) jön létre a súlyok és a jellemző beágyazások kombinálásával, hogy a csomópontok szomszédaitól származó információkat továbbítsák a gráfstruktúrán keresztül.15,37. Az NN-ek egy halmaza többugrásként van csomagolva (pl. K-hop) aggregátorok szomszédsági beágyazások felhalmozására a mintavételezett szomszédos csomópontokból és a belső élekből K komló. Pontosabban, minden egyes aggregátor függvény (pl. AGG1, AGG2) tartalmaz egy teljesen összekapcsolt NN réteget nemlineáris aktiválási funkcióval \(\sigma\). A csomópont-beágyazások (kezdetben csomóponti jellemzők) és az élsúlyok összefűzve kisdimenziós beágyazásokat generálnak az aggregátoron keresztül.

1.ábra

Grafikon alapú ábrázolás tanulás az egyéni utazási tevékenység típusazonosításhoz.

Az NN-ek egy másik készlete frissített csomópont-beágyazások generálására szolgál úgy, hogy a bemenet csomópont-beágyazásként fűződik össze összesített szomszédsági beágyazásokkal. A frissített csomópont-beágyazásokat prediktív reprezentációkként kezeli, amelyek egy másik aktiválási függvénybe kerülnek az utazási tevékenységtípusok megállapításához. Ezt a folyamatot előre terjedésnek nevezzük15, amely az összes tevékenységcsomóponton ismétlődik egy korszak alatt a modell betanításához. Ily módon az aktuálistól távol eső tevékenységcsomópontok információi multihop szomszédokon keresztül jutnak el hozzá, és így hozzájárulnak a tevékenység típusának azonosításához. A súlymátrixok és az aggregátor paraméterei az előre terjedésben úgy hangolódnak, hogy minimalizálják a gráf alapú keresztentrópia veszteséget egy Adam optimalizálóval38így a Gstp2Vec felügyelt tanulási modell.

Tevékenység csomópontok

Az egyéni utazási pályák utazási lábnyomok sorozataként vannak ábrázolva, ahol minden lábnyom egy helyen és egy időpontban egyéni jelenlétet jelent, és földrajzi koordináták párjaként jelöljük időbélyeggel. Utazási tartózkodási pontok 1300 m/h-nál kisebb sebességgel39 térbeli szomszédosság alapján észlelhetők zajjal járó alkalmazások sűrűség alapú térbeli klaszterezése (DBSCAN) segítségével.40. A tevékenységi zónák az észlelt térbeli klaszterek (azaz tartózkodási régiók) konvex burkaiként jönnek létre, így a reprezentált utazási tevékenységekhez térbeli hatóköröket határoznak meg.41. Ezután a tevékenységi zónák a tevékenységtípus azonosítására szolgáló jellemzők létrehozására szolgálnak.

A csomópont jellemzői

Az egyes csomópontok és szomszédos csomópontjai közötti topológiai kapcsolat, valamint a szomszédságában lévő csomópontjellemzők eloszlása ​​kódolva és terjesztésre kerül az egyes csomópontok által képviselt tevékenységtípus azonosítása érdekében. A lábnyomok időbeli és térbeli eloszlási mintázatait jelző általános statisztikák, valamint a környező POI-k eloszlásai az egyes tevékenységi zónákban kiszámításra kerülnek és csomóponti jellemzőkként összefűződnek.

Pontosabban, a lábnyomok teljes vagy átlagos száma 24 órán belül, hétköznapokon vagy hétvégén, az időtulajdonságokat reprezentálja (t) minden egyes tevékenységi zóna, ahol T egy mátrix transzponálását jelöli:

$$\begin{aligned} t_{weekday}= és {} [n_utazás,n_{2},\ldots ,n_{24}]^T, \end{aligned}$$

(6)

$$\begin{aligned} {\overline{t}}_{weekday}= & {} [{\overline{n}}_utazás,{\overline{n}}_{2},\ldots ,{\overline{n}}_{24}]^T, \end{aligned}$$

(7)

$$\begin{aligned} t_{weekend}= és {} [n_utazás‘,n_{2}’,\ldots ,n_{24}’]^T, \end{aligned}$$

(8)

$$\begin{aligned} {\overline{t}}_{weekend}= & {} [{\overline{n}}_utazás‘,{\overline{n}}_{2}’,\ldots ,{\overline{n}}_{24}’]^T, \end{aligned}$$

(9)

$$\begin{aligned} t= & {} \left[ t_{weekday},{{\overline{t}}_{weekday}}, t_{weekend}, {{\overline{t}}_{weekend}}\right] . \end{aligned}$$

(10)

Ezen túlmenően a rendszer a hét minden egyes napján egy egyéni tevékenységi zónában eltöltött átlagos időtartamokat kiszámítja, és összefűzi, hogy kibővített reprezentációt hozzon létre.42 (\(t^{+}\)) időbeli minták:

$$\begin{aligned} \overline{\Delta t}_{dow}= & {} \left[\overline{\Delta t}_utazás‘,\overline{\Delta t}_{2}’,\ldots ,\overline{\Delta t}_{7}’\right]^T, \end{igazított}$$

(11)

$$\begin{aligned} t^{+}= & {} [t,\overline{\Delta t}_{dow}]. \end{aligned}$$

(12)

Az eltelt idő maximális és átlagos értéke (\(\Delta t_{max}\) és \(\overline{\Delta t}\)) vagy távolság (\(\Delta d_{max}\) és \(\overline{\Delta d}\)) a következő utazási lábnyomhoz egy tevékenységi zónán belüli összes lábnyomra szintén tér-időbeli jellemzőként számítanak ki (s):

$$\begin{aligned} s=\left[ \Delta t_{max},\overline{\Delta t},\Delta d_{max},\overline{\Delta d}\right] . \end{aligned}$$

(13)

POI-eloszlási jellemzők kódolása, a természetes nyelvi feldolgozással analóg módon43minden különálló POI jellemző osztály (pl. kollégium, kávézó, bár, kórház stb.) szónak minősül44. Az összes lehetséges POI-elemosztály szótárnak, a tevékenységi zónával átfedésben lévő POI-k jellemzőosztályai pedig korpusznak minősülnek. Az OSM szótárból összesen 335 különböző POI jellemzőosztály (vagyis szó) van gyűjtve. Ezután az egyes lehetséges POI jellemző osztályok előfordulásait megszámolják egy tevékenységi zónához, hogy ritka POI jellemzővektort állítsanak elő (p).

Ezenkívül a 335 POI-osztály 18 különböző helytípusba (pl. otthon, étkezés, oktatás) van összesítve a városi környezetben való funkcionalitásuk alapján (pl. kávézó \(\jobb nyíl\) enni)25. Ezután egy kisebb szótárat építünk, hogy sűrűbb vektort állítsunk elő, amelyet összefűzünk p kiterjesztett POI-vektor létrehozásához (\(p^{+}\)). Következő, \(p^{+}\) össze van kapcsolva a fent említett spatiotemporális jellemzővektorral, hogy létrehozzon egy csomóponti jellemző mátrixot (\(X_v\)) minden egyes tevékenységi zóna esetében:

$$\begin{aligned} {X_v}=\left[ {t^{+}},s,{p^{+}}\right] . \end{aligned}$$

(14)

Élsúlyok

Az utazás az egyén számára az egyik utazási tevékenységből (azaz indulásból) a másikba (azaz úti célba) való átmenetként definiálható, ami általában az egyén térbeli átmenetét is jelzi egyik helyről a másikra. A javasolt Gstp2Vec keretrendszerben az utazási irányok összhangban vannak az élirányokkal. A kioldás irányán és a végponti tevékenység csomópontjainak tulajdonságain kívül a kioldási tulajdonságok közé tartoznak az egyes térbeli és időbeli átmenetek mérésére szolgáló statisztikák is, például az utazási gyakoriság (f), átlagos utazási időtartam (\({\overline{t}}\)), és az átlagos utazási távolság (\({\overline{d}}\)), amelyek élsúlyként vannak kódolva (\(Y_e\)).

Kimondottan, f kiszámítása úgy történik, hogy minden egyes kiindulási tevékenységi zónától a megfelelő célzónáig számolják az utazások előfordulásait, minden egyes személynél az összes utazási lábnyomon keresztül. Akkor \({\overline{t}}\) az utakon eltöltött idő átlagával mérik, és \({\overline{d}}\) az egyenes vonalak távolságának átlagolásával mérik a 2D térben. Ezek az utazási tulajdonságok különböző aspektusait mérő statisztikák összefűzve reprezentálják Y:

$$\begin{aligned} {Y_e}=\left[ f,{\overline{t}},{\overline{d}}\right] . \end{aligned}$$

(15)

Aggregátorok

Amint az 1. táblázatban és 2. ábrán látható, a Gstp2Vec aggregátorai (azaz aggregációs függvények) elfogadják a mintavételezett szomszédos csomópontok jellemzőbeágyazását, amelyek a megfelelő élsúlyokkal összefűzött csomóponti jellemzőkként vannak inicializálva. Mivel a javasolt keretrendszerben a szomszédos csomópontok természetüknél fogva nincsenek rendezve, az aggregációs függvényeknek szimmetrikusnak kell lenniük ahhoz, hogy tetszőlegesen rendezett csomópont-beágyazásokon működjenek. Emellett egyszerűnek és taníthatónak kell lenniük15. A Max pooling aggregátor szimmetrikus és betanítható, ezért a javasolt keretrendszerben alkalmazzuk45.

1. táblázat A \(k{^{th}} (\forall k \in {1,\ldots ,K})\) aggregátor architektúra.
2. ábra
2. ábra

Aggregátorok felépítése és felügyelt tanulás.

Pontosabban, egy egyrétegű perceptront alkalmaznak teljesen összekapcsolt NN-ként egy aggregátoron belül. Az előre irányuló terjedés minden iterációja során minden tevékenységcsomóponthoz rögzített számú (pl. 2) szomszédos csomópont mintavétele történik. Ezután a perceptront minden egyes mintavételezett szomszédos csomópont jellemző beágyazási mátrixára alkalmazzák a jellemzők sorozatának kiszámításához, és egy elemenkénti maximális értéket generálnak minden egyes számított jellemző számára az összes mintavételezett szomszédos csomópont között, és továbbítják az aktuális csomóponthoz. Ily módon a modell hatékonyan rögzíti a szomszédságkészlet különböző aspektusait15.

Felügyelt tanulás

A modellsúlyok iteratív hangolása a végpontok közötti felügyelt tanulás módjára történik14,15,31. Először is, az aktivitási zónákból és kirándulásokból álló grafikonok egyének alapján képzési, érvényesítési és tesztkészletekre vannak felosztva (3. ábra). Mint ilyen, ugyanannak az egyénnek a tevékenységi zónái nem jelennének meg különböző készletekben (pl. mind az edzési, mind a tesztkészletekben). Például a grafikon (\(G_{u_{2}}\) A 3. ábrán az egyed aktivitási zónái alkotják \(u_{2}\) fel van osztva a tesztkészletre, míg két másik grafikon (pl. \(G_{u_utazás}\) és \(G_{u_{3}}\)) az edzéskészletben vannak, a fennmaradó pedig (pl. \(G_{u_{4}}\) az érvényesítési készletben van.

3. ábra
3. ábra

Az aktivitási zónák grafikonjainak véletlenszerű felosztása képzési, érvényesítési és tesztkészletekre azon személyek alapján, akikhez tartoznak.

A betanítási folyamat két lépésből áll, nevezetesen az előre terjesztésből és a paramétertanulásból. Előre terjedés (Z a (16) egyenletben)46) először csomópont-beágyazásokat generál a csomópont-jellemzők szomszédsági beágyazásokkal való összefűzésével (2. ábra), amelyek viszont aggregátorokon keresztül jönnek létre a fentebb tárgyalt módon. Ezután az összefűzött csomópont jellemzőit egy egyrétegű NN asszimilálja egy aktiválási funkcióval, amely frissített csomóponti jellemzők beágyazásokat hoz létre, és végül előállítja a prediktív reprezentációkat (pl. \(h^{k-1}_v\)) (2. táblázat). Ezután egy másik softmax függvényt alkalmazunk a kimeneti reprezentációkra az utazási tevékenységek típusainak előrejelzésére többkategóriás osztályozáson keresztül (argmax a (16) egyenletben). A paramétertanuláshoz gráf alapú kereszt-entrópia veszteséget alkalmaznak az előrejelzett eredményekre a korábbi súlymátrixok hangolásához.

$$\begin{aligned} {Z=f\bigg (h_{v}^{k-1},h_{v’}^{k}\bigg )=argmax\bigg (softmax\bigg (\sigma \bigg (W^k\cdot CONCAT\bigg (h_{v}^{k-1},h_{N(v)}^{k}\bigg )\bigg )\bigg )\bigg )}. \end{aligned}$$

(16)

2. táblázat A csomópont-beágyazások frissítésének architektúrája a csomópontokhoz \({(k-1)}{\text {th}} (\forall k-1 \in {1,\ldots ,K})\) komló.



Forrás: ITT