2023. február 23., csütörtök

Top Secret (Semantica)

 Fogalmak:

Szemantika jelentéstan. 
A redundancia  az értelmezéshez felesleges többlet
RDF – Resource Description Framework: A szemantikus web adatmodellezéshez használt nyelve.
SPARQL – SPARQL protokoll és RDF lekérdező nyelv: A szemantikus web lekérdezéshez használt nyelve. 
OWL – Web Ontology Language: A szemantikus web séma nyelve, vagy másnéven információ-reprezentáló nyelve. 
 DL - A leíró logika (description logic, DL) segítségével le tudjuk írni egy szakterület vagy egy közismereti terület fogalmi rendszerét.
 SIOC (Semantically Interlinked Online Communities) ontológia leírónyelv.
Értelmezés;
 


A szemantikus web lényege, hogy az interneten található információkat a keresőrendszerek ne csupán sekélyesen, hanem mélyen, valódi tartalomként kezeljék. A szemantikus web jelenti az információk összekapcsolásának legújabb fejezetét – lehetővé teszi, hogy egy adott forrás bármilyen másik forrásban tárolt információt elérhessen, illetve hogy a számítógépek könnyebben értelmezhessék az ilyen hivatkozott információkat. A szemantikus web elképzelése két alapötletre építkezik. Az egyik: kapcsoljunk metainformációkat internetes erőforrásokhoz. Metaadatnak nevezünk egy olyan adatot, amely adat egy adatról. A szó jelentéstartalma teszi ezt lehetővé. Képesség a pontos jelentés értelmezésére. Jelentősen csökkenhet a redundancia és ezáltal a tárolt információ mennyisége. A szemantikus web tényeket köt össze egymással, tehát nem egy dokumentumra, vagy alkalmazásra hivatkozik, hanem az abban a dokumentumban, vagy alkalmazásban tárolt információ egy bizonyos részére.
 Komplex hierarchiákat leíró logika-i formalizmus.
A formalizmus alapvető építőkövei a fogalmak, amelyek egyedek halmazait reprezentálják és a szerepek, amelyek egyedek közötti kapcsolatokat írnak le és így egyedpárok halmazaként is felfoghatóak. Hogy terminológiai tudásunkat leírjuk egy adott területre vonatkoztatva, fel kell vennünk néhány elemi fogalmat és szerepet. Ezekből különféle fogalom- illetve szerepépítő műveletek segítségével összetett fogalmakat illetve szerepeket készíthetünk. Az így képzett kifejezések egyenlőségét vagy tartalmazási viszonyát terminológiai axiómák formájában fogalmazhatjuk meg (lásd fentebb az ontológiánál). Egy adott területre vonatkozó általános tudásunkat terminológiai axiómák egy halmazával írjuk le, ezt a halmazt terminológiai doboznak, vagy T-doboznak hívjuk. A T-doboz egy konkrét megvalósulásáról szóló tudásunkat adatállítások formájában fogalmazhatjuk meg. Fogalmi- és szerepállítások egy halmazát adatdoboznak vagy A-doboznak nevezzük. Terminológiai és adatállításaink jelentését (szemantikáját) a klasszikus matematikai logikából ismert módszerekkel határozzuk meg.Az SHIQ nyelvcsalád bevezetéséhez szükségünk van az ALC nyelvhez, melyet fentebbi bővítések útján érhetünk el. Ennek egy bővítése az SHIQ nyelv, melyben tranzitivitási axiómákat is megadhatunk, azaz egyes szerepekről kijelenthetjük, hogy tranzitívak. Az RDF, egy sor adatátalakító formátum és ajánlások, mint az RDFS és OWL, amelyeket mind arra tervezték, hogy a koncepciók, terminológiák és kapcsolatok egy formális leírását adják egy adott tudáshalmazon belül. Amikor ez az információ frissül az eredeti helyén, az arra hivatkozó tartalomban is a legújabb verzió jelenik meg belőle. Az SQL-t felváltotta a SPASQL. Az eddig használt többdimenziós gráfok már nem alkalmasak a komplexebb adatmodellezésre.  A releváns információ megosztására és újrahasznosítására összefüggések alapján való értelmezéssel, asszociációval, tezaurusz építéssel történik. Erre jó példa az Európai Bizottság 2011/833/EU határozatával[4] életre hívott és 2012-ben felállított portál: Az Európai Unió Nyílt Adatportálja (European Union Open Data Portal (EU ODP)).[5] Ez összeköti 26 tagállam kormányzatának a nyílt adatbázisait. Biztosítva ezek összekapcsolását és egyben az Unió szervezetei és polgárai számára az azokban tárolt információk elérését, lekérdezését modern SPARQL lekérdezések segítségével. A cél egy olyan infrastruktúra létrehozása, amely lehetővé teszi a weben lévő adatok integrálását, a közöttük levő kapcsolatok definiálását és jellemzését, illetve az adatok értelmezését. Persze kinőtte magát és mostmár a mesterséges intelligenciában is használjuk, elsősorban a gép és ember kommunikációban, de az önfejlesztés és a tanulás terén is használható. 10 milliárd legális weboldal van az interneten, ennek fele felesleges redundancia.

Nincsenek megjegyzések:

Megjegyzés küldése