2015. október 10., szombat

Az adatbázis-kezelés alapfogalmai



(ismeret, adat, információ, adattárolás, adatfeldolgozás)
Az emberek (nem csak a gazdaság, a közigazgatás vagy egyéb tevékenységet folytató területek irányítói, résztvevői) arra törekszenek, hogy a környezetükből származó és tevékenységüket esetleg még meg is határozó ismereteket valamilyen módon megőrizzék. Véges a memóriájuk és persze felejtenek is.
A megszerzett ismereteiket tehát el kell raktározni, de ehhez valamilyen formában rögzíteni, esetleg még átalakítani is kell azokat. Az így átalakított, és rögzített ismeretet nevezzük adatnak. Az adatok tárolásának módja az idők folyamán változott, jelenleg erre a célra a számítógép látszik legalkalmasabbnak. Az adat a valóság valamilyen objektumához kötődik, leírja annak tulajdonságát. Beszélhetünk még az elemi adatról, amely tovább már nem osztható, önmagában még értelmezhető ismeret. Azzal a példával lehet ezt leginkább érzékeltetni, hogy egy személyi nyilvántartás lakcím adata [irányítószám, helység, utca név, házszám, emelet, ajtó] elemi adatokból áll.
Az adatok eltárolásának azonban nem maga a tárolás a célja. Ez csak eszköz ahhoz, hogy a tárolt adatok gyors, gazdaságos feldolgozása által (szintetizálás, kiválogatás, elemzés) új ismerethez, azaz információhoz jussunk. Az információ szintén erőforrás. Jellemzője, hogy nincs megmaradási törvénye, független az üzenet tartalmától és átvitelenként sérülhet.
Az elemi adatot az objektumról a jel közvetíti, amelyhez az észlelést végző jelentést társít, s így jut információhoz. A jel fizikai megjelenési formája a kommunikáció fajtájától függ. Például a forgalomirányító lámpa piros fénye azt jelenti a közlekedők számára, hogy az adott irányba most tilos a továbbhaladás. A jel tehát egy „megállapodáson” alapuló információhordozó. A leírt (lásd betűk, számok), s témakörünkben maradva, a számítógépen tárolt jelsorozat (bináris értékek) a számítógépben tárolható. Feldolgozó mechanizmusa által értelmezhető s belőle információ állítható elő. Ennek megjelenési formája szintén megállapodáson alapul. A feldolgozás outputja lehet diagram (grafikus jel), számsorozat (numerikus jel), szöveg, kép, hang, stb.
Az adatok tárolása
Az adatokat természetesen azért tároljuk, hogy feldolgozhatóak legyenek. Egy adattároló rendszernek tehát minimum annak kell megfelelni, hogy adott tulajdonság alapján megtalálható legyen egy keresett adat. Ez nem jelent mást, mint, hogy előre meghatározott eljárásokkal (algoritmusokkal) hatékonyan feldolgozható legyen egy adathalmaz. Úgy is mondhatjuk, hogy meghatározott szerkezetben kell az adatokat tárolni.
A számítástechnikai feldolgozások az adatokat állományokban (adatállományokban) tárolják. Ezeket nevezzük fájlnak is. Az adatállomány egy sora (logikai egysége) a rekord, ennek alkotórészei az elemi adatok, a mezők.
Meg kell még említeni, különösen az adatbázis szemléletű adatkezelés kapcsán, az adatcsoport fogalmát, amely valamilyen közös ismérv alapján együtt értelmezett elemi adatok (mezők) halmaza.
Az adatok feldolgozása
Az állománykezelő vagy szakszerűbben fájlkezelő műveletek a fájlok, a rekordok illetve a mezők szintjén kerülnek meghatározásra.
Létrehozás
A fájlszerkezetnek a kialakítását jelenti, amely magában foglalja a tárolás logikai (fájl típus, rekord szerkezet) és fizikai paramétereinek (tárolt adatok típusa, mérete, tárolási hely) meghatározását.
Karbantartás
A fájl tartalmának rekord illetve mező szintű módosítása.
-      Új Rekord felvitele
-      Rekord törlése
-      Logikai törlés (a rekord létező de inaktív)
-      Fizikai törlés (a végleges megszüntetés)
-      Rekord módosítás, amely mező szintű művelet, a mező(k) tartalmának változtatása
Visszakeresés
Az állomány rekordjaira illetve mezőire vonatkozó feltétel alapján történő adat keresés. A gyakorlatban ez a művelet egy mező szintű feltétel alapján, rekord szintű kereséssel indul és ha megtaláltuk a rekordot, kerülhet sor a szükséges feldolgozás (módosítás, törlés) indítására.
Újraszervezés
A fájl (logikai) szerkezetének átalakítása, esetleg tartalmi változások okán újra létrehozása. Ez a művelet általában technikai, karbantartó céllal történik és nem közvetlenül az adatfeldolgozás része.
A fájlszerkezetek, vagyis az alkalmazott adatállományok típusai
Soros fájlszerkezet
A legegyszerűbb, de feldolgozás szempontjából legmunkaigényesebb szerkezet. A soros fájlban a rekordok minden rendezettség nélkül, a felvitelük sorrendjében kerülnek eltárolásra.
Az új rekord, a már létező rekord sorozat végére, utánírással vihető fel.
A törlés, módosítás csakis újraszervezéssel, vagyis a módosított tartalmú fájl felírásával és a módosítás előtti fájl megszüntetésével, törlésével hajtható végre.
A visszakeresés pedig a fájl tartalmának végigolvasásával lehetséges, amely mindaddig tart, amíg meg nem találjuk a keresett rekordot illetve az állomány végére nem jutunk.
Szekvenciális fájlszerkezet
A fájl rekordjai itt is sorosan érhetők el, de a rekordok sorrendje valamilyen felhasználói igény szerint már rendezettek. A kereséskor egy közvetlen elérésű adattárolón (merevlemez) gyorsabb elérési módszerek is alkalmazhatók, mint a rekordok végigolvasása, főleg több rekord egyidejű feldolgozása esetén.
A törlés, módosítás mellett az új rekord felvitele is a fájl újraszervezését igényli, mert a rendezettség fenntartása érdekében (nem lehet két rekord közé beszúrni).
Direkt (vagy közvetlen) hozzáférésű fájlszerkezet
Jellemzője, hogy a rekordok és tárolási helyük fizikai vagy relatív (egymáshoz viszonyított) címei között rögzített, közvetlen kapcsolat van. A cím vagy sorszám rekordhoz rendelése a feldolgozó program feladata, amely a felhasználó rekord elérési igényeit tükrözik. A gyors feldolgozási igények olyan feladatokra terjedhetnek ki, mint az 1. vagy utolsó vagy n. rekordra ugrás, minden 5. rekord feldolgozása, stb.
A rekordok feldolgozhatók a címük sorrendjében és a háttértáron történő fizikai tárolásuk sorrendjében (mint egy soros állománynál).
A törlés speciális jelenséget okoz, az úgynevezett álrekordot, ami nem más, mint a fizikai sorban benne levő de tartalmát „vesztett” rekord. (lásd a logikai törlést) A hely és a helyhez tartozó cím megvan de nincs értékes adat benne. Az álrekordok törlése az állomány átszervezésével a fizikai törléssel történhet.
Az új rekord felvitele az ilyen álrekordok helyére történhet, vagy utánírással.
Indexelt szekvenciális fájlszerkezet
Egy direkt elérésű alapfájlból és egy vagy több úgynevezett indextáblából áll. Az indextábla önmaga is egy állomány, amely két fontos adatot tartalmaz. Az egyik azon mező vagy mezők csoportja, amely(ek) szerint indexelni kívánjuk az alapállományt, a másik pedig az alapfájl rekordjainak cím adata. Az indexelés nem más, mint az adott mező(k) szerinti rendezettségi sorrend.
A visszakeres az indextábla alapján, a valódi műveletvégzés az indexfájlban tárolt cím segítségével gyorsan megtalált alapfájlon történik meg.
A törlés és új rekord felvitel természetesen az index táblák újraszervezését is jelentik.
A logikai és fizikai adattárolási modellek összefüggése
Az adatok logikai szerkezete (lásd az előző bekezdésben) és az adattárolón történő fizikai elhelyezkedése a hatékony hozzáférés biztosítása miatt összefügg. A fizikai tárolás problematikáját az operációs rendszer oldja meg, de a fejlesztő szoftverek is gyakran rendelkeznek az adattárolás módjáról.

Nincsenek megjegyzések:

Megjegyzés küldése