Pagina documente » Informatica, Matematica » Baze de date statistice

Cuprins

lucrare-licenta-baze-de-date-statistice
Aceasta lucrare poate fi descarcata doar daca ai statut PREMIUM si are scop consultativ. Pentru a descarca aceasta lucrare trebuie sa fii utilizator inregistrat.
lucrare-licenta-baze-de-date-statistice


Extras din document

Cuprins
ASPECTE TEORETICE RELATIV LA ORGANIZAREA SI PRELUCRAREA INFORMATIILOR
C A P I T O L U L I
I. Organizarea logica a datelor.
1.1 Informatii, date, tipuri de date.
1.2 Structuri de date
1.3 Evolutia metodelor si tehnicilor de organizare a datelor
1.4 Organizarea datelor in baze de date
1.4.1 Definitie
1.4.2 Terminologie
1.4.3 Niveluri de organizare a datelor in baze de date
1.4.4 Limbaje pentru baze de date
1.5 Obiectivele sistemelor de gestionare a bazelor de date .
1.6 Componentele unui SGBD
1.7 Evolutia sistemelor de gestionare a bazelor de date
1.7.1 Diagrama entitate-relatie
1.7.2 Modelul relational
1.7.3 Operatorii modelului relational
1.7.4 Limbaje pentru manipularea datelor relationale

Alte date

?{p}

?

ASPECTE TEORETICE RELATIV LA ORGANIZAREA SI PRELUCRAREA INFORMATIILOR

C A P I T O L U L I

I. Organizarea logica a datelor.

1.1 Informatii, date, tipuri de date.

Informatia, este, alaturi de materie si energie, o notiune de larga generalizare filozofica si reprezinta reflectarea in constiinta noastra a legaturilor cauza-efect din lumea reala inconjuratoare.

Pentru utilizarea corecta a notiunii de informatie trebuie scoasa in evidenta distinctia intre fenomenele lumii reale, informatiile despre aceste fenomene si reprezentarea ca date a informatiilor corespunzatoare.

Informatia este un mesaj cu caracter de noutate despre evenimentele care au avut, au sau vor avea loc in interiorul sau exteriorul sistemului natural sau social. Prin urmare, informatia defineste elementele noi pe care le contine semnificatia unui simbol sau grup de simboluri (mesaje verbale sau scrise, semnale de natura tehnica, economica, etc.) cu ajutorul carora se comunica date referitoare la anumite evenimente, stari sau actiuni ale sistemului considerat. Presupunand ca pentru un sistem oarecare exista o multime de stari posibile la fel de probabile, lucru care genereaza o nedeterminare a starilor, primirea informatiei despre una sau mai multe stari, dar nu despre toate, face ca nedeterminarea sa fie inlaturata intr-o oarecare masura.

Masura care caracterizeaza inlaturarea nedeterminarii se numeste cantitatea de informatii, iar masura cantitatii de informatii se exprima prin categoria de entropie, definita prin relatia:

H(A) = H(p1, p2, …….., pn)

(1)

unde: p1, p2, …….., pn reprezinta probabilitatile rezultatelor

a1, a2, ……….., an in care se concretizeaza experimentul A.

Expresia matematica a lui H a fost data pentru prima data in anul 1448 de C.E. Shannon, astfel:

H(p1, p2, …….., pn) = -? pkxlogbpk (2)

Daca baza logaritmului, b, se alege egala cu 2 inseamna ca avem de-a face cu un experiment ce contine doua evenimente echiprobabile (p1 = p2 = ˝ ). In acest caz, unitatea de masura a nedeterminarii se numeste unitate diadica, binara sau bit (cifra binara = binary digit).

In tara noastra, academicianul Octav Onicescu a observat ca pentru scopurile pur statistice se poate pastra ca informatie probabilitatea insasi si nu logaritmul ei. Cu alte cuvinte, se poate considera ca informatie medie expresia (3) numita si energie informationala, pe baza careia a fost creata o disciplina noua, anume statistica informationala.

E =

Informatia este caracterizata, in general, de urmatoarele trei niveluri: sintactic, semantic si pragmatic.

Nivelul sintactic se refera la sistemul de semne si la regulile de reunire a acestora in constructii sintactice utilizate pentru prezentarea informatiilor in procesul culegerii, transmiterii si prelucrarii acestora. Acestui nivel ii corespunde conceptul de data, concept central in informatica, exprimat prin formula BNF (Backus – Naur Form) astfel:

: : =

(entitate)

Cu alte cuvinte o informatie este o triada a elementelor: entitate, atribut, valoare. Entitatea formeaza obiectul informatiei. Atributul (sau caracteristica) este elementul de descriere a entitatii respective, caracterul sau o proprietate a acesteia. Valoarea este o masura a proprietatii sau atributului asociat. De exemplu, informatia despre rezultatului unui concurs se poate reprezenta astfel: entitatea “concurent”, atributul “rezultate”, iar valoarea “admis”.

O entitate se caracterizeaza de obicei prin mai multe proprietati, avand astfel asociate mai multe atribute si valorile lor. Se impune, cu necesitate, caracterizarea completa a entitatii, prin toate atributele sale. De exemplu, entitatea “concurent” nu poate sa nu aiba atributul “nume – concurent”; sau daca pentru entitatea “drapele nationale” s-ar preciza numai atributul “ culoare”, ar fi incomplet definit, stiind ca mai multe drapele au aceleasi culori, ar trebui sa adaugam atributul “model”.

Datele constituie materializarea, reprezentarea simbolica a informatiilor (prin semne, litere, cifre) intr-o forma conventionala (scrisa, vorbita, luminoasa, semne grafice, desene), convenabila unei comunicari.

Apare astfel clara distinctia intre informatie si data , ca deosebire dintre obiect si modelul sau.

Finalitatea procesului de informare presupune trecerea de la structura la sens, adica de la nivelul sintactic la cel semantic.

Sub aspect semantic, informatia poate fi caracterizata ca semnificatie a datelor. Sensul informatiei la nivel semantic este corespondenta dintre o data, pe de o parte, si obiectul real sau situatia pe care o reprezinta, pe de alta parte.

Nivelul cel mai concret de considerarea a informatiei este insa cel pragmatic, singurul care raporteaza informatia la scopurile observatorului.

Prin tipul unei date se precizeaza multimea valorilor pe care le poate lua data si operatiile care se pot efectua asupra ei. Este o caracteristica a fiecarui limbaj de prelucrare a datelor, dar in general datele pot fi de: tipuri simple sau nestructurate: numerice, caracter, logice sau de tipuri structurate: statice (tablouri, articol, multime, fisiere), sau dinamice (liste, arbori).

1.2 Structuri de date

De cele mai multe ori, in aplicatii, datele se reprezinta sub forma unor multimi sau colectii, iar prelucrarea lor nu poate fi conceputa fara o organizare corespunzatoare.

O colectie de date pe care s-a definit o structura ( adica un anumit mod de ordonare pentru a facilita prelucrarea datelor), careia ii este specific un anumit mecanism de selectie si identificare a componentelor, constituie o STRUCTURA DE DATE.

Structura de date poate fi creata pentru memoria interna sau pentru un suport extern. Exista structuri interne (pentru date temporare) sau structuri externe (fisiere, baze de date) pentru datele cu caracter permanent sau de mai lunga durata.

*** Consideratii privind definirea structurilor de date:

Definirea structurilor de date necesare intr-o aplicatie este o activitate complexa care conditioneaza in mare masura eficienta prelucrarii. Pentru realizarea ei trebuie sa se tina seama de o serie de factori:

? Volumul datelor;

? Operatiile de prelucrare si frecventa lor;

? Indicele de activitate se defineste ca raport intre numerele de componente ale structurii utilizate intr-o operatie si numar de componente explorate pentru aceasta operatie;

? Durata de viata a structurii;