Nov 10 2019
Baze de date statistice
Postat de licenteoriginale • In Informatica, Matematica
Cuprins
Aceasta lucrare poate fi descarcata doar daca ai statut PREMIUM si are scop consultativ. Pentru a descarca aceasta lucrare trebuie sa fii utilizator inregistrat.
Extras din document
CuprinsASPECTE TEORETICE RELATIV LA ORGANIZAREA SI PRELUCRAREA INFORMATIILOR
C A P I T O L U L I
I. Organizarea logica a datelor.
1.1 Informatii, date, tipuri de date.
1.2 Structuri de date
1.3 Evolutia metodelor si tehnicilor de organizare a datelor
1.4 Organizarea datelor in baze de date
1.4.1 Definitie
1.4.2 Terminologie
1.4.3 Niveluri de organizare a datelor in baze de date
1.4.4 Limbaje pentru baze de date
1.5 Obiectivele sistemelor de gestionare a bazelor de date .
1.6 Componentele unui SGBD
1.7 Evolutia sistemelor de gestionare a bazelor de date
1.7.1 Diagrama entitate-relatie
1.7.2 Modelul relational
1.7.3 Operatorii modelului relational
1.7.4 Limbaje pentru manipularea datelor relationale
Alte date
?{p}?
ASPECTE TEORETICE RELATIV LA ORGANIZAREA SI PRELUCRAREA INFORMATIILOR
C A P I T O L U L I
I. Organizarea logica a datelor.
1.1 Informatii, date, tipuri de date.
Informatia, este, alaturi de materie si energie, o notiune de larga generalizare filozofica si reprezinta reflectarea in constiinta noastra a legaturilor cauza-efect din lumea reala inconjuratoare.
Pentru utilizarea corecta a notiunii de informatie trebuie scoasa in evidenta distinctia intre fenomenele lumii reale, informatiile despre aceste fenomene si reprezentarea ca date a informatiilor corespunzatoare.
Informatia este un mesaj cu caracter de noutate despre evenimentele care au avut, au sau vor avea loc in interiorul sau exteriorul sistemului natural sau social. Prin urmare, informatia defineste elementele noi pe care le contine semnificatia unui simbol sau grup de simboluri (mesaje verbale sau scrise, semnale de natura tehnica, economica, etc.) cu ajutorul carora se comunica date referitoare la anumite evenimente, stari sau actiuni ale sistemului considerat. Presupunand ca pentru un sistem oarecare exista o multime de stari posibile la fel de probabile, lucru care genereaza o nedeterminare a starilor, primirea informatiei despre una sau mai multe stari, dar nu despre toate, face ca nedeterminarea sa fie inlaturata intr-o oarecare masura.
Masura care caracterizeaza inlaturarea nedeterminarii se numeste cantitatea de informatii, iar masura cantitatii de informatii se exprima prin categoria de entropie, definita prin relatia:
H(A) = H(p1, p2, …….., pn)
(1)
unde: p1, p2, …….., pn reprezinta probabilitatile rezultatelor
a1, a2, ……….., an in care se concretizeaza experimentul A.
Expresia matematica a lui H a fost data pentru prima data in anul 1448 de C.E. Shannon, astfel:
H(p1, p2, …….., pn) = -? pkxlogbpk (2)
Daca baza logaritmului, b, se alege egala cu 2 inseamna ca avem de-a face cu un experiment ce contine doua evenimente echiprobabile (p1 = p2 = ˝ ). In acest caz, unitatea de masura a nedeterminarii se numeste unitate diadica, binara sau bit (cifra binara = binary digit).
In tara noastra, academicianul Octav Onicescu a observat ca pentru scopurile pur statistice se poate pastra ca informatie probabilitatea insasi si nu logaritmul ei. Cu alte cuvinte, se poate considera ca informatie medie expresia (3) numita si energie informationala, pe baza careia a fost creata o disciplina noua, anume statistica informationala.
E =
Informatia este caracterizata, in general, de urmatoarele trei niveluri: sintactic, semantic si pragmatic.
Nivelul sintactic se refera la sistemul de semne si la regulile de reunire a acestora in constructii sintactice utilizate pentru prezentarea informatiilor in procesul culegerii, transmiterii si prelucrarii acestora. Acestui nivel ii corespunde conceptul de data, concept central in informatica, exprimat prin formula BNF (Backus – Naur Form) astfel:
: : =
(entitate)
Cu alte cuvinte o informatie este o triada a elementelor: entitate, atribut, valoare. Entitatea formeaza obiectul informatiei. Atributul (sau caracteristica) este elementul de descriere a entitatii respective, caracterul sau o proprietate a acesteia. Valoarea este o masura a proprietatii sau atributului asociat. De exemplu, informatia despre rezultatului unui concurs se poate reprezenta astfel: entitatea “concurent”, atributul “rezultate”, iar valoarea “admis”.
O entitate se caracterizeaza de obicei prin mai multe proprietati, avand astfel asociate mai multe atribute si valorile lor. Se impune, cu necesitate, caracterizarea completa a entitatii, prin toate atributele sale. De exemplu, entitatea “concurent” nu poate sa nu aiba atributul “nume – concurent”; sau daca pentru entitatea “drapele nationale” s-ar preciza numai atributul “ culoare”, ar fi incomplet definit, stiind ca mai multe drapele au aceleasi culori, ar trebui sa adaugam atributul “model”.
Datele constituie materializarea, reprezentarea simbolica a informatiilor (prin semne, litere, cifre) intr-o forma conventionala (scrisa, vorbita, luminoasa, semne grafice, desene), convenabila unei comunicari.
Apare astfel clara distinctia intre informatie si data , ca deosebire dintre obiect si modelul sau.
Finalitatea procesului de informare presupune trecerea de la structura la sens, adica de la nivelul sintactic la cel semantic.
Sub aspect semantic, informatia poate fi caracterizata ca semnificatie a datelor. Sensul informatiei la nivel semantic este corespondenta dintre o data, pe de o parte, si obiectul real sau situatia pe care o reprezinta, pe de alta parte.
Nivelul cel mai concret de considerarea a informatiei este insa cel pragmatic, singurul care raporteaza informatia la scopurile observatorului.
Prin tipul unei date se precizeaza multimea valorilor pe care le poate lua data si operatiile care se pot efectua asupra ei. Este o caracteristica a fiecarui limbaj de prelucrare a datelor, dar in general datele pot fi de: tipuri simple sau nestructurate: numerice, caracter, logice sau de tipuri structurate: statice (tablouri, articol, multime, fisiere), sau dinamice (liste, arbori).
1.2 Structuri de date
De cele mai multe ori, in aplicatii, datele se reprezinta sub forma unor multimi sau colectii, iar prelucrarea lor nu poate fi conceputa fara o organizare corespunzatoare.
O colectie de date pe care s-a definit o structura ( adica un anumit mod de ordonare pentru a facilita prelucrarea datelor), careia ii este specific un anumit mecanism de selectie si identificare a componentelor, constituie o STRUCTURA DE DATE.
Structura de date poate fi creata pentru memoria interna sau pentru un suport extern. Exista structuri interne (pentru date temporare) sau structuri externe (fisiere, baze de date) pentru datele cu caracter permanent sau de mai lunga durata.
*** Consideratii privind definirea structurilor de date:
Definirea structurilor de date necesare intr-o aplicatie este o activitate complexa care conditioneaza in mare masura eficienta prelucrarii. Pentru realizarea ei trebuie sa se tina seama de o serie de factori:
? Volumul datelor;
? Operatiile de prelucrare si frecventa lor;
? Indicele de activitate se defineste ca raport intre numerele de componente ale structurii utilizate intr-o operatie si numar de componente explorate pentru aceasta operatie;
? Durata de viata a structurii;
Documente similare
· Baze de date statistice· Baze de date.doc
· Aplicatii ale XML in baze de date
· Baze de date in mediul Web
· Sisteme de baze de date distribuite
· Managemantul tranzactiilor in baze de date relationale
· Interconectarea aplicatiilor office cu baze de date
· Baze de date spatiale. Definirea unei aplicatii GIS
· Forme normale in baze de date orientate obiect
· Accesul unei baze de date folosind tehnologia ASP