Urmatorul pas in evolutia Internetului va fi Web Semantic (Web 3.0), tehnologie ce ofera computerelor posibilitatea de a procesa intelesul paginilor web.
O astfel de tehnologie este folosita si in cadrul retelei de interes Twine, lansata in august 2008, al carei fondator este Nova Spivack.
Twine ofera posibilitatea crearii unor comunitati inteligente care au in comun anumite sfere de interes si care discuta, colaboreaza in scopul gasirii, organizarii, dezvoltarii informatiei referitoare la diverse domenii stiintifice.
Fiecare domeniu are asociat un twine, o unitate de organizare a informatiei sub forma unor bookmarks.
Pe masura ce fiecare utilizator isi defineste sfera de interes, prin colectionarea de twine-uri, sistemul ii recomanda domenii conexe de interes sau membri interesati de aceleasi subiecte.
So let's interTwine ;)
Printre bookmark-urile de pe Twine se regaseste si o prezentare sustinuta de Nova Spivack la conferinta internationala GRID|08.
Cateva din subiectele prezentate:
- Comparatie intre conectivitatea internet-ului si cea a creierului
- Analiza si evolutia media(digital ink)
- Evolutia web [Web 1.0, Web 2.0(Social Web), Web 3.0 (Semantic Web), Web OS (Web-ul devine un sistem de operare, procesare si storage in internet), Intelligent Web (evolutia software-ului ce poate procesa inteligent pe baza tehnologiilor semantic web, fara a folosi tehnici de inteligenta artificiala) ]
- "The one machine" = Internet+people, avand ca software WWW
- Tehnologii de realitate virtuala
- Tehnologii de realitate augmentata
- Realizarea exoskeleton-ului (tehnologiile devin componente ale corpului uman), un costum ce se va putea conecta la internet, analiza anumiti stimuli, transmite si receptiona informatii
- Crearea colaborativa a realitatilor 3d, virtuale
Here's to innovation !
Ce este Bigtable?
-Bigtable e un sistem de stocare distribuit pentru a gestiona date structurate (de ordinul Petabyte - 1015)
-Este folosit de Google pentru Google Earth, Google Finance
-Solutie simpla, flexibila, de inalta performanta
Cum functioneaza Bigtable?
-Bigtable e o harta (map) multi-dimensionala, sortata, distribuita si rara
-Indexarea se face dupa o cheie de linie, o cheie de coloana si o informatie de timp (timestamp)
-Fiecare valoare a Bigtable este de fapt un vector neinterpretat de bytes
-Interfata de programare (API) a Bigtable are functiile de creare, stergere tabele si familii de coloane. Are functii de schimbare de cluster, tabele, drepturi de acces, iar aplicatiile clientilor pot scrie sau sterge date din Bigtable.
-Pentru adresare se foloseste o ierarhie pe 3 niveluri, analoaga cu cea folosita la arborii B+ : primul nivel e un fisier care contine locatia Radacinii – tot o tabela. Tabela Radacina contine locatia tuturor celorlalte tabele legate de ea, intr-o tabela speciala METADATA. Fiecare rand din METADATA stocheaza 1 KB de memorie. Cu o limita de 128 MB la tabelele METADATA, sistemul de stocare pe 3 niveluri poate adresa 261 bytes.
Comparatii cu alte tehnologii
-S-a folosit un cluster Bigtable cu N servere si tabele pentru a demonstra scalabilitatea si performanta, cand N variaza date (WWW05, SIGIR05, WePS), folosite si inainte pt a putea face comparatii
-Serverele, masterul, clientii de test si serverele GFS (Google File System) au rulat pe acelasi set de masini
-rezultatele obtinute atunci cand se folosesc simultan mai multe tabele sunt f bune, dat fiind numarul mare de tabele utilizat
-Rezultatul agregat (pentru dem scalabilitatii) creste cu un factor de 100 daca nr de servere din sistem creste de la 1 la 500
Labels: cluster, google earth
Insa cum ramane cu batranele browsere, acele aplicatii software ce ne faciliteaza, inca din 1991, interactiunea cu web-ul?
Desi luna martie a adus sfarsitul oficial al lui Netscape, anul 2008 a fost un an bun pentru evolutia browserelor. Pe langa versiuni noi ale unor browsere consacrate (Firefox 3, Opera 9.5, Internet Explorer 8 Beta), 2008 a ridicat cortina pentru unul nou-nout : Google Chrome.
Iata o scurta retrospectiva a ceea ce s-a intamplat in 2008 in sfera browserelor web:
Mozilla a lansat Firefox 3 pe 17 iunie printr-o campanie inedita, Download Day, inregistrand peste 8 milioane de downloaduri
in primele 24 de ore si intrand astfel in cartea recordurilor. Pe langa doborarea de recorduri, Firefox 3 aduce o serie de imbunatatiri importante precum bara de adrese inteligenta, managerul de parole, o varianta mult mai comoda de bookmarking (printr-un singur click) si un mecanism de identificare si validare a site-urilor. Firefox 3 se mai lauda si cu o performanta sporita, incarcand paginile mai rapid si cu un consum de memorie mai scazut decat predecesorul sau.Opera 9.5 a fost lansat tot
Windows Internet Explorer 8 este viitoarea
versiune a browserului de la Microsoft, versiunile beta ale acestuia fiind lansate in martie (cea pentru dezvoltatori) si in august (destinata utilizatorilor). Lansarea oficiala este programata pentru primul trimestru al anului viitor. Printre imbunatatirile cu care vine IE8 se numara: InPrivate, ce permite utilizatorilor sa navigheze fara ca browserul sa retina informatii despre activitatea lor online, accesul rapid la diverse servicii web prin intermediul unor “acceleratori”, Web Slices, pentru a fi la curent cu modificarile aparute pe site-urile favorite, cautare cu sugestii si un filtru de protectie a datelor private.Google a intrat in forta pe piata browserelor in septembrie 2008, iar produsul acestora, Chrome, a reusit sa obtina peste 1%
din cota de piata in doar trei luni de la lansare. Noul browser de la Google vine cu o interfata minimalista, insa intuitiva si usor de utilizat.Printre facilitatile interesante ale lui Chrome putem enumera: bara multifunctionala pentru adrese si cautare, tab-uri dinamice si independente unul de celalalt, bookmarkuri rapide, mod de navigare incognito si protectie impotriva phishingului si a altor tipuri de atacuri.
Adio Netscape! Bun venit Flock! Pe pagina oficiala a defunctului Netscape ni se recomanda, pe langa Firefox, un browser mai putin cunoscut, orientat pe retele sociale si multimedia,
Flock. Acest browser se bazeaza pe tehnologia Mozilla Firefox si ofera facilitati Web 2.0 integrate in interfata grafica. Criticat de unii ca fiind greoi si instabil, Flock este sustinut de o comunitate destul de mare de utilizatori care considera interfata destul de complexa a acestuia ca principal avantaj al noului browser.Flock 2.0 a fost lansat in octombrie 2008 si include, printe altele, feed reader, un editor de blog, o bara media, sharing multimedia integrat si suport pentru extensii.Ce urmeaza? Cei de la Apple pregatesc o noua versiune pentru browserul lor, Safari 4. O versiune alfa pentru Opera 10 este, de asemenea disponibila.
Download-uri gratuite:
Labels: 2008, web browser, www
Se pune problema gasirii eficiente/rapide a perechilor intrebare – raspuns pe forumuri astfel se propune o clasificare bazata pe modele recurente pentru gasirea intrebarilor si o metoda de propagare de tip graf pentru gasirea raspunsurilor.
Gasirea intrebarilor:
Gasirea tuturor intrebarilor dintr-un “fir” – thread de pe forum este o problema
ne – triviala. Metodele simple, bazate pe reguli (semnul intrebarii, cei 5 W si H, de la
how?) nu sunt suficiente. Metoda folosita se bazeaza pe clasificare si detecteaza
intrebarile folosind tipare secventiale extrase automat din propozitii care sunt si
propozitii care nu sunt intrebari de pe forumuri.
Gasirea raspunsurilor:
Pentru a modela legatura dintre raspunsurile candidate s-au folosit grafurile. Relatia dintre raspunsuri formeaza un graf, luand in considerare 3 factori (probabilitatea ca limbajul folosit intr-un raspuns candidat sa fi generat alt raspuns candidat, distanta intre intrebare si raspunsul candidat, si autoritatea celui care raspunde – un instrument specific forumurilor). Pentru fiecare raspuns candidat, se calculeaza initial un scor, printr-o metoda de ierarhizare.
Pentru calculul scorului final se pot folosi doua metode:
- Invatare nesupervizata, cand scorul initial este folosit dupa propagare
- Invatare supervizata, cand scorul initial este folosit in procesul de propagare
Teste
- Au fost selectate 3 forumuri pentru a face testele (primul cu 1.212.153 fire – TripAdvisor, altul cu 86.772 fire – LonelyPlanet si al treilea cu 25.298 fire BootsnAll Network)
- S-au generat 2 seturi de date separate, si doua persoane au notat intrebarile si apoi au gasit raspunsurile corespunzatoare. Pentru intrebari gradul de corectitudine a fost 96 %, pentru intrebari si raspunsuri 69%.
- Pentru gasirea intrebarilor, metoda are rezultate mult mai bune decat alte metode folosite anterior.
- Pentru evaluarea gasirii raspunsurilor s-au folosit tot 3 metrici(MRR – Mean Reciprocal Rank, MAP – Mean Average Precision, P@1 - Precision at 1), iar rezultatele au aratat ca metoda ce utilizeaza graful este mai buna decat metodele anterioare, iar imbunatatirea este relevanta statistic
Labels: forum, invatare, semantic web
Web-ul Semantic reprezinta o dimensiune in dezvoltare a World Wide Web, orientata catre reprezentarea semantica a datelor, informatiilor si cunostintelor si avand drept scop imbunatatirea comunicarii dintre om si masina, precum si unificarea bazelor de cunostinte la nivel global.
O data cu avansul cercetarilor in domeniul web-ului semantic si al inteligentei artificiale, a aparut si necesitatea implementarii unui limbaj de definire a regulilor pentru web.
Labels: evolutia web, semantic web, tehnologii web, www
O noua abordare a Web People Search (cautare de persoane) a fost implementata, aceasta metoda fiind mut mai performanta decat cele existente .Se propune o metodologie de clasificare a aparitiilor numelor cu ajutorul careia se realizeaza clustere.
Deocamdata e destinata doar serverelor (doar o companie de web search ar putea sa o implementeze).
Algoritmul este urmatorul:
I.Se realizeaza o preprocesare cu numele din toate paginile web de pe server (se filtreaza cele ambigue si apoi se calculeaza factorul TF / IDF – term frequency / inverse document frequency pentru toate)
II.Se realizeaza clusterul in 2 pasi:
a)Fiecare pereche (di, dj) din multimea de nume care are factor TF/IDF suficient de apropiat va apartine unui cluster (TF/IDF > o valoare de prag gasita printr-un algoritm greedy)
b)Pentru perechile care n-au fost unite la pasul 1, se realizeaza o noua cautare pe web, astfel:
- se cauta legaturi ale celor 2 nume, prin organizatie sau prin numele cunostintelor comune
- se transforma aceste legaturi intr-un vector de caracteristici pentru fiecare nume
- cu ajutorul metodei de clasificare la limita de sus (skyline classification) se face o predictie daca cele nume trebuie unite sau nu
Algoritmul se sfarseste cand toate perechile relevante apartin unui cluster.
Se face afisarea clusterului gasit.
S-au folosit 3 seturi de date (WWW05, SIGIR05, WePS), folosite si inainte pt a putea face comparatii.
Comparatiile se fac intre metoda descrisa (skyline) si alte 2 metode, metoda unirii doar pe baza factorului TF/IDF (NE) si metoda ce cauta legaturi comune (WebDice).
Pentru skyline se obtin performante mult mai bune.
Acest lucru este posibil deoarece metoda considera dominanta unui anumit nume si in acelasi timp foloseste un algortim greedy pentru a regla foarte fin pragul de acceptare al unui anumit rezultat
Singura limitare a acestei metode este legata de eficienta (nu poate rula pe un client pentru ca e nevoie de foarte multe prelucrari; poate rula doar pe un server).
Labels: evolutia web, search, www
Ce este? Un add-on pentru Mozilla ce ofera posibilitatea de control a browser-ului folosind un anumit set de comenzi language-based.
Cui se adreseaza? Celor ce vor sa fie mai eficienti sau celor ce sunt pur si simplu comozi ;)
Versiune disponibila: 0.1.2 .
Directie dezvoltare: posibilitatea de interactiune cu browserul folosind atat combinatii de taste, comenzi languaged-based cat si comenzi vocale.
Se poate descarca de aici.
Pentru a intra in modul Ubiquity tastati Control + Space (Windows), Control+Alt+Space(Linux), Option+Space(Mac) si va aparea o interfata transparenta neagra.
Pentru a vedea lista de comenzi disponibile tastati: command-list
Exemple de comenzi Ubi:
- WIKIPEDIA(sau WI) termen de cautare IN language
wi interfete web in romanian
afiseaza in interfata Ubi un preview cu rezultatele cautarii
pentru a accesa pagina wikipedia tastati Enter
- EMAIL mesaj TO contact
trebuie sa aveti cont pe Gmail si sa fiti logati.
mesajul poate fi si o selectie din pagina curenta caz in care se inlocuieste cu THIS - MAP locatie
va aparea o harta reprezentand locatia aleasa
- DEFINE(sau def) termen (sau this[selectie])
va afisa definitia conform answers.com
Pentru a iesi din modul Ubi: Esc.
Se pot adauga noi comenzi Ubiquity:
se acceseaza editorul de comenzi: command-editor si se introduce cod in Javascript.
Mai multe informatii in tutorial
Enter Ubiquity
Labels: control (+ space), eficienta, mozilla, ubiquity