Saturday, January 10, 2009

RwEbVolution

Urmatorul pas in evolutia Internetului va fi Web Semantic (Web 3.0), tehnologie ce ofera computerelor posibilitatea de a procesa intelesul paginilor web.

O astfel de tehnologie este folosita si in cadrul retelei de interes Twine, lansata in august 2008, al carei fondator este Nova Spivack.

Twine ofera posibilitatea crearii unor comunitati inteligente care au in comun anumite sfere de interes si care discuta, colaboreaza in scopul gasirii, organizarii, dezvoltarii informatiei referitoare la diverse domenii stiintifice.

Fiecare domeniu are asociat un twine, o unitate de organizare a informatiei sub forma unor bookmarks. 

Pe masura ce fiecare utilizator isi defineste sfera de interes, prin colectionarea de twine-uri, sistemul ii recomanda domenii conexe de interes sau membri interesati de aceleasi subiecte.

So let's interTwine ;)

Printre bookmark-urile de pe Twine se regaseste si o prezentare sustinuta de Nova Spivack la conferinta internationala GRID|08. 

Reprezinta una dintre cele mai bune bune prezentari pe care le-am vazut, fapt ce se datoreaza in principal calitatii informatiei, cantitatii de informatie utila/fraza  /slide, dar si viziunii exponentului.

Cateva din subiectele prezentate:
  • Comparatie intre conectivitatea internet-ului si cea a creierului
  • Analiza si evolutia media(digital ink)  
  • Evolutia web [Web 1.0, Web 2.0(Social Web), Web 3.0 (Semantic Web), Web OS (Web-ul devine un sistem de operare, procesare si storage in internet), Intelligent Web (evolutia software-ului ce poate procesa inteligent pe baza tehnologiilor semantic web, fara a folosi tehnici de inteligenta artificiala) ]
  • "The one machine" = Internet+people, avand ca software WWW
  • Tehnologii de realitate virtuala
  • Tehnologii de realitate augmentata
  • Realizarea exoskeleton-ului (tehnologiile devin componente ale corpului uman), un costum ce se va putea conecta la internet, analiza anumiti stimuli, transmite si receptiona informatii
  • Crearea colaborativa a realitatilor 3d, virtuale

Here's to innovation !


Saturday, January 3, 2009

BIGTABLE-folosit de GOOGLE EARTH

Ce este Bigtable?

-Bigtable e un sistem de stocare distribuit pentru a gestiona date structurate (de ordinul Petabyte - 1015)

-Este folosit de Google pentru Google Earth, Google Finance

-Solutie simpla, flexibila, de inalta performanta


Cum functioneaza Bigtable?


-Bigtable e o harta (map) multi-dimensionala, sortata, distribuita si rara

-Indexarea se face dupa o cheie de linie, o cheie de coloana si o informatie de timp (timestamp)

-Fiecare valoare a Bigtable este de fapt un vector neinterpretat de bytes

-Interfata de programare (API) a Bigtable are functiile de creare, stergere tabele si familii de coloane. Are functii de schimbare de cluster, tabele, drepturi de acces, iar aplicatiile clientilor pot scrie sau sterge date din Bigtable.

-Pentru adresare se foloseste o ierarhie pe 3 niveluri, analoaga cu cea folosita la arborii B+ : primul nivel e un fisier care contine locatia Radacinii – tot o tabela. Tabela Radacina contine locatia tuturor celorlalte tabele legate de ea, intr-o tabela speciala METADATA. Fiecare rand din METADATA stocheaza 1 KB de memorie. Cu o limita de 128 MB la tabelele METADATA, sistemul de stocare pe 3 niveluri poate adresa 261 bytes.


Comparatii cu alte tehnologii

-S-a folosit un cluster Bigtable cu N servere si tabele pentru a demonstra scalabilitatea si performanta, cand N variaza date (WWW05, SIGIR05, WePS), folosite si inainte pt a putea face comparatii

-Serverele, masterul, clientii de test si serverele GFS (Google File System) au rulat pe acelasi set de masini

-rezultatele obtinute atunci cand se folosesc simultan mai multe tabele sunt f bune, dat fiind numarul mare de tabele utilizat

-Rezultatul agregat (pentru dem scalabilitatii) creste cu un factor de 100 daca nr de servere din sistem creste de la 1 la 500

Tuesday, December 30, 2008

Browser Wars 2008

In plina “era” Web 2.0, auzim vorbindu-se tot mai mult despre evolutie in ceea ce priveste World Wide Web.
Insa cum ramane cu batranele browsere, acele aplicatii software ce ne faciliteaza, inca din 1991, interactiunea cu web-ul?

Desi luna martie a adus sfarsitul oficial al lui Netscape, anul 2008 a fost un an bun pentru evolutia browserelor. Pe langa versiuni noi ale unor browsere consacrate (Firefox 3, Opera 9.5, Internet Explorer 8 Beta), 2008 a ridicat cortina pentru unul nou-nout : Google Chrome.

Iata o scurta retrospectiva a ceea ce s-a intamplat in 2008 in sfera browserelor web:


Mozilla a lansat Firefox 3 pe 17 iunie printr-o campanie inedita, Download Day, inregistrand peste 8 milioane de downloaduri in primele 24 de ore si intrand astfel in cartea recordurilor. Pe langa doborarea de recorduri, Firefox 3 aduce o serie de imbunatatiri importante precum bara de adrese inteligenta, managerul de parole, o varianta mult mai comoda de bookmarking (printr-un singur click) si un mecanism de identificare si validare a site-urilor. Firefox 3 se mai lauda si cu o performanta sporita, incarcand paginile mai rapid si cu un consum de memorie mai scazut decat predecesorul sau.

Opera 9.5 a fost lansat tot in iunie, imbunatatindu-si viteza si oferind utilizatorilor noi facilitati, precum cautarea rapida a site-urilor vizitate, serviciul online de sincronizare Opera Link, client pentru BitTorrent incorporat, client de e-mail, protectie impotriva fraudei online si altele. Noua versiune Opera include si o versiune de test pentru o noua unealta, Opera Dragonfly, destinata dezvoltatorilor web. Recent a aparut un upgrade important, Opera 9.6, o versiune imbunatatita ce include si un feed reader, restul facilitatilor ramanand aceleasi de la 9.5.

Windows Internet Explorer 8 este viitoarea versiune a browserului de la Microsoft, versiunile beta ale acestuia fiind lansate in martie (cea pentru dezvoltatori) si in august (destinata utilizatorilor). Lansarea oficiala este programata pentru primul trimestru al anului viitor. Printre imbunatatirile cu care vine IE8 se numara: InPrivate, ce permite utilizatorilor sa navigheze fara ca browserul sa retina informatii despre activitatea lor online, accesul rapid la diverse servicii web prin intermediul unor “acceleratori”, Web Slices, pentru a fi la curent cu modificarile aparute pe site-urile favorite, cautare cu sugestii si un filtru de protectie a datelor private.

Google a intrat in forta pe piata browserelor in septembrie 2008, iar produsul acestora, Chrome, a reusit sa obtina peste 1% din cota de piata in doar trei luni de la lansare. Noul browser de la Google vine cu o interfata minimalista, insa intuitiva si usor de utilizat.
Printre facilitatile interesante ale lui Chrome putem enumera: bara multifunctionala pentru adrese si cautare, tab-uri dinamice si independente unul de celalalt, bookmarkuri rapide, mod de navigare incognito si protectie impotriva phishingului si a altor tipuri de atacuri.

Adio Netscape! Bun venit Flock! Pe pagina oficiala a defunctului Netscape ni se recomanda, pe langa Firefox, un browser mai putin cunoscut, orientat pe retele sociale si multimedia, Flock. Acest browser se bazeaza pe tehnologia Mozilla Firefox si ofera facilitati Web 2.0 integrate in interfata grafica. Criticat de unii ca fiind greoi si instabil, Flock este sustinut de o comunitate destul de mare de utilizatori care considera interfata destul de complexa a acestuia ca principal avantaj al noului browser.Flock 2.0 a fost lansat in octombrie 2008 si include, printe altele, feed reader, un editor de blog, o bara media, sharing multimedia integrat si suport pentru extensii.

Ce urmeaza? Cei de la Apple pregatesc o noua versiune pentru browserul lor, Safari 4. O versiune alfa pentru Opera 10 este, de asemenea disponibila.

Download-uri gratuite:

Tuesday, December 23, 2008

PERECHI INTREBARE – RASPUNS PE FORUMURI

Se pune problema gasirii eficiente/rapide a perechilor intrebare – raspuns pe forumuri astfel se propune o clasificare bazata pe modele recurente pentru gasirea intrebarilor si o metoda de propagare de tip graf pentru gasirea raspunsurilor.


Gasirea intrebarilor:
Gasirea tuturor intrebarilor dintr-un “fir” – thread de pe forum este o problema
ne – triviala. Metodele simple, bazate pe reguli (semnul intrebarii, cei 5 W si H, de la
how?) nu sunt suficiente. Metoda folosita se bazeaza pe clasificare si detecteaza
intrebarile folosind tipare secventiale extrase automat din propozitii care sunt si
propozitii care nu sunt intrebari de pe forumuri.

Gasirea raspunsurilor:
Pentru a modela legatura dintre raspunsurile candidate s-au folosit grafurile. Relatia dintre raspunsuri formeaza un graf, luand in considerare 3 factori (probabilitatea ca limbajul folosit intr-un raspuns candidat sa fi generat alt raspuns candidat, distanta intre intrebare si raspunsul candidat, si autoritatea celui care raspunde – un instrument specific forumurilor). Pentru fiecare raspuns candidat, se calculeaza initial un scor, printr-o metoda de ierarhizare.
Pentru calculul scorului final se pot folosi doua metode:

  1. Invatare nesupervizata, cand scorul initial este folosit dupa propagare
  2. Invatare supervizata, cand scorul initial este folosit in procesul de propagare

Teste
- Au fost selectate 3 forumuri pentru a face testele (primul cu 1.212.153 fire – TripAdvisor, altul cu 86.772 fire – LonelyPlanet si al treilea cu 25.298 fire BootsnAll Network)
- S-au generat 2 seturi de date separate, si doua persoane au notat intrebarile si apoi au gasit raspunsurile corespunzatoare. Pentru intrebari gradul de corectitudine a fost 96 %, pentru intrebari si raspunsuri 69%.
- Pentru gasirea intrebarilor, metoda are rezultate mult mai bune decat alte metode folosite anterior.
- Pentru evaluarea gasirii raspunsurilor s-au folosit tot 3 metrici(MRR – Mean Reciprocal Rank, MAP – Mean Average Precision, P@1 - Precision at 1), iar rezultatele au aratat ca metoda ce utilizeaza graful este mai buna decat metodele anterioare, iar imbunatatirea este relevanta statistic

Monday, December 15, 2008

Limbaje de reprezentare a regulilor in Web-ul Semantic

Web-ul Semantic reprezinta o dimensiune in dezvoltare a World Wide Web, orientata catre reprezentarea semantica a datelor, informatiilor si cunostintelor si avand drept scop imbunatatirea comunicarii dintre om si masina, precum si unificarea bazelor de cunostinte la nivel global.

O data cu avansul cercetarilor in domeniul web-ului semantic si al inteligentei artificiale, a aparut si necesitatea implementarii unui limbaj de definire a regulilor pentru web.

Afla mai mult pe site...

Friday, December 12, 2008

WEB PEOPLE SEARCH

O noua abordare a Web People Search (cautare de persoane) a fost implementata, aceasta metoda fiind mut mai performanta decat cele existente .Se propune o metodologie de clasificare a aparitiilor numelor cu ajutorul careia se realizeaza clustere.
Deocamdata e destinata doar serverelor (doar o companie de web search ar putea sa o implementeze).

Algoritmul este urmatorul:


I.Se realizeaza o preprocesare cu numele din toate paginile web de pe server (se filtreaza cele ambigue si apoi se calculeaza factorul TF / IDF – term frequency / inverse document frequency pentru toate)

II.Se realizeaza clusterul in 2 pasi:


a)Fiecare pereche (di, dj) din multimea de nume care are factor TF/IDF suficient de apropiat va apartine unui cluster (TF/IDF > o valoare de prag gasita printr-un algoritm greedy)


b)Pentru perechile care n-au fost unite la pasul 1, se realizeaza o noua cautare pe web, astfel:

- se cauta legaturi ale celor 2 nume, prin organizatie sau prin numele cunostintelor comune

- se transforma aceste legaturi intr-un vector de caracteristici pentru fiecare nume

- cu ajutorul metodei de clasificare la limita de sus (skyline classification) se face o predictie daca cele nume trebuie unite sau nu

Algoritmul se sfarseste cand toate perechile relevante apartin unui cluster.

Se face afisarea clusterului gasit.

S-au folosit 3 seturi de date (WWW05, SIGIR05, WePS), folosite si inainte pt a putea face comparatii.

Comparatiile se fac intre metoda descrisa (skyline) si alte 2 metode, metoda unirii doar pe baza factorului TF/IDF (NE) si metoda ce cauta legaturi comune (WebDice).
Pentru skyline se obtin performante mult mai bune.

Acest lucru este posibil deoarece metoda considera dominanta unui anumit nume si in acelasi timp foloseste un algortim greedy pentru a regla foarte fin pragul de acceptare al unui anumit rezultat
Singura limitare a acestei metode este legata de eficienta (nu poate rula pe un client pentru ca e nevoie de foarte multe prelucrari; poate rula doar pe un server).


Wednesday, December 3, 2008

Ubiquity


Ce este? Un add-on pentru Mozilla ce ofera posibilitatea de control a browser-ului folosind un anumit set de comenzi language-based.

Cui se adreseaza? Celor ce vor sa fie mai eficienti sau celor ce sunt pur si simplu comozi ;)

Versiune disponibila: 0.1.2 .

Directie dezvoltare: posibilitatea de interactiune cu browserul folosind atat combinatii de taste, comenzi languaged-based cat si comenzi vocale.

Se poate descarca de aici.

Pentru a intra in modul Ubiquity tastati Control + Space (Windows), Control+Alt+Space(Linux), Option+Space(Mac) si va aparea o interfata transparenta neagra.

Pentru a vedea lista de comenzi disponibile tastati: command-list

Exemple de comenzi Ubi:

  • WIKIPEDIA(sau WI) termen de cautare IN language
    wi interfete web in romanian
    afiseaza in interfata Ubi un preview cu rezultatele cautarii
    pentru a accesa pagina wikipedia tastati Enter

  • EMAIL mesaj TO contact
    trebuie sa aveti cont pe Gmail si sa fiti logati.
    mesajul poate fi si o selectie din pagina curenta caz in care se inlocuieste cu THIS

  • MAP locatie
    va aparea o harta reprezentand locatia aleasa

  • DEFINE(sau def) termen (sau this[selectie])
    va afisa definitia conform answers.com

 
Pentru a iesi din modul Ubi: Esc.

Se pot adauga noi comenzi Ubiquity:
se acceseaza editorul de comenzi: command-editor si se introduce cod in Javascript.

Mai multe informatii in tutorial

Enter Ubiquity

Older Posts

 
SEO Romania Design