Jaka naprawdę jest sieć WWW?
15.10.2008 15:01, aktual.: 15.10.2008 15:22
Zalogowani mogą więcej
Możesz zapisać ten artykuł na później. Znajdziesz go potem na swoim koncie użytkownika
Opera Software zakończyła pierwszy etap prac nad swoją, unikalną w skali światowej, wyszukiwarką internetową. Gdy zostanie ona udostępniona publicznie, co ma nastąpić za kilka miesięcy, będzie nieocenioną pomocą dla producentów przeglądarek internetowych i webmasterów na całym świecie.
Po co komu jeszcze jedna wyszukiwarka, skoro w internecie funkcjonują ich setki? To prawda, ale wszystkie indeksują to samo: treść stron WWW. Opera Software proponuje coś zupełnie innego: wyszukiwarkę MAMA (Metadata Analysis and Mining Application), która indeksuje strukturę dokumentów HTML, tzn. używane tagi, odnośniki, style, skrypty, technologie.
Jak dotąd MAMA zindeksowała ok. 3,5 mln witryn internetowych i jest w stanie odpowiedzieć na pytania w rodzaju: jak wygląda struktura przeciętnej strony? na ilu stronach jest więcej niż sto linków? z ilu znaków składa się przeciętna strona? jak często używany jest styl _ font-size _ (lub dowolny inny)? jak popularny jest flash? na ilu stronach wykorzystywane są style CSS? jaki procent stron przechodzi walidację? ile stron zmusza przeglądarkę do przejścia w tryb Quirks? Dla producentów przeglądarek, webmasterów, programistów, a także dla organizacji wyznaczających standardy webowe (np. W3C) takie informacje są niekiedy na wagę złota.
MAMA pozwala uzyskać odpowiedzi na znacznie bardziej wyrafinowane pytania, np.: w którym kraju najczęściej używa się obiektu XMLHttpRequest, kluczowego dla technologii AJAX? Albo: gdzie na świecie istnieje tendencja spadkowa/wzrostowa jeśli chodzi o wykorzystanie flasha?
Na witrynie Opera Developer Community - http://dev.opera.com/articles/view/mama można się zapoznać z pierwszymi rezultatami działania wyszukiwarki MAMA. Mimo że powstały one w oparciu o analizę bardzo drobnego ułamka sieci WWW, w której na indeksację czekają miliardy stron, to już teraz na ich podstawie można wysnuć ciekawe wnioski. A będą one nieporównanie ciekawsze, gdy dzieło inżynierów z Opera Software zacznie działać na dobre i z miesiąca na miesiąc będzie obejmować swym zasięgiem coraz większe obszary internetu.