Wyszukiwanie w czasie rzeczywistym

Wyszukiwanie w czasie rzeczywistym
11.02.2010 09:00
Wyszukiwanie w czasie rzeczywistym
Źródło zdjęć: © PC World

Google potrafi już wyszukiwać informacje z Sieci w chwilę po ich opublikowaniu. W ślady giganta idą kolejne wyszukiwarki. Jak oceniają, co jest ważne, a co nie? I czy ktoś z tego skorzysta?

Eksperci nie mają wątpliwości: prędzej czy później wyszukiwanie w czasie rzeczywistym stanie się standardem. Z pozoru sprawa jest prosta: wystarczy szybciej docierać do nowych treści. W praktyce, zmiany sięgają głębiej.

Z perspektywy zwykłego użytkownika wyszukiwanie w czasie rzeczywistym objawia się w ten sposób, że po wpisaniu frazy w wyszukiwarkę otrzyma on wyniki wyszukiwania wzbogacone o fragmenty rozmów toczących się aktualnie w serwisach społecznościowych. Wyszukiwanie w czasie rzeczywistym (ang. real-time search) opiera się na założeniu, że internauci potrafią lepiej niż sztuczne algorytmy ocenić przydatność aktualnych informacji. Użytkownicy Sieci są więc wykorzystywani nie tylko do generowania treści, ale także do ich oceny.

288759754980145299
Źródło zdjęć: © (fot. PC World)

Załóżmy, że chcesz się dowiedzieć o tym, kto prowadzi w trwającym teraz meczu. Wpisujesz w wyszukiwarkę frazę "mecz Polska - Niemcy". Wyszukiwarka powinna znaleźć najnowsze wpisy z mikroblogów (np. Twitter, Śledzik) i serwisów społecznościowych oraz najświeższe artykuły z portali internetowych. Ważne jest to, co dzieje się tu i teraz, a nie odnośnik do Wikipedii.

Taką właśnie usługę oferuje od niedawna wyszukiwarka Google. Wciąż jest jeszcze ona rozwijana, ale możesz zobaczyć jej działanie na żywo, wchodząc na stronę Google Trends. Wpisz szukaną frazę w formularz u dołu strony (More Hot Topics), możesz też kliknąć jeden z listy gorących tematów (Hot Topics), w kolumnie po lewej stronie. Na liście z wynikami wyszukiwania pojawi się pole ze statusami z Twittera, wpisami z blogów i artykułami z serwisów informacyjnych. Uaktualniają się one automatycznie co sekundę, nie musisz odświeżać strony. I chociaż jest to tylko wycinek napływających w każdej chwili informacji, już po minucie ekran zapełniony jest nowymi wiadomościami.

Poza Twitterem, Google śledzi zasoby także innych liczących się serwisów społecznościowych: Facebooka, MySpace'a, http://www.friendfeed.com oraz mało znanego w Polsce Jaiku. Na razie przeszukiwane są tylko strony anglojęzyczne, ale z czasem można spodziewać się dodania także polskich serwisów.

Gdzie tu rewolucja? Przecież zamiast szeregować wyniki wyszukiwania po ich jakości, wystarczyłoby posortować je od najnowszych do najstarszych. To nie takie proste. Po pierwsze, nowe informacje muszą zostać pobrane z tysięcy serwerów, co nie odbywa się natychmiastowo. Po drugie, należy je w jakiś sposób filtrować, żeby wykluczyć spam. A jak ocenić jednozdaniowy wpis na mikroblogu, który ukazał się sekundę temu? Te dwa problemy udało się ostatnio rozwiązać. Skąd wziąć informacje

Obecnie wyszukiwarki czasu rzeczywistego śledzą głównie wiadomości z serwisów społecznościowych. Trudno jednak uznać te strony za jedyne źródła informacji. Co zrobić z tradycyjnymi stronami WWW? Sprawdzona od lat metoda polega na wypuszczeniu do Internetu botów, które co jakiś czas zaglądają do każdego serwisu i sprawdzają czy pojawiło się coś nowego. Nie jest to ani szybkie, ani skuteczne.

288759754980538515
Źródło zdjęć: © Collecta przeszukuje nie tylko tekst, ale również zdjęcia i zasoby wideo (fot. PC World)

Może więc zadziałać w drugą stronę - odpowiednia technologia już istnieje. Kiedy na stronie publikowana jest nowa wiadomość, jej czytelnicy są o tym informowanie za pośrednictwem kanałów RSS (Really Simple Syndication). Jedyne, czego potrzebują, to czytnik RSS. Nic nie stoi na przeszkodzie, aby te same informacje wysyłać bezpośrednio do wyszukiwarki.

Jako że każda informacja pochodząca z kanału RSS oznaczona jest datą publikacji, idealnie nadaje się do umieszczenia w aktualnych wynikach wyszukiwania. Wiele wskazuje na to, że Google mogłoby wdrożyć taką funkcję. Firma ta jest właścicielem serwisu Feedburner, masowo używanego przez twórców stron do publikacji kanałów RSS. Oznacza to, że zanim wiadomość o nowym wpisie na stronie WWW dotrze do czytelników, przechodzi przez serwery Google, a tym samym może zostać dodana do wyników wyszukiwania.

Jak oceniać, co jest ważne

Wiadomo skąd pobierać treści, ale jak rozpoznać te, które mają jakąkolwiek wartość? Tradycyjne strony WWW są przez wyszukiwarki internetowe oceniane po tym, jak dużo odnośników do nich prowadzi. Dla wpisów w serwisach społecznościowych za kryterium oceny służy to, ile osób śledzi danego użytkownika oraz kto oznaczył informację jako ciekawą albo dodał ją do ulubionych.

288759754980800659
Źródło zdjęć: © Monitter to narzędzie idealne do śledzenia wielu wątków jednocześnie (fot. PC World)

Jednak głosy internautów nie są sobie równe. Internetowi celebryci, których konta w serwisach Twitter lub Facebook śledzą tysiące osób, są bardziej wpływowi niż ktoś, kto zarejestrował się pięć minut temu. Oprócz uzyskanego rozgłosu, ważna jest również treść wiadomości. Aby odfiltrować spam, sprawdza się jak dużo tagów zostało użytych (zbyt wiele budzi podejrzenia) i czy odnoszą się do popularnych obecnie tematów. Komu zależy na czasie?

Real-time search sprawia niesamowite wrażenie, ale czy jest przydatne dla zwykłego internauty? Można założyć, że system poleceń stosowany w serwisach społecznościowych jest dobrym sposobem oceny jakości informacji. Również internauci obserwowani przez setki lub tysiące osób wydają się być wiarygodni.

288759754980997267
Źródło zdjęć: © Wyszukiwanie w czasie rzeczywistym w Google: w wynikach wyszukiwania wyświetlane są na bieżąco wiadomości z Twittera oraz innych serwisów społecznościowych (fot. PC World)

Problem w tym, że popularne informacje są z reguły kierowane do masowego odbiorcy. Witryny takie jak Digg czy Wykop pokazują, że za najlepsze uznawane są treści proste w odbiorze. Ocenianie na Twitterze artykułu dotyczącego biologii molekularnej nie ma wielkiego sensu, gdyż zwykły użytkownik nie jest w stanie stwierdzić, czy jest on wartościowy. Poza tym nie każda wiadomość musi być zaserwowana natychmiast. Nadal duża część informacji nie "przeterminuje się", jeśli zostanie dodana do wyników wyszukiwania po godzinie, a nie sekundzie.

Pozostaje tylko pytanie, jak często zwykły użytkownik będzie potrzebował tak aktualnych informacji? Można zaryzykować stwierdzenie, że real-time search sprawdzi się jako uzupełnienie działalności portali informacyjnych. Na pewno nie zastąpi całkowicie tradycyjnych wyszukiwarek.

Oceń jakość naszego artykułuTwoja opinia pozwala nam tworzyć lepsze treści.
Udostępnij:
Wybrane dla Ciebie
Komentarze (0)