Wyszukiwanie w czasie rzeczywistym

Wyszukiwanie w czasie rzeczywistym11.02.2010 09:00
Źródło zdjęć: © PC World

Google potrafi już wyszukiwać informacje z Sieci w chwilę po ich opublikowaniu. W ślady giganta idą kolejne wyszukiwarki. Jak oceniają, co jest ważne, a co nie? I czy ktoś z tego skorzysta?

Eksperci nie mają wątpliwości: prędzej czy później wyszukiwanie w czasie rzeczywistym stanie się standardem. Z pozoru sprawa jest prosta: wystarczy szybciej docierać do nowych treści. W praktyce, zmiany sięgają głębiej.

Z perspektywy zwykłego użytkownika wyszukiwanie w czasie rzeczywistym objawia się w ten sposób, że po wpisaniu frazy w wyszukiwarkę otrzyma on wyniki wyszukiwania wzbogacone o fragmenty rozmów toczących się aktualnie w serwisach społecznościowych. Wyszukiwanie w czasie rzeczywistym (ang. real-time search) opiera się na założeniu, że internauci potrafią lepiej niż sztuczne algorytmy ocenić przydatność aktualnych informacji. Użytkownicy Sieci są więc wykorzystywani nie tylko do generowania treści, ale także do ich oceny.

Źródło zdjęć: © (fot. PC World)
Źródło zdjęć: © (fot. PC World)

Załóżmy, że chcesz się dowiedzieć o tym, kto prowadzi w trwającym teraz meczu. Wpisujesz w wyszukiwarkę frazę "mecz Polska - Niemcy". Wyszukiwarka powinna znaleźć najnowsze wpisy z mikroblogów (np. Twitter, Śledzik) i serwisów społecznościowych oraz najświeższe artykuły z portali internetowych. Ważne jest to, co dzieje się tu i teraz, a nie odnośnik do Wikipedii.

Taką właśnie usługę oferuje od niedawna wyszukiwarka Google. Wciąż jest jeszcze ona rozwijana, ale możesz zobaczyć jej działanie na żywo, wchodząc na stronę Google Trends. Wpisz szukaną frazę w formularz u dołu strony (More Hot Topics), możesz też kliknąć jeden z listy gorących tematów (Hot Topics), w kolumnie po lewej stronie. Na liście z wynikami wyszukiwania pojawi się pole ze statusami z Twittera, wpisami z blogów i artykułami z serwisów informacyjnych. Uaktualniają się one automatycznie co sekundę, nie musisz odświeżać strony. I chociaż jest to tylko wycinek napływających w każdej chwili informacji, już po minucie ekran zapełniony jest nowymi wiadomościami.

Poza Twitterem, Google śledzi zasoby także innych liczących się serwisów społecznościowych: Facebooka, MySpace'a, http://www.friendfeed.com oraz mało znanego w Polsce Jaiku. Na razie przeszukiwane są tylko strony anglojęzyczne, ale z czasem można spodziewać się dodania także polskich serwisów.

Gdzie tu rewolucja? Przecież zamiast szeregować wyniki wyszukiwania po ich jakości, wystarczyłoby posortować je od najnowszych do najstarszych. To nie takie proste. Po pierwsze, nowe informacje muszą zostać pobrane z tysięcy serwerów, co nie odbywa się natychmiastowo. Po drugie, należy je w jakiś sposób filtrować, żeby wykluczyć spam. A jak ocenić jednozdaniowy wpis na mikroblogu, który ukazał się sekundę temu? Te dwa problemy udało się ostatnio rozwiązać. Skąd wziąć informacje

Obecnie wyszukiwarki czasu rzeczywistego śledzą głównie wiadomości z serwisów społecznościowych. Trudno jednak uznać te strony za jedyne źródła informacji. Co zrobić z tradycyjnymi stronami WWW? Sprawdzona od lat metoda polega na wypuszczeniu do Internetu botów, które co jakiś czas zaglądają do każdego serwisu i sprawdzają czy pojawiło się coś nowego. Nie jest to ani szybkie, ani skuteczne.

Źródło zdjęć: © Collecta przeszukuje nie tylko tekst, ale również zdjęcia i zasoby wideo (fot. PC World)
Źródło zdjęć: © Collecta przeszukuje nie tylko tekst, ale również zdjęcia i zasoby wideo (fot. PC World)

Może więc zadziałać w drugą stronę - odpowiednia technologia już istnieje. Kiedy na stronie publikowana jest nowa wiadomość, jej czytelnicy są o tym informowanie za pośrednictwem kanałów RSS (Really Simple Syndication). Jedyne, czego potrzebują, to czytnik RSS. Nic nie stoi na przeszkodzie, aby te same informacje wysyłać bezpośrednio do wyszukiwarki.

Jako że każda informacja pochodząca z kanału RSS oznaczona jest datą publikacji, idealnie nadaje się do umieszczenia w aktualnych wynikach wyszukiwania. Wiele wskazuje na to, że Google mogłoby wdrożyć taką funkcję. Firma ta jest właścicielem serwisu Feedburner, masowo używanego przez twórców stron do publikacji kanałów RSS. Oznacza to, że zanim wiadomość o nowym wpisie na stronie WWW dotrze do czytelników, przechodzi przez serwery Google, a tym samym może zostać dodana do wyników wyszukiwania.

Jak oceniać, co jest ważne

Wiadomo skąd pobierać treści, ale jak rozpoznać te, które mają jakąkolwiek wartość? Tradycyjne strony WWW są przez wyszukiwarki internetowe oceniane po tym, jak dużo odnośników do nich prowadzi. Dla wpisów w serwisach społecznościowych za kryterium oceny służy to, ile osób śledzi danego użytkownika oraz kto oznaczył informację jako ciekawą albo dodał ją do ulubionych.

Źródło zdjęć: © Monitter to narzędzie idealne do śledzenia wielu wątków jednocześnie (fot. PC World)
Źródło zdjęć: © Monitter to narzędzie idealne do śledzenia wielu wątków jednocześnie (fot. PC World)

Jednak głosy internautów nie są sobie równe. Internetowi celebryci, których konta w serwisach Twitter lub Facebook śledzą tysiące osób, są bardziej wpływowi niż ktoś, kto zarejestrował się pięć minut temu. Oprócz uzyskanego rozgłosu, ważna jest również treść wiadomości. Aby odfiltrować spam, sprawdza się jak dużo tagów zostało użytych (zbyt wiele budzi podejrzenia) i czy odnoszą się do popularnych obecnie tematów. Komu zależy na czasie?

Real-time search sprawia niesamowite wrażenie, ale czy jest przydatne dla zwykłego internauty? Można założyć, że system poleceń stosowany w serwisach społecznościowych jest dobrym sposobem oceny jakości informacji. Również internauci obserwowani przez setki lub tysiące osób wydają się być wiarygodni.

Źródło zdjęć: © Wyszukiwanie w czasie rzeczywistym w Google: w wynikach wyszukiwania wyświetlane są na bieżąco wiadomości z Twittera oraz innych serwisów społecznościowych (fot. PC World)
Źródło zdjęć: © Wyszukiwanie w czasie rzeczywistym w Google: w wynikach wyszukiwania wyświetlane są na bieżąco wiadomości z Twittera oraz innych serwisów społecznościowych (fot. PC World)

Problem w tym, że popularne informacje są z reguły kierowane do masowego odbiorcy. Witryny takie jak Digg czy Wykop pokazują, że za najlepsze uznawane są treści proste w odbiorze. Ocenianie na Twitterze artykułu dotyczącego biologii molekularnej nie ma wielkiego sensu, gdyż zwykły użytkownik nie jest w stanie stwierdzić, czy jest on wartościowy. Poza tym nie każda wiadomość musi być zaserwowana natychmiast. Nadal duża część informacji nie "przeterminuje się", jeśli zostanie dodana do wyników wyszukiwania po godzinie, a nie sekundzie.

Pozostaje tylko pytanie, jak często zwykły użytkownik będzie potrzebował tak aktualnych informacji? Można zaryzykować stwierdzenie, że real-time search sprawdzi się jako uzupełnienie działalności portali informacyjnych. Na pewno nie zastąpi całkowicie tradycyjnych wyszukiwarek.

Źródło artykułu:PC World Komputer
Szanowna Użytkowniczko! Szanowny Użytkowniku!
×
Aby dalej móc dostarczać coraz lepsze materiały redakcyjne i udostępniać coraz lepsze usługi, potrzebujemy zgody na dopasowanie treści marketingowych do Twojego zachowania. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności.

Kliknij "PRZECHODZĘ DO SERWISU" lub na symbol "X" w górnym rogu tej planszy, jeżeli zgadzasz się na przetwarzanie przez Wirtualną Polskę i naszych Zaufanych Partnerów Twoich danych osobowych, zbieranych w ramach korzystania przez Ciebie z usług, portali i serwisów internetowych Wirtualnej Polski (w tym danych zapisywanych w plikach cookies) w celach marketingowych realizowanych na zlecenie naszych Zaufanych Partnerów. Jeśli nie zgadzasz się na przetwarzanie Twoich danych osobowych skorzystaj z ustawień w polityce prywatności. Zgoda jest dobrowolna i możesz ją w dowolnym momencie wycofać zmieniając ustawienia w polityce prywatności (w której znajdziesz odpowiedzi na wszystkie pytania związane z przetwarzaniem Twoich danych osobowych).

Od 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 (określane jako "RODO"). W związku z tym chcielibyśmy poinformować o przetwarzaniu Twoich danych oraz zasadach, na jakich odbywa się to po dniu 25 maja 2018 roku.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będzie Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, oraz pozostałe spółki z grupy Wirtualna Polska, jak również nasi Zaufani Partnerzy, z którymi stale współpracujemy. Szczegółowe informacje dotyczące administratorów znajdują się w polityce prywatności.

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług, portali i serwisów internetowych udostępnianych przez Wirtualną Polskę, w tym zapisywanych w plikach cookies, które są instalowane na naszych stronach przez Wirtualną Polskę oraz naszych Zaufanych Partnerów.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy je dostarczać coraz lepsze materiały redakcyjne, dopasować ich tematykę do Twoich zainteresowań, tworzyć portale i serwisy internetowe, z których będziesz korzystać z przyjemnością, zapewniać większe bezpieczeństwo usług, udoskonalać nasze usługi i maksymalnie dopasować je do Twoich zainteresowań, pokazywać reklamy dopasowane do Twoich potrzeb. Szczegółowe informacje dotyczące celów przetwarzania Twoich danych znajdują się w polityce prywatności.

Komu możemy przekazać dane?

Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa – oczywiście tylko, gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz prawo żądania dostępu, sprostowania, usunięcia lub ograniczenia przetwarzania danych. Możesz wycofać zgodę na przetwarzanie, zgłosić sprzeciw oraz skorzystać z innych praw wymienionych szczegółowo w polityce prywatności.

Jakie są podstawy prawne przetwarzania Twoich danych?

Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy). Podstawą prawną przetwarzania danych w celu pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych realizowanych przez Wirtualną Polskę na zlecenie Zaufanych Partnerów i bezpośrednio przez Zaufanych Partnerów będzie odbywać się na podstawie Twojej dobrowolnej zgody.