nowe technologie w internecie: Web 3.0
Data: 20 maj 2008
Identyfikator: 080622
Chciałbyś mieć przeglądarkę, która rozumie sens wyświetlonej strony
i na tej podstawie wskazuje pokrewne treści z innych witryn, blogów,
bibliotek wideo i serwisów z muzyką? Dzisiaj to niemożliwe, ale to się
niedługo zmieni. Nadchodzi era Web 3.0, w której maszyny równie dobrze
jak ludzie będą rozumiały treść i znaczenie stron internetowych.
Strona 1 z 5
|
Zdaniem eksperta
|
Wojciech Burkot
szef Research & Development Google Kraków
Semantic Web to obecnie zestaw zasad projektowania, które pozwalają w sposób formalny opisać relacje między informacjami. Koncepcja ma zastosowanie przede wszystkim
w informatyce. Inne obszary wiedzy będą
włączane, jeśli Semantic Web przedostanie się
do szerokiej świadomości. Czy Semantic Web zmaterializuje się w pełnej formie? Nie wiem,
czy jesteśmy w stanie zadekretować przyszłość
i rozwijać internet, tak by wypełnić specyfikację, a tego życzą sobie twórcy koncepcji Semantic Web. Modyfikacja treści, by uzgodnić ją z wymaganiami sieci semantycznej, to duże wyzwanie. Wątpię, aby webmasterzy nagle zaczęli przepisywać opublikowane informacje. Spodziewam się raczej, że elementy Semantic Web będą wykorzystywane, ale niezgodnie z intencją autorów.
Tak jest np. w przypadku popularnych mikroformatów, które są niepełną implementacją.
Poza tym do opisu semantycznego wykorzystuje się XML, którego pierwotnym przeznaczeniem jest przecież opis struktury dokumentu.
|
Internet to miliardy dokumentów, które
w jedną całość spinają hipertekstowe odnośniki.
Aby móc się w nim poruszać, trzeba
umieć czytać oraz mieć wiedzę niezbędną do
poprawnego zinterpretowania zamieszczonych
w sieci informacji, np. znać język. O tym, jak
w sieci może czuć się ktoś, kto całkowicie nie
rozumie używanego języka, przekonamy się,
wchodząc na stronę napisaną np. po arabsku.
Nagle okaże się, że całą biegłość, jaką nabyliśmy
przez lata surfowania, jest nic niewarta.
W większości przypadków nie będziemy mogli
nawet powiedzieć, o czym jest ta strona.
Jeśli chodzi o komputer, który nie dość, że
nie rozumie języka naturalnego, to nie ma nawet
szczątkowej inteligencji, każdy dokument
w sieci jest jeszcze mniej zrozumiały. Dlaczego?
HTML oraz jego rozszerzenia w postaci
stylów CSS i JavaScriptu opisują wyłącznie
wygląd i mechanikę strony. Niestety, nic nie
mówią o informacjach zawartych w treści dokumentu. Tymczasem człowiek, czytając np.
stronę z ogłoszeniem o sprzedaży samochodu,
jest w stanie wyróżnić w nim szereg elementów,
które niosą ze sobą konkretne informacje,
czyli dane, takie jak: model, marka, cena, przebieg,
moc silnika, kolor czy dodatkowe wyposażenie.
Dla przeglądarki te informacje będą
niedostrzegalne. Będzie wiedziała tylko, jaki
krój czcionki ma dobrać do ich wyświetlenia.
Wyobraźmy sobie teraz inną sytuację: jesteśmy
w stanie przekazać komputerowi informacje
o treści. Przeglądarka, wiedząc, jakie jest
znaczenie poszczególnych elementów w ogłoszeniu,
mogłaby po najechaniu myszką np. na
nazwę samochodu wygenerować link pozwalający
na odszukanie zdjęć w serwisie do udostępniania
fotografii czy opinii o aucie, jakie krążą
w blogosferze. Mogłaby także wysłać w tle automatyczne
zapytanie do serwisu agregującego
oferty używanych samochodów i wyświetlić listę
propozycji aut o podobnych parametrach.
Lista mogłaby być uzupełniona np. o czas, jaki
trzeba poświęcić na dojazd, aby osobiście obejrzeć
samochód przed zakupem, wyliczony na
podstawie danych GPS przypisanych do danej
oferty. Gdybyśmy zdecydowali się na konkretną
propozycję, przeglądarka wygenerowałaby
raport zawierający dane kontaktowe ogłoszeniodawcy
oraz mapkę z opisem drogi dojazdu.
Taka perspektywa brzmi jak fragment książki
science fiction. W rzeczywistości technologia,
która pozwala na uzyskanie takiej funkcjonalności
jest już dostępna i działa pod nazwą
"sieć semantyczna" (ang. Semantic Web).
Sieć inteligentnych agentów
Zapisanie informacji w internecie w sposób przejrzysty dla maszyn jest głównym postulatem twórców tej koncepcji. Najbardziej znanym jej promotorem jest Tim Berners Lee. Ten sam, który połączył internet z protokołem hipertekstowym i wynalazł usługę World Wide Web. W 1999 roku pisał: „Marzę o sieci, w której komputery będą potrafiły analizować wszystkie dane w niej zgromadzone – treść, linki, relacje między ludźmi i między komputerami. Sieć semantyczna, która dopiero się pojawi, uczyni to możliwym. Kiedy to nastąpi, codzienne mechanizmy handlu, biurokracji, oraz nasze życie będzie zarządzane przez maszyny, które komunikują się z innymi maszynami”. Od tamtego momentu, idea zmaterializowała się w postaci technologii, które właśnie wchodzą do użycia.
Podstawowym założeniem Semantic Web jest wprowadzenie ścisłych reguł dla publikacji danych. Sformalizowanie ich podobnie do zasad rządzących formatowaniem wizualnym witryn internetowych. Celem tego procesu jest wyodrębnienie danych, które mogą być pobierane, przetwarzane i udostępniane maszynowo. Przykładów informacji tego typu treści w internecie jest mnóstwo. Są to nie tylko daty, ceny czy wyniki pomiarów, ale także nazwiska, nazwy własne, kody produktów i zestawienia ich cech, słowem wszystko, co da się podporządkować konkretnej kategorii znaczeniowej.
Aby maszyna mogła przetwarzać informacje z witryn internetowych, muszą zostać spełnione dwa kryteria. Po pierwsze dane muszą być jednoznacznie wyróżnione w treści dokumentu, tak by można było je wyodrębnić bez analizy treści. Każda konkretna informacja, musi mieć przypisany tag, który jednoznacznie powie maszynie, że ma do czynienia z informacją np. o czasie bądź z nazwiskiem człowieka. Po drugie, ważna jest możliwość tworzenia połączeń między danymi z różnych źródeł i ich agregacji, np. powiązania tagu geograficznego, który towarzyszy ogłoszeniu o sprzedaży samochodu, z bazą danych geograficznych w serwisie z mapami. Do tego niezbędne jest używanie tych samych zestawów oznaczeń dla tych określonych kategorii danych.
Podsumowując, celem Semantic Web jest nadanie internetowi funkcjonalności wszechświatowej, relacyjnej bazy danych, z której bez ograniczeń będą mogły korzystać programy agregujące i przetwarzające dane, zwane inteligentnymi agentami. Takim programem może być np. zarówno robot zbierający informacje z sieci do serwisu gromadzącego ogłoszenia
o sprzedaży samochodów, jak i osobisty asystent człowieka, któremu można zlecić np. wyszukanie najtańszego połączenia lotniczego, z Nowym Jorkiem oraz dokonanie rezerwacji w hotelu na okres zgodny z datami rezerwacji przelotu, wynajęcie samochodu na ten czas oraz przygotowanie listy 10 najczęściej odwiedzanych muzeów w mieście.
Ocena: 



(aby ocenić, musisz się zalogować w serwisie)
Podobne artykuły: