czwartek, 24 maj 2012
NEXT 6/2008 - okładka





Temat numeru:
Przejdź do innych artykułów:

NEXT 6/2008 - Generacja Web 3.0

Generacja Web 3.0 - ikonka nowe technologie w internecie: Web 3.0

Data: 20 maj 2008
Identyfikator: 080622

Chciałbyś mieć przeglądarkę, która rozumie sens wyświetlonej strony i na tej podstawie wskazuje pokrewne treści z innych witryn, blogów, bibliotek wideo i serwisów z muzyką? Dzisiaj to niemożliwe, ale to się niedługo zmieni. Nadchodzi era Web 3.0, w której maszyny równie dobrze jak ludzie będą rozumiały treść i znaczenie stron internetowych.

Strona 1 z 5
< Poprzednia 1 2 3 4 5 Następna >
Generacja Web 3.0 - rozkładówka

Zdaniem eksperta

Wojciech Burkot
szef Research & Development Google Kraków


Semantic Web to obecnie zestaw zasad projektowania, które pozwalają w sposób formalny opisać relacje między informacjami. Koncepcja ma zastosowanie przede wszystkim w informatyce. Inne obszary wiedzy będą włączane, jeśli Semantic Web przedostanie się do szerokiej świadomości. Czy Semantic Web zmaterializuje się w pełnej formie? Nie wiem, czy jesteśmy w stanie zadekretować przyszłość i rozwijać internet, tak by wypełnić specyfikację, a tego życzą sobie twórcy koncepcji Semantic Web. Modyfikacja treści, by uzgodnić ją z wymaganiami sieci semantycznej, to duże wyzwanie. Wątpię, aby webmasterzy nagle zaczęli przepisywać opublikowane informacje. Spodziewam się raczej, że elementy Semantic Web będą wykorzystywane, ale niezgodnie z intencją autorów. Tak jest np. w przypadku popularnych mikroformatów, które są niepełną implementacją. Poza tym do opisu semantycznego wykorzystuje się XML, którego pierwotnym przeznaczeniem jest przecież opis struktury dokumentu.

Internet to miliardy dokumentów, które w jedną całość spinają hipertekstowe odnośniki. Aby móc się w nim poruszać, trzeba umieć czytać oraz mieć wiedzę niezbędną do poprawnego zinterpretowania zamieszczonych w sieci informacji, np. znać język. O tym, jak w sieci może czuć się ktoś, kto całkowicie nie rozumie używanego języka, przekonamy się, wchodząc na stronę napisaną np. po arabsku. Nagle okaże się, że całą biegłość, jaką nabyliśmy przez lata surfowania, jest nic niewarta. W większości przypadków nie będziemy mogli nawet powiedzieć, o czym jest ta strona.

Jeśli chodzi o komputer, który nie dość, że nie rozumie języka naturalnego, to nie ma nawet szczątkowej inteligencji, każdy dokument w sieci jest jeszcze mniej zrozumiały. Dlaczego? HTML oraz jego rozszerzenia w postaci stylów CSS i JavaScriptu opisują wyłącznie wygląd i mechanikę strony. Niestety, nic nie mówią o informacjach zawartych w treści dokumentu. Tymczasem człowiek, czytając np. stronę z ogłoszeniem o sprzedaży samochodu, jest w stanie wyróżnić w nim szereg elementów, które niosą ze sobą konkretne informacje, czyli dane, takie jak: model, marka, cena, przebieg, moc silnika, kolor czy dodatkowe wyposażenie. Dla przeglądarki te informacje będą niedostrzegalne. Będzie wiedziała tylko, jaki krój czcionki ma dobrać do ich wyświetlenia.

Wyobraźmy sobie teraz inną sytuację: jesteśmy w stanie przekazać komputerowi informacje o treści. Przeglądarka, wiedząc, jakie jest znaczenie poszczególnych elementów w ogłoszeniu, mogłaby po najechaniu myszką np. na nazwę samochodu wygenerować link pozwalający na odszukanie zdjęć w serwisie do udostępniania fotografii czy opinii o aucie, jakie krążą w blogosferze. Mogłaby także wysłać w tle automatyczne zapytanie do serwisu agregującego oferty używanych samochodów i wyświetlić listę propozycji aut o podobnych parametrach.

Lista mogłaby być uzupełniona np. o czas, jaki trzeba poświęcić na dojazd, aby osobiście obejrzeć samochód przed zakupem, wyliczony na podstawie danych GPS przypisanych do danej oferty. Gdybyśmy zdecydowali się na konkretną propozycję, przeglądarka wygenerowałaby raport zawierający dane kontaktowe ogłoszeniodawcy oraz mapkę z opisem drogi dojazdu.

Taka perspektywa brzmi jak fragment książki science fiction. W rzeczywistości technologia, która pozwala na uzyskanie takiej funkcjonalności jest już dostępna i działa pod nazwą "sieć semantyczna" (ang. Semantic Web).

Sieć inteligentnych agentów

Zapisanie informacji w internecie w sposób przejrzysty dla maszyn jest głównym postulatem twórców tej koncepcji. Najbardziej znanym jej promotorem jest Tim Berners Lee. Ten sam, który połączył internet z protokołem hipertekstowym i wynalazł usługę World Wide Web. W 1999 roku pisał: „Marzę o sieci, w której komputery będą potrafiły analizować wszystkie dane w niej zgromadzone – treść, linki, relacje między ludźmi i między komputerami. Sieć semantyczna, która dopiero się pojawi, uczyni to możliwym. Kiedy to nastąpi, codzienne mechanizmy handlu, biurokracji, oraz nasze życie będzie zarządzane przez maszyny, które komunikują się z innymi maszynami”. Od tamtego momentu, idea zmaterializowała się w postaci technologii, które właśnie wchodzą do użycia.

Podstawowym założeniem Semantic Web jest wprowadzenie ścisłych reguł dla publikacji danych. Sformalizowanie ich podobnie do zasad rządzących formatowaniem wizualnym witryn internetowych. Celem tego procesu jest wyodrębnienie danych, które mogą być pobierane, przetwarzane i udostępniane maszynowo. Przykładów informacji tego typu treści w internecie jest mnóstwo. Są to nie tylko daty, ceny czy wyniki pomiarów, ale także nazwiska, nazwy własne, kody produktów i zestawienia ich cech, słowem wszystko, co da się podporządkować konkretnej kategorii znaczeniowej.

Aby maszyna mogła przetwarzać informacje z witryn internetowych, muszą zostać spełnione dwa kryteria. Po pierwsze dane muszą być jednoznacznie wyróżnione w treści dokumentu, tak by można było je wyodrębnić bez analizy treści. Każda konkretna informacja, musi mieć przypisany tag, który jednoznacznie powie maszynie, że ma do czynienia z informacją np. o czasie bądź z nazwiskiem człowieka. Po drugie, ważna jest możliwość tworzenia połączeń między danymi z różnych źródeł i ich agregacji, np. powiązania tagu geograficznego, który towarzyszy ogłoszeniu o sprzedaży samochodu, z bazą danych geograficznych w serwisie z mapami. Do tego niezbędne jest używanie tych samych zestawów oznaczeń dla tych określonych kategorii danych.

Podsumowując, celem Semantic Web jest nadanie internetowi funkcjonalności wszechświatowej, relacyjnej bazy danych, z której bez ograniczeń będą mogły korzystać programy agregujące i przetwarzające dane, zwane inteligentnymi agentami. Takim programem może być np. zarówno robot zbierający informacje z sieci do serwisu gromadzącego ogłoszenia o sprzedaży samochodów, jak i osobisty asystent człowieka, któremu można zlecić np. wyszukanie najtańszego połączenia lotniczego, z Nowym Jorkiem oraz dokonanie rezerwacji w hotelu na okres zgodny z datami rezerwacji przelotu, wynajęcie samochodu na ten czas oraz przygotowanie listy 10 najczęściej odwiedzanych muzeów w mieście.


Ocena: +++++    (aby ocenić, musisz się zalogować w serwisie)

< Poprzednia 1 2 3 4 5 Następna >

Podobne artykuły:

Komentarze:

Redakcja nie ponosi odpowiedzialności za treść komentarzy.
Komentarze wyświetlane są poczynając od najstarszych.

22.05.2008, 18:28
Coś na siłę...

Wg mnie kilku osobnikom się zwyczajnie nudziło i takie bzdury chcą wprowadzać. Sam czasami skrobnę jakąś stronę i nijak mi się nie uśmiecha, by robić takie bzdury. Niby dlaczego miałbym ułatwiać googlowi, czy jakiejś innej wyszukiwarce? Zapłacą mi za to? Ok, ktoś powie,że to przyczyni się do efektywniejszego skatalogowania mojej strony, ale równie dobrze doprowadzi to do ułatwienia wykorzystywania moich danych przez konkurencję. Wg. mnie nie będzie to żadne WEB 3.0 jak chce autor, a jedynie jakaś technologia, którą mogą być zainteresowani jedynie nieliczni.
  windows_xp_2003 firefox
26.05.2008, 14:31
Zgadzam się

W zupełności zgadzam się z empireusem
  windows_xp_2003 firefox
05.06.2008, 15:14
Groteska ....

Gdyby Edison myślał "po co mam ułatwiać innym..." to byście ze świecami latali..
Jak Einstein prace życia robił też nieliczni sie interesowali..
A skoro "skrobiecie" stronki to danych kontaktowych nie umieszczajcie - PO CO UŁATWIAĆ LUDZIOM KONTAKT Z WAMI?
  windows_xp_2003 opera
23.08.2008, 00:54
re:Groteska ....

Koncio13 tak sie sklada, ze Edison WYMYSLIL cos, by to cos w przyszlosci przynioslo JEMU wymierne korzysci materialne(nomen omen, podobno wiele projektow ukradl). Tak samo Einstein-moze nie wymyslal swoich teorii dla kasy, ale wiedzial, ze bedzie dzieki temu SLAWNY. Ktos zwyczajnie gniota wymyslil i mysli, ze na dawnej slawie wprowadzi w zycie tego gniota. Nie mialbym nic przeciwko, gdyby to byl dobry projekt, ale niestety to JEST naprawde chory pomysl. Zauwaz, ze jest juz ktoras tam wersja CSS, ze ukryte tabele powinny juz dawno odejsc do lamusa, a ludzie nadal nie stosuja ani CSS, ani nie opieraja stron na DIV'ach, a co dopiero, jakby mieli robic to, co w artykule... Nie mam nic przeciwko temu projektowi-moze ideologia i zamierzenia sluszne, ale nieprzemyslane z socjologicznego punktu widzenia
  windows_xp_2003 opera
Niezalogowany

Aby mieć dostęp do niektórych części serwisu NEXT (np. forum dyskusyjnego, oceny numeru, newslettera), musisz posiadać konto w naszym serwisie. Zachęcamy do darmowej rejestracji!

Jeżeli posiadasz już konto w serwisie, to zaloguj się.