Сервисы Интернет: практическое рассмотрение - shikardos.ru o_O
Главная
Поиск по ключевым словам:
страница 1страница 2
Похожие работы
Сервисы Интернет: практическое рассмотрение - страница №1/2

Сервисы Интернет: практическое рассмотрение

http://lib.rin.ru/doc/i/23539p1.html

Введение
Типы сервисов Интернет

Электронная почта

Сетевые новости Usenet

Списки рассылки

FTP - передача файлов

Система поиска файлов Archie

Гипертекстовая система Gopher

Система гипермедиа WWW

Гипертекстовая система Hyper-G

Поисковая система WAIS

Сервисы IRC, MUD, MOO

Инфраструктурные сервисы

Современные разработки, использующие Интернет

как среду передачи информации

Практическое применение сервисов Интернет на примерах

Примеры обращения за информацией в Интернет

Составление ссылки из имени организации

Нахождение информации с применением серверов глобального поиска

Нахождение информационных ресурсов в каталогах

Сопоставление поисковых серверов и каталогов

Ежедневные ссылки

Еще некоторые примеры

Новые технологии и тенденции развития

Java

VRML


Стереоизображения

Проблемы Интернет

Заключение

Введение
Сегодня каждый день множество людей неожиданно открывает для себя су-

ществование глобальных компьютерных сетей, объединяющих компьютеры во

всем мире в едином информационном пространстве, имя которому - Интернет.

Интернет многогранен и нельзя четко определить, что это такое. С техни-

ческой точки зрения, Интернет - объединение транснациональных компьютер-

ных сетей, работающих по самым разнообразным протоколам, связывающих

всевозможные типы компьютеров, физически передающих данные по телефонным

проводам и оптоволокну, через спутники и радиомодемы. Подавляющее

большинство компьютеров в Интернет связано по протоколам tcp/ip, и имен-

но это, вкупе с требованием наличия подключения к глобальной сети, явля-

ется критерием присутствия в Интернет. Однако частями и носителями

культуры Интернет являются также люди, работающие в сетях другого типа,

в том случае, если они имеют возможность пользоваться какими-либо серви-

сами Интернет. Например, автор этой статьи начинал знакомиться с Интер-

нет на IBM PC, включенной в сеть Decnet, пользуясь электронной почтой и

сетевыми новостями с компьютера VAX. Это не было полноценной работой с

Интернет, но таким образом оказывались доступны очень многие информаци-

онные ресурсы. Сегодня практически любой человек, обладающий доступом к

компьютеру с простейшим модемом, может использовать в своей деятельности

огромные информационные ресурсы, предоставляемые Интернет. Можно даже

предположить, что многие из читателей этой статьи имеют возможность

пользоваться сервисами Интернет, но не делают этого, поскольку не предс-

тавляют, как, где и что можно делать в информационном пространстве, не

представляют, как сервисы Интернет могут помочь им в ежедневной работе.

Одна из целей этой статьи - помочь читателю научиться пользоваться ин-

формационными ресурсами глобальной сети, рассказать, как использовать их

в своей повседневной работе и даже на отдыхе.

Итак, Интернет - сеть сетей, всемирная компьютерная сеть. Интернет

можно рассматривать со многих позиций, вот две крайние из них. Наиболее

узкое рассмотрение - объединение сетей, связанных между собой по прото-

колам tcp/ip так, что в любой момент каждый компьютер в Интернет "видит"

каждый другой (то есть может передать ему пакет данных ip и получить от-

вет за доли секунды). Наиболее широкое - киберпространство, рождающее

киберкультуру со своим образом мысли, своим языком, своей этикой. Такой

взгляд на Интернет еще будет рассматриваться философами и психологами, а

в этой статье речь будет идти об Интернете в первом, практическом аспек-

те.


Сети, работающие по протоколам tcp/ip (проще говоря, tcp/ip сети),

родились как проект агентства DARPA министерства обороны США. Сеть соз-

давалась "на случай ядерной войны" и предполагала, что любой компьютер в

сети может перестать функционировать в любой момент, равно как и линии

связи между компьютерами. Именно такая постановка задачи привела к рож-

дению сетевой технологии, которая де-факто стала технологией всемирной

сети - технологии tcp/ip. Протокол ip - это протокол, описывающий формат

пакета данных, передаваемого по сети. Следующий простой пример должен

пояснить, что здесь имеется в виду. Когда Вы получаете телеграмму, весь

текст в ней (и адрес, и сообщение) написан на ленте подряд, но есть пра-

вила, позволяющие понять, где тут адрес, а где сообщение. Аналогично,

пакет в компьютерной сети представляет собой поток битов, а протокол ip

определяет, где адрес и прочая служебная информация, а где сами переда-

ваемые данные. Протокол tcp предназначен для контроля передачи, контроля

целостности передаваемой информации. Когда Вы не расслышали, что сказал

Вам собеседник в телефонном разговоре, Вы просите его повторить сказан-

ное. Приблизительно этим занимается и протокол tcp применительно к

компьютерным сетям. Компьютеры обмениваются пакетами протокола ip, конт-

ролируют их передачу по протоколу tcp и, объединяясь в глобальную сеть,

образуют Интернет. Такова, в самых общих чертах, техническая сторона

вопроса.

Протоколы tcp/ip для компьютеров - это как правила ведения разговора

для людей. Но, пользуясь этими правилами, люди обращаются с информацией

по-разному: спорят, рассказывают, записывают сообщения на автоответчик.

Аналогичным образом обстоят дела и с компьютерами - протокол tcp/ip поз-

воляет передавать информацию, а его, в свою очередь, используют разнооб-

разные сервисы, по разному обращающиеся с информацией. От эффективности

этих сервисов, их надежности, простоты, удобства и распространенности,

зависит то, насколько полезными и необходимыми они становятся в жизни

людей. Интернет замечателен тем, что сеть и ее сервисы стали широко

распространены в жизни общества, что они оказались достаточно хороши,

чтобы река информации потекла руслом Интернет. Интернет не решил пробле-

му хранения и упорядочения информации, но решил проблему ее передачи -

дал возможность получить любую информацию где угодно, когда угодно. Если

бы транспорт был бы столь же развит, как глобальные сети, то уже сегодня

Вы могли бы ночевать дома в Москве, работая в Антарктиде.

Эта замечательная способность передачи информации привела к грандиоз-

ным темпам роста Интернет. Вследствие децентрализованности, нельзя точно

сказать, каковы его размеры сегодня, но по оценкам "Network Wizards",

количество компьютеров, полноценно подключенных в Интернет, последние

два года ежегодно удваивается, составляя 6.6 миллионов компьютеров в ию-

ле 1995 года. По другим оценкам, количество компьютеров, имеющих доступ

к каким-либо сервисам Интернет, весной 1995 года составляло до 30 милли-

онов. Это значит, что если скорость роста Интернет останется на том же

уровне, то в течение ближайших лет Интернет и его сервисы станут столь

же общеупотребительными, как телефон и телевидение сегодня. Очень многие

компании понимают это, и, стремясь первыми прийти на этот рынок (а Ин-

тернет представляет собой, помимо всего прочего, еще и огромный рынок

миллионов потенциальных клиентов), вкладывают деньги в развитие сети и

сервисов, ей предоставляемых. Если в 1994 году в компании, работающие с

Интернет, было вложено 42 миллиона долларов США, то уже за первый квар-

тал 1995 года эта цифра составляла 47 миллионов (New York Times, 26 June

1995, p. D5). А деньги, как известно, делают деньги, и это является еще

одним фактором, ускоряющим развитие сети. Коммерциализация Интернет -

это, возможно, самый важный аспект его развития сегодня. Долгое время,

до весны 1995 года, основные каналы связи и административные структуры

Интернет финансировались Национальным научным фондом США, но теперь фи-

нансирование прекращено и развитие сети происходит на коммерческой осно-

ве.

Чтобы жить в городе, нужно уметь пользоваться транспортом. Для каждой



поездки Вы выберете свой вид транспорта. За город ездят на электричках,

в аэропорт можно поехать на маршрутном такси, до метро можно доехать на

троллейбусе. Если Вы едете на своем автомобиле, Вам нужно знать, по ка-

ким улицам лучше ехать. С другой стороны, Вы должны знать правила движе-

ния и не переходить улицу на красный свет светофора. Интернет в этом

плане очень похож на город. Чтобы успешно работать с ним, нужно знать

правила поведения в сети и уметь ориентироваться в множестве доступных

Вам информационных сервисов. Увы, ввиду децентрализованности и молодости

Интернет, не существует единой его карты или путеводителя по всем его

сервисам. Эффективность Вашей работы в сети определяется Вашим знанием

существующих сервисов, умением обращаться с конкретными сервисами и спо-

собностью выбрать правильный способ решения конкретной задачи. Этим оп-

ределяется не только то, как скоро Вы сможете найти нужную информацию,

но и то, сможете ли Вы ее найти вообще. К каждой гайке нужен свой ключ,

и цель этой статьи объяснить, как подбирать подходящий ключ.
Типы сервисов Интернет
Прежде чем перейти к рассмотрению конкретных сервисов Интернет, надо

описать некоторые категории, использующиеся при оценке различных серви-

сов и их применимости к тем или иным задачам. Конечно, для того, чтобы

лучше представить себе схему передачи информации в Интернет, полезно бы-

ло бы классифицировать сервисы, разделив их на группы в соответствии с

каким-либо набором критериев оценки. Однако по ряду причин нельзя ввести

сколько-нибудь жесткую или определенную классификацию. Основная причина

- уникальность каждого сервиса и одновременная неотделимость его от ос-

тальных. Каждый сервис характеризуется свойствами, часть которых объеди-

няет его с одной группой сервисов, а другая часть с другой группой.

Наиболее подходящим для классификации сервисов Интернет является де-

ление на сервисы интерактивные, прямые и отложенного чтения. Эти группы

объединяют сервисы по большому числу признаков. Сервисы, относящиеся к

классу отложенного чтения, наиболее распространены, наиболее универ-

сальны и наименее требовательны к ресурсам компьютеров и линиям связи.

Основным признаком этой группы является та особенность, что запрос и по-

лучение информации могут быть достаточно сильно (что, вообще говоря, ог-

раничивается только актуальностью информации на момент получения) разде-

лены по времени. Сюда относится, например, электронная почта.

Сервисы прямого обращения характерны тем, что информация по запросу

возвращается немедленно. Однако от получателя информации не требуется

немедленной реакции. Сервисы, где требуется немедленная реакция на полу-

ченную информацию, т.е. получаемая информация является, по сути дела,

запросом, относятся к интерактивным сервисам. Для пояснения вышесказан-

ного можно заметить, что в обычной связи аналогами сервисов интерактив-

ных, прямых и отложенного чтения являются, например, телефон, факс и

письменная корреспонденция.
Электронная почта
Электронная почта (e-mail) - первый из сервисов Интернет, наиболее

распространенный и эффективный из них.

Электронная почта - типичный сервис отложенного чтения (off-line). Вы

посылаете Ваше сообщение, как правило в виде обычного текста, адресат

получает его на свой компьютер через какой-то, возможно достаточно дли-

тельный промежуток времени, и читает Ваше сообщение тогда, когда ему бу-

дет удобно.

E-mail очень похож на обычную бумажную почту, обладая теми же досто-

инствами и недостатками. Обычное письмо состоит из конверта, на котором

написан адрес получателя и стоят штампы почтовых отделений пути следова-

ния, и содержимого - собственно письма. Электронное письмо также состоит

из заголовков, содержащих служебную информацию (об авторе письма, полу-

чателе, пути прохождения по сети и т.д.), играющих роль конверта, и

собственно содержимого письма. Вы можете вложить в обычное письмо

что-нибудь, например фотографию; аналогично, Вы можете послать файл с

данными электронным письмом. Вы можете подписать обычное письмо - можно

подписать и электронное письмо. Обычное письмо может не дойти до адреса-

та или дойти слишком поздно - как и электронное письмо. Обычное письмо

весьма дешево, и электронная почта самый дешевый вид связи.

Итак, электронная почта повторяет достоинства (простота, дешевизна,

возможность пересылки нетекстовой информации, возможность подписать и

зашифровать письмо) и недостатки (негарантированное время пересылки,

возможность доступа третьих лиц во время пересылки, неинтерактивность)

обычной почты. Однако у них есть и существенные отличия. Стоимость пере-

сылки обычной почты очень сильно зависит от того, куда, в сколь удален-

ную точку планеты она должна быть доставлена, и ее размера и типа. Для

электронной почты такой зависимости или нет, или она довольно невелика.

Электронное письмо можно шифровать и подписывать гораздо более надежно и

удобно, нежели бумажное - для последнего, строго говоря, вообще нет об-

щепринятых средств шифрования. Скорость доставки электронных писем го-

раздо выше, чем бумажных, и минимальное время их прохождения несравнимо

меньше.


E-mail универсален - множество сетей во всем мире, построенных на со-

вершенно разных принципах и протоколах, могут обмениваться электронными

письмами с Интернет, получая тем самым доступ к прочим его ресурсам.

Практически все сервисы Интернет, использующиеся обычно как сервисы пря-

мого доступа (on-line), имеют интерфейс к электронной почте, так что да-

же если у Вас нет доступа к Интернет в режиме on-line, Вы можете полу-

чать большую часть информации, хранящейся в Интернет, посредством деше-

вой электронной почты.

Скорость доставки сообщений электронной почты сильно зависит от того,

каким образом она передается. Путь электронного письма между двумя маши-

нами, непосредственно подключенными к Интернет, занимает секунды, и при

этом вероятность потери или подмены письма минимальна. С другой стороны,

если Вы пользуетесь для передачи своих электронных писем технологиями

FTN (последовательной передачи файлов многими компьютерами по цепочке),

и посылаете письмо в какую-нибудь экзотическую сеть, то письмо, во-пер-

вых, будет идти долго - дни и даже недели, во-вторых, будет иметь

большие шансы просто потеряться при обрыве связи во время передачи по

цепочке, в-третьих, его могут легко подменить где-то в пути следования.


Сетевые новости Usenet
Сетевые новости Usenet, или, как их принято называть в российских се-

тях, телеконференции - это, пожалуй, второй по распространенности сервис

Интернет. Если электронная почта передает сообщения по принципу "от од-

ного - одному", то сетевые новости передают сообщения "от одного - мно-

гим". Механизм передачи каждого сообщения похож на передачу слухов: каж-

дый узел сети, узнавший что-то новое (т.е. получивший новое сообщение),

передает новость всем знакомым узлам, т.е. всем тем узлам, с кем он об-

менивается новостями. Таким образом, посланное Вами сообщение распрост-

раняется, многократно дублируясь, по сети, достигая за довольно короткие

сроки всех участников телеконференций Usenet во всем мире. При этом в

обсуждении интересующей Вас темы может участвовать множество людей, не-

зависимо от того, где они находятся физически, и Вы можете найти собе-

седников для обсуждения самых необычных тем. Число пользователей Usenet

весьма велико - по оценкам UUNET technologies, количество новых сообще-

ний, поступающих в телеконференции ежедневно, составляет около миллиона.

Новости разделены по иерархически организованным тематическим груп-

пам, и имя каждой группы состоит из имен подуровней иерархии, разделен-

ных точками, причем более общий уровень пишется первым. Рассмотрим, нап-

ример, имя группы новостей comp.sys.sun.admin. Эта группа относится к

иерархии верхнего уровня comp, предназначенной для обсуждения всего,

связанного с компьютерами. В иерархии comp есть подуровень sys, предназ-

наченный для обсуждения различных компьютерных систем. Далее, sun озна-

чает компьютерные системы фирмы Sun Microsystems, а admin обозначает

группу, предназначенную для обсуждения вопросов администрирования таких

компьютерных систем. Итак, группа comp.sys.sun.admin предназначена для

обсуждения вопросов администрирования компьютерных систем фирмы Sun

Microsystems. Таким образом, обычно, обладая минимальными знаниями анг-

лийского языка, можно по имени группы легко понять, что в ней обсуждает-

ся. Например, в alt.games.vgaplanets пишут любители игры Vga Planets, а

jet.testing предназначена для посылки тестовых сообщений в группу, ло-

кальную для компании Jet Infosystems.

Как Вы могли заметить, существуют глобальные иерархии, как-то comp, и

иерархии, локальные для какой-либо организации, страны или сети. Вообще

говоря, набор групп, которые получает Ваш локальный сервер Usenet, опре-

деляется администратором этого сервера и наличием этих групп на других

серверах, с которыми обменивается новостями Ваш сервер. Однако, обычной

является ситуация, когда сервер получает, во-первых, все глобальные ие-

рархии, во-вторых, группы, локальные для Вашей страны и сети, и,

в-третьих, группы, локальные для Вашей организации. Например, к первой

группе относятся иерархии comp, news, misc, alt, rec, ко второй - иерар-

хии relcom и fido7 в России и иерархия de в Германии, к третьей - иерар-

хии jet для Jet Infosystems и cern в CERN.

К различным иерархиям применимы различные нормы и правила работы с

ними. В первую очередь, это касается языка сообщений - в группы российс-

кой иерархии relcom лучше всего писать по-русски, в то время как в груп-

пы глобальной иерархии comp можно писать только по-английски. Не всегда

в Usenet можно посылать информацию рекламного характера - например, вы

можете свободно посылать рекламные сообщения в группы иерархии

relcom.commerce, специально для того и созданные, а вот в группы fido7

некоммерческой сети FIDO посылать рекламу строго запрещено. Менее стро-

гими являются ограничения на возможные объемы цитирования предыдущих ав-

торов в Вашем письме, размер подписи Вашего письма и т.д.

Начиная работать с какой-либо группой или иерархией групп, в первую

очередь нужно прочитать правила работы с ними, которые регулярно помеща-

ются в эти группы человеком, добровольно взявшим на себя обязанности ко-

ординатора группы (модератора). На самом деле, группы новостей бывают

двух типов - модерируемые и обычные. Сообщения, появляющиеся в модериру-

емых группах, прежде чем быть разосланными по сети, просматриваются мо-

дератором. Это, конечно, является своего рода цензурой, но в таком ог-

ромном сообществе, как Usenet, невозможно поддерживать порядок без по-

добных строгостей.

Сегодня всякий компьютер, полноценно подключенный к Интернет, имеет

доступ к новостям Usenet, но новости Usenet распространяются и по другим

сетям, применяясь столь же широко, как и электронная почта. Способы и

удобство работы с новостями сильно зависят от того, каким образом Вы по-

лучаете их. В Интернет Ваша программа-клиент напрямую получает новости с

сервера Usenet, и между просмотром списка сообщений, содержащихся в

группе, и чтением этих сообщений нет задержки. Если Вы пользуетесь но-

востями через электронную почту, то Вы сначала получаете список статей,

а уже потом принимаете по электронной почте статьи из списка, отдельно

Вами заказанные. Такой способ работы с новостями Usenet является сегодня

наиболее распространенным в России, но на самом деле это весьма неудоб-

ный и устаревший метод.
Списки рассылки
Списки рассылки (maillists) - простой, но в то же время весьма полез-

ный сервис Интернет. Это практически единственный сервис, не имеющий

собственного протокола и программы-клиента и работающий исключительно

через электронную почту.

Идея работы списка рассылки состоит в том, что существует некий адрес

электронной почты, который на самом деле является общим адресом многих

людей - подписчиков этого списка рассылки. Вы посылаете письмо на этот
посвященного обсуждению проблем локализации операционных систем класса

UNIX), и Ваше сообщение получат все люди, подписанные на этот список

рассылки.

Такой сервис по задачам, которые он призван решать, похож на сетевые

новости Usenet, но имеет и существенные отличия. Во-первых, сообщения,

распространяемые по электронной почте, всегда будут прочитаны подписчи-

ком, дождавшись его в почтовом ящике, в то время как статьи в сетевых

новостях стираются по прошествии определенного времени и становятся не-

доступны. Во-вторых, списки рассылки более управляемы и конфиденциальны:

администратор списка полностью контролирует набор подписчиков и может

следить за содержанием сообщений. Каждый список рассылки ведется ка-

кой-либо организацией и она обладает полным контролем над списком, в от-

личие от новостей Usenet, не принадлежащих никому и менее управляемых.

В-третьих, для работы со списком рассылки достаточно доступа к электрон-

ной почте, и подписчиками могут быть люди, не имеющие доступа к новостям

Usenet или каким-либо группам этих новостей. В-четвертых, такой способ

передачи сообщений может быть просто быстрее, коль скоро сообщения пере-

даются напрямую абонентам, а не по цепочке между серверами Usenet. Одна-

ко, сравнивая списки рассылки и новости Usenet, надо отметить, что часто

группы Usenet могут также быть доступны и через списки рассылки, и дру-

гими способами - через WWW, например. Это значит, что Вы можете ис-

пользовать тот способ работы, который более удобен для Вас.

Ситуации, когда применяются списки рассылки как адекватное средство

решения стоящих задач, достаточно характерны. Во-первых, организации

часто создают списки рассылки для оповещения своих клиентов, пользовате-

лей своих продуктов или просто заинтересованных лиц о выпуске новых про-

дуктов, коммерческих предложениях, различных новостях компании и т.д.

Например, издательство O`Reilly & Associates имеет список рассылки, из

которого можно узнать о выходе новых книг издательства. Такие списки

становятся все более популярны, и, возможно, это будет хорошим решением

и для Вашей организации. Вторая ситуация, когда требуется заведение

списка рассылки - когда обсуждается какой-то вопрос, слишком специфичный

и интересующий слишком мало людей для того, чтобы заводить для него от-

дельную группу в новостях Usenet. В-третьих, списки рассылки часто заво-

дятся виртуальными рабочими группами - людьми, работающими над одной

проблемой, но живущими в различных точках планеты. Так, некоторые книги

вышеупомянутого издательства были написаны группой авторов, никогда не

встречавшихся в реальной жизни, но общавшихся исключительно через список

рассылки.

В зависимости от числа подписчиков, список рассылки обслуживается на

сервере программами различной сложности, которые могут обеспечивать или

не обеспечивать полную функциональность, а именно: автоматическую под-

писку клиентов и прием их отказа от подписки, проверку корректности

электронных адресов, ведение архива сообщений, обработку почтовых оши-

бок, поддержку работы в режиме дайджеста (когда подписчик получает не

каждое сообщение отдельным письмом, но периодически все сообщения за ка-

кой-то срок в одном письме), проверку сообщений администратором списка

перед рассылкой и т.д.

Всякая палка имеет два конца, и спискам рассылки также свойственны

некоторые недостатки и сложности. Если Вы подписаны на несколько ожив-

ленных списков, то в один прекрасный день Вы можете обнаружить, что Ваш

почтовый ящик забит письмами из списков рассылки, и в их множестве теря-

ются личные письма, которые интересуют Вас в первую очередь. Чтобы не

возникало такой ситуации, полезно воспользоваться программой, расклады-

вающей письма из списков рассылки по отдельным папкам в момент получения

- ведь обычно такие письма можно распознать по их почтовым заголовкам.

Вам не надо заниматься этим самому - наверняка Ваш системный администра-

тор знает, как это сделать. Другая трудность состоит в том, что иногда

бывает сложно отменить подписку, больше не представляющую для Вас инте-

реса. Как уже говорилось, списки обслуживаются разными программами, и

эти программы управляются разными командами, что и вызывает вышеописан-

ные проблемы. К сожалению, универсальный совет здесь только один - обра-

щайтесь к своему системному администратору. Если же Вы соберетесь завес-

ти свой список рассылки - то тут Вас тем более ждут проблемы, но их об-

суждение - тема отдельная.
FTP - передача файлов
Еще один широко распространенный сервис Интернет - ftp. Русского пе-

ревода этого слова, вообще говоря, нет, и его так и называют в разговоре

- эфтэпэ. Расшифровывается эта аббревиатура как протокол передачи фай-

лов, но при рассмотрении ftp как сервиса Интернет имеется в виду не

просто протокол, но именно сервис - доступ к файлам в файловых архивах.

Вообще говоря, ftp - стандартная программа, работающая по протоколу tcp,

всегда поставляющаяся с операционной системой. Ее исходное предназначе-

ние - передача файлов между разными компьютерами, работающими в сетях

tcp/ip: на одном из компьютеров работает программа-сервер, на втором

пользователь запускает программу-клиента, которая соединяется с сервером

и передает или получает по протоколу ftp файлы. Тут предполагается, что

пользователь зарегистрирован на обоих компьютерах и соединяется с серве-

ром под своим именем и со своим паролем на этом компьютере. Протокол

ftp, разумеется, оптимизирован для передачи файлов.

Данная черта и послужила причиной того, что программы ftp стали

частью отдельного сервиса Интернет. Дело в том, что сервер ftp можно

настраивается таким образом, что соединиться с ним можно не только под

своим именем, но и под условным именем anonymous - аноним. Тогда Вам

становятся доступна не вся файловая система компьютера, но некоторый на-

бор файлов на сервере, которые составляют содержимое сервера anonymous

ftp - публичного файлового архива. Итак, если кто-то хочет предоставить

в публичное пользование файлы с информацией, программами и прочим, то

ему достаточно организовать на своем компьютере, включенном в Интернет,

сервер anonymous ftp. Сделать это достаточно просто, программы-клиенты

ftp есть практически на любом компьютере - поэтому сегодня публичные

файловые архивы организованы в основном как серверы anonymous ftp. На

таких серверах сегодня доступно огромное количество информации и прог-

раммного обеспечения. Практически все, что может быть предоставлено пуб-

лике в виде файлов, доступно с серверов anonymous ftp. Это и программы -

свободно распространяемые и демонстрационные версии, это и мультимедиа,

это, наконец просто тексты - законы, книги, статьи, отчеты.

Таким образом, если Вы, например, хотите представить миру демо-версию

Вашего программного продукта - anonymous ftp является удачным решением

такой задачи. Если, с другой стороны, Вы хотите найти, скажем, последнюю

версию Вашей любимой свободно распространяющейся программы, то искать ее

нужно именно на серверах ftp.

Несмотря на распространенность, у ftp есть и множество недостатков.

Программы-клиенты ftp могут быть не всегда удобны и просты в использова-

нии. Не всегда можно понять, а что это за файл перед Вами - то ли это

тот файл, что Вы ищете, то ли нет. Нет простого и универсального

средства поиска на серверах anonymous ftp - хотя для этого и существует

специальный сервис archie, но это независимая программа, неуниверсальная

и не всегда применимая. Программы ftp довольно стары и некоторые их осо-

бенности, бывшие полезными при рождении, не очень понятны и нужны сегод-

ня - так, например, для передачи файлов есть два режима - бинарный и

текстовый, и если Вы вдруг неправильно выбрали режим, то передаваемый

файл может быть поврежден. Описания файлов на сервере выдаются в формате

операционной системы сервера, а список файлов операционной системы UNIX

может привести в недоумение пользователя DOS. Проблема тут в том, что со

списком файлов выдается лишняя информация, а слишком много знать всегда

вредно. Серверы ftp нецентрализованы, и это несет свои проблемы.

Несмотря на все это, серверы anonymous ftp сегодня - стандартный путь

организации публичных файловых архивов в Интернет. Вы можете также орга-

низовывать доступ к файлам под паролем - например, своим клиентам.

ftp - сервис прямого доступа, требующий полноценного подключения к

Интернет, но возможен и доступ через электронную почту - существуют сер-

веры, которые могут прислать Вам по электронной почте файлы с любых сер-

веров anonymous ftp. Однако это может быть весьма неудобно, ибо такие

серверы сильно загружены, и Ваш запрос может долго ждать своей очереди.

Кроме того, большие файлы при отсылке делятся сервером на части ограни-

ченного размера, посылаемые отдельными письмами - и если одна часть из

сотни потеряется или повредится при передаче, то остальные 99 тоже ока-

жутся ненужными.
Система поиска файлов Archie
Archie - это не самостоятельный сервис, но сервис, облегчающий работу

с серверами anonymous ftp, обеспечивающий поиск файлов на таких серве-

рах. Вам наверняка никогда не придется организовывать свой сервер

archie, но пользоваться его услугами придется наверняка. Их всего су-

ществует с десяток, и каждый из них сильно загружен. Серверы archie

"помнят" списки всех файлов на многих серверах anonymous ftp, и по Ваше-

му запросу могут искать интересующий Вас файл по имени или части имени.

Вы задаете шаблон для поиска, указываете характеристики поиска и получа-

ете список имен серверов и мест расположения файлов на них, которые

удовлетворяют Вашему запросу. Существуют специальные программы-клиенты

archie, но можно воспользоваться услугами такого сервера, и соединившись

с ним по протоколу telnet и войдя под именем archie.

Если Вы представляете себе, как может называться файл, который Вы

ищете, то archie - адекватное средство его поиска, то средство, которое

приходится часто использовать в своей работе.

К недостаткам archie относится децентрализованность, высокая загру-

женность серверов, необходимость уметь задавать шаблон имени для поиска

файла. Каждый сервер обслуживает свой набор серверов ftp, возможно пе-

рекрывающихся - Вы можете не обнаружить необходимую информацию на одном

сервере, но найти на другом, и кто знает, на каком искать прежде.


Гипертекстовая система Gopher
Одним из достаточно известных и распространенных сервисов Интернет

является gopher. Хотя сейчас он уже практически не развивается, или, во

всяком случае, развивается гораздо медленнее прочих сервисов похожего

назначения, но тем не менее через gopher доступно довольно-таки большое

количество информации - в первую очередь, по историческим причинам - был

период, когда gopher был лучшим средством экспорта информации для пуб-

личного доступа и некоторые компании до сих пор продолжают использовать

его. Современные средства работы с информацией в Интернет обеспечивают в

том числе доступ к серверам gopher, поэтому Вам не нужно учиться рабо-

тать со специальными программами-клиентами gopher. Что касается ис-

пользования сервера gopher для предоставления своей информации в публич-

ное пользование - вряд ли Вам придется это делать, поскольку gopher мо-

рально устарел.

Gopher - это распределенная система экспорта структурированной инфор-

мации. При работе с gopher Вы находитесь в системе вложенных меню, из

которых доступны файлы различных типов - как правило, простые тексты, но

это может быть и графика, и звук и любые другие виды файлов. Таким обра-

зом, в публичный доступ экспортируются файлы с информацией, но не в виде

файловой системы, как в ftp, а в виде аннотированной древовидной струк-

туры. Gopher - сервис прямого доступа и требует, чтобы и сервер, и кли-

ент были полноценно подключены к Интернет.
Система гипермедиа WWW
WWW (World Wide Web - всемирная паутина) - самый популярный и инте-

ресный сервис Интернет сегодня, самое популярное и удобное средство ра-

боты с информацией. Самое распространенное имя для компьютера в Интернет

сегодня - www, больше половины потока данных Интернет приходится на долю

WWW. Количество серверов WWW сегодня нельзя оценить сколько-либо точно,

но по некоторым оценкам их более 30 тысяч. Скорость роста WWW даже выше,

чем у самой сети Интернет. Сегодня WWW - самая передовая технология Ин-

тернет, и она уже становится массовой технологией - возможно, недалек

тот день, когда каждый человек, знающий, что такое телефон, будет знать,

что такое WWW.

Подробное описание WWW - тема отдельной статьи, поэтому здесь будут

приведены самые общие понятия и представления, которые нужно иметь о

WWW, как об одном из сервисов Интернет. WWW - информационная система,

которой весьма непросто дать корректное определение. Вот некоторые из

эпитетов, которыми она может быть обозначена: гипертекстовая, гиперме-

дийная, распределенная, интегрирующая, глобальная. Ниже будет показано,

что понимается под каждым из этих свойств в контексте WWW.

WWW работает по принципу клиент-сервер, точнее, клиент-серверы: су-

ществует множество серверов, которые по запросу клиента возвращают ему

гипермедийный документ - документ, состоящий из частей с разнообразным

представлением информации (текст, звук, графика, трехмерные объекты и т.

д.), в котором каждый элемент может являться ссылкой на другой документ

или его часть. Ссылки эти в документах WWW организованы таким образом,

что каждый информационный ресурс в глобальной сети Интернет однозначно

адресуется, и документ, который Вы читаете в данный момент, способен

ссылаться как на другие документы на этом же сервере, так и на документы

(и вообще на ресурсы Интернет) на других компьютерах Интернет. Причем

пользователь не замечает этого, и работает со всем информационным прост-

ранством Интернет как с единым целым. Ссылки WWW указывают не только на

документы, специфичные для самой WWW, но и на прочие сервисы и информа-

ционные ресурсы Интернет. Более того, большинство программ-клиентов WWW

(browsers, навигаторы) не просто понимают такие ссылки, но и являются

программами-клиентами соответствующих сервисов: ftp, gopher, сетевых но-

востей Usenet, электронной почты и т.д. Таким образом, программные

средства WWW являются универсальными для различных сервисов Интернет, а

сама информационная система WWW играет интегрирующую роль.

Вот некоторые термины, использующиеся в WWW - конечный пользователь

может их и не знать, но рано или поздно они Вам встретятся и они не

должны вызвать у Вас недоумение. Первый термин - html (hypertext markup

language, язык разметки гипертекста). Это формат гипермедийных докумен-

тов, использующихся в WWW для предоставления информации. Формат этот не

описывает то, как документ должен выглядеть, но его структуру и связи.

Внешний вид документа на экране пользователя определяется навигатором -

если Вы работаете за графическим или текстовым терминалом, то в каждом

случае документ будет выглядеть по-своему, но структура его останется

неизменной, поскольку она задана форматом html. Имена файлов в формате

html обычно оканчиваются на html (или имеют расширение htm в случае, ес-

ли сервер работает под MS-DOS или Windows). Второй термин - URL (uniform

resource locator, универсальный указатель на ресурс). Так называются те

самые ссылки на информационные ресурсы Интернет. Еще один термин - http

(hypertext transfer protocol, протокол передачи гипертекста). Это назва-

ние протокола, по которому взаимодействуют клиент и сервер WWW.

WWW - сервис прямого доступа, требующий полноценного подключения к

Интернет, и более того, часто требующий быстрых линий связи, в случае,

если документы, которые Вы читаете, содержат много графики или другой

нетекстовой информации. Однако существуют мосты, позволяющие получать

информацию, содержащуюся в WWW, посредством электронной почты. Возмож-

ность такая есть, но таких мостов мало, да и толку от них немного - что-

бы успешно использовать возможности WWW, требуется прямой доступ в Ин-

тернет, а при его отсутствии теряются многие плюсы, создавшие WWW сегод-

няшнюю популярность. Кроме того, некоторые возможности, имеющиеся при

обычной работе, просто недоступны через электронную почту. Это, в основ-

ном, относится к элементам интерактивности в WWW. Например, в языке html

поддерживаются формы. Пользователь вводит в них некоторую информацию,

которая затем может передаваться на сервер. Таким образом заполняются

анкеты, регистрационные карты, проводятся социологические опросы. Напри-

мер, на сервере CNN можно было передать свое отношение к делу Симпсона,

а в электронном журнале SunWorld OnLine можно выразить свою удовлетво-

ренность статьями: не слишком ли коротко, достаточно ли информативно и

т.д.


Практически любая информация, которая предоставляется в публичный

доступ, отображается средствами WWW. Если какая-та информация не может

быть помещена в WWW, то это обусловлено некоторыми ограничениями и не-

достатками WWW. Во-первых, соединение между клиентом и сервером WWW од-

норазовое: клиент посылает запрос, сервер выдает документ, и связь пре-

рывается. Это значит, что сервер не имеет механизма уведомления клиента

об изменении или поступлении новых данных. Проблема решается сегодня

несколькими способами: разрабатывается новая версия протокола http, ко-

торая будет позволять длительное соединение, передачу данных в несколько

потоков, разделение каналов передачи данных и управления ими. Если она

будет реализована и станет поддерживаться стандартным программным обес-

печением WWW, то это решит снимет вышеописанные недостатки. Другое путь

предлагается с использованием навигаторов, которые смогут локально ис-

полнять программы на интерпретируемых языках - как это сделано в проекте

Java компании Sun Microsystems, о котором будет рассказано ниже. Следую-

щая проблема WWW - недостаточность языка описания документов html для

решения многих задач. Например, html не предусматривает вывод математи-

ческих символов, и текста уменьшенного по сравнению со стандартным раз-

мера. Эта задача решается тем же образом, что и предыдущая - разработкой

новых версий языка html и новых типов навигаторов, расширяемых произ-

вольным образом.

Усилия эти затруднены децентрализованностью WWW - например, сегодня

стандартом становятся не те расширения языка html, которые лучше, но те,

которые привносятся самыми популярными навигаторами, такими как Netscape

Navigator. Децентрализованность несет и множество других проблем: от-

сутствие общего каталога серверов и средств тотального поиска по ним.

Однако и эта проблема решается, причем более успешно, чем предыдущие -

сегодня есть и каталоги, и поисковые системы, которые, если и не являют-

ся глобальными, то тем не менее охватывают достаточно большую часть до-

кументов WWW, чтобы быть полезными и успешно применяться для поиска ин-

формации.

В заключение - простой совет: если Вы еще не работаете с WWW, то нач-

ните. В подавляющем большинстве случаев это лучшее решение Ваших задач

при работе с глобальными информационными сетями.


Гипертекстовая система Hyper-G
WWW не была единственной попыткой создать глобальную гипермедийную

распределенную информационную систему. Другой такой системой является

Hyper-G. Этот сервис Интернет менее известен, но весьма интересен.

Hyper-G значительно моложе WWW (хотя темпы роста и не указывают на то,

что Hyper-G сможет когда-либо сравниться по популярности с WWW) и это

академическая разработка - плод стараний технологического университета в

Граце (Graz), Австрия. Система эта вряд ли окажется практически полезной

для Вас, но заслуживает внимания как очень интересная технология, и ее

рассмотрение позволяет многое добавить в картину сервисов Интернет и их

развития.

С общих позиций Hyper-G аналогична WWW, преследуя те же идеи и повто-

ряя многие принципы. Есть клиенты и есть серверы, которые предоставляют

информацию в виде коллекций документов. По принципам организации инфор-

мации в пределах одного сервера Hyper-G является чем-то средним между

WWW и gopher. Документы доступны из иерархического меню, но сами доку-

менты являются гипермедийными. Клиент Hyper-G общается не со множеством

серверов, как в случае WWW, но исключительно со "своим" сервером, ре-

гистрируясь на нем при подключении. Получение документов с других серве-

ров Hyper-G происходит через "свой" сервер, что позволяет создать более

интегрированную систему серверов, чем в случае с WWW. Регистрация же

клиента позволяет определить уникальным образом не только ресурсы и сер-

висы Интернет, но и клиентов, что значительно облегчает обеспечение ав-

торизованного доступа и удаленного управления документами.

К чертам, препятствующим распространению Hyper-G, следует отнести не-

достаточно хорошую реализацию программ-клиентов, не полностью свободный

доступ к серверной части программного обеспечения, централизованность

проекта и отсутствие альтернативных реализаций программного обеспечения,

слишком твердую структуру организации документов на сервере, сложность

системы. Серверы Hyper-G весьма немногочисленны, следовательно, информа-

ции в Hyper-G хранится немного. Отсутствует доступ посредством электрон-

ной почты, хотя серверы Hyper-G могут также выполнять роль серверов

gopher и WWW.


Поисковая система WAIS
Если Вы интересуетесь Интернет, Вы могли слышать название WAIS, но до

сих пор не знать, что это такое. WAIS (произносится как вэйс) - еще один

сервис Интернет, сегодня почти не использующийся, или, по крайней мере,

практически не развивающийся. WAIS расшифровывается как информационная

система широкого профиля, но на самом деле это комплекс программ, пред-

назначенных для индексирования больших объемов неструктурированной, как

правило просто текстовой, информации, поиска по таким документам и их

извлечения. Существуют программы для индексирования, для локального по-

иска по полученным индексам, а также серверная и клиентская программа,

общающиеся между собой по специальному протоколу Z39.50.

Задача поиска по большим объемам неструктурированной информации

весьма нетривиальна и сегодня еще не существует общепринятого ее реше-

ния. WAIS во многих случаях является приемлемым вариантом поисковой сис-

темы, и коль скоро она имеет свободно распространяемую программную реа-

лизацию, то получила достаточную известность как один из сервисов Интер-

нет. На самом деле, она почти не используется сегодня самостоятельно, но

во многих случаях применяется как вспомогательное средство, например,

для индексирования документов, хранящихся на WWW-сервере. В некоторых

случаях она также используется как средство работы со словарями, или для

поиска по архивам сетевых новостей Usenet. Если перед Вами стоит задача

по индексированию больших объемов неструктурированной информации, то,

возможно, WAIS окажется адекватным ее решением. Однако, нужно иметь в

виду, что свободно распространяемая реализация системы далека от совер-

шенства, что система достаточна сложна для понимания и изучения, и, что

хуже всего, практически не развивается. Поддержкой и развитием свободной

версии занимались последовательно несколько организаций, но ни одна из

них не довела продукт до приемлемого для реальной работы состояния.
Сервисы IRC, MUD, MOO
К интерактивным сервисам, служащим общению людей через Интернет, от-

носится IRC - Internet Relay Chat, разговоры через Интернет. В Интернет

существует сеть серверов IRC. Пользователи присоединяются к одному из

каналов - тематических групп и участвуют в разговоре, который ведется не

голосом, но текстом. Узлы IRC синхронизованы между собой, так что, подк-

лючившись к ближайшему серверу, Вы подключаетесь ко всей сети IRC.

Практическая ценность IRC невелика, автору неизвестны примеры коммер-

ческого его применения - используется IRC в основном для развлечения. В

IRC обычно пишут латиницей, даже при общении по-русски, что весьма неп-

риятно. Сервис этот существует, может быть интересен на досуге, но вряд

ли имеет какой-либо практическую ценность, потому и не будет описываться

более подробно.

Подобную функциональность несут еще два сервиса - MUD и MOO. Расшиф-

ровываются эти аббревиатуры как Multi User Dungeon (многопользова-

тельская игра) и Object-Oriented MUD (объектно-ориентированный много-

пользовательский мир).

MUD - многопользовательские игры в Интернет, обычно ролевого или ска-

зочного характера. Практической ценности не представляют, но также ис-

пользуются в часы досуга. К сожалению, подавляющее большинство таких игр

текстового рода, что мешает их широкому распространению. Примеры реали-

зации графических вариантов MUD существуют, но редки и недостаточно хо-

роши. Основное их достоинство - возможность общения людей в игре, подоб-

но IRC. Соответственно, и применимость их аналогична.

MOO - по средствам доступа похожа на MUD (то же текстовое общение:


следующая страница >>