Подавляющее большинство компьютеров в Интернет связано по протоколам TCP/IP, и именно это, вкупе с требованием наличия подключения к глобальной сети, является критерием присутствия в Интернет. Однако частями и носителями культуры Интернет являются также люди, работающие в сетях другого типа, в том случае, если они имеют возможность пользоваться какими-либо сервисами Интернет. Например, автор этой статьи начинал знакомиться с Интернет на IBM PC, включенной в сеть Decnet, пользуясь электронной почтой и сетевыми новостями с компьютера VAX. Это не было полноценной работой с Интернет, но таким образом оказывались доступны очень многие информационные ресурсы. Сегодня практически любой человек, обладающий доступом к компьютеру с простейшим модемом, может использовать в своей деятельности огромные информационные ресурсы, предоставляемые Интернет. Можно даже предположить, что многие из читателей этой статьи имеют возможность пользоваться сервисами Интернет, но не делают этого, поскольку не представляют, как, где и что можно делать в информационном пространстве, не представляют, как сервисы Интернет могут помочь им в ежедневной работе. Одна из целей этой статьи — помочь читателю научиться пользоваться информационными ресурсами глобальной сети, рассказать, как использовать их в своей повседневной работе и даже на отдыхе.
Итак, Интернет — сеть сетей, всемирная компьютерная сеть. Интернет можно рассматривать со многих позиций, вот две крайние из них. Наиболее узкое рассмотрение — объединение сетей, связанных между собой по протоколам TCP/IP так, что в любой момент каждый компьютер в Интернет "видит" каждый другой (то есть может передать ему пакет данных IP и получить ответ за доли секунды). Наиболее широкое — киберпространство, рождающее киберкультуру со своим образом мысли, своим языком, своей этикой. Такой взгляд на Интернет еще будет рассматриваться философами и психологами, а в этой статье речь будет идти об Интернете в первом, практическом аспекте.
Сети, работающие по протоколам TCP/IP (проще говоря, TCP/IP сети), родились как проект агентства DARPA министерства обороны США. Сеть создавалась "на случай ядерной войны" и предполагала, что любой компьютер в сети может перестать функционировать в любой момент, равно как и линии связи между компьютерами. Именно такая постановка задачи привела к рождению сетевой технологии, которая де-факто стала технологией всемирной сети — технологии TCP/IP. Протокол IP — это протокол, описывающий формат пакета данных, передаваемого по сети. Следующий простой пример должен пояснить, что здесь имеется в виду. Когда Вы получаете телеграмму, весь текст в ней (и адрес, и сообщение) написан на ленте подряд, но есть правила, позволяющие понять, где тут адрес, а где сообщение. Аналогично, пакет в компьютерной сети представляет собой поток битов, а протокол IP определяет, где адрес и прочая служебная информация, а где сами передаваемые данные. Протокол TCP предназначен для контроля передачи, контроля целостности передаваемой информации. Когда Вы не расслышали, что сказал Вам собеседник в телефонном разговоре, Вы просите его повторить сказанное. Приблизительно этим занимается и протокол TCP применительно к компьютерным сетям. Компьютеры обмениваются пакетами протокола IP, контролируют их передачу по протоколу TCP и, объединяясь в глобальную сеть, образуют Интернет. Такова, в самых общих чертах, техническая сторона вопроса.
Протоколы TCP/IP для компьютеров — это как правила ведения разговора для людей. Но, пользуясь этими правилами, люди обращаются с информацией по-разному: спорят, рассказывают, записывают сообщения на автоответчик. Аналогичным образом обстоят дела и с компьютерами — протокол TCP/IP позволяет передавать информацию, а его, в свою очередь, используют разнообразные сервисы, по-разному обращающиеся с информацией. От эффективности этих сервисов, их надежности, простоты, удобства и распространенности, зависит то, насколько полезными и необходимыми они становятся в жизни людей. Интернет замечателен тем, что сеть и ее сервисы стали широко распространены в жизни общества, что они оказались достаточно хороши, чтобы река информации потекла руслом Интернет. Интернет не решил проблему хранения и упорядочения информации, но решил проблему ее передачи — дал возможность получить любую информацию где угодно, когда угодно. Если бы транспорт был бы столь же развит, как глобальные сети, то уже сегодня Вы могли бы ночевать дома в Москве, работая в Антарктиде.
Эта замечательная способность передачи информации привела к грандиозным темпам роста Интернет. Вследствие децентрализованности, нельзя точно сказать, каковы его размеры сегодня, но по оценкам "Network Wizards", количество компьютеров, полноценно подключенных в Интернет, в течении последних двух лет ежегодно удваивается, составляя 6.6 миллионов компьютеров в июле 1995 года. По другим оценкам, количество компьютеров, имеющих доступ к каким-либо сервисам Интернет, весной 1995 года составляло до 30 миллионов. Это значит, что если скорость роста Интернет останется на том же уровне, то в течение ближайших лет Интернет и его сервисы станут столь же общеупотребительными, как телефон и телевидение сегодня. Очень многие компании понимают это, и, стремясь первыми прийти на этот рынок (а Интернет представляет собой, помимо всего прочего, еще и огромный рынок миллионов потенциальных клиентов), вкладывают деньги в развитие сети и сервисов, ей предоставляемых. Если в 1994 году в компании, работающие с Интернет, было вложено 42 миллиона долларов США, то уже за первый квартал 1995 года эта цифра составляла 47 миллионов (New York Times, 26 June 1995, p. D5). А деньги, как известно, делают деньги, и это является еще одним фактором, ускоряющим развитие сети. Коммерциализация Интернет — это, возможно, самый важный аспект его развития сегодня. Долгое время, до весны 1995 года, основные каналы связи и административные структуры Интернет финансировались Национальным научным фондом США, но теперь финансирование прекращено и развитие сети происходит на коммерческой основе.
Чтобы жить в городе, нужно уметь пользоваться транспортом. Для каждой поездки Вы выберете свой вид транспорта. За город ездят на электричках, в аэропорт можно поехать на маршрутном такси, до метро можно доехать на троллейбусе. Если Вы едете на своем автомобиле, Вам нужно знать, по каким улицам лучше ехать. С другой стороны, Вы должны знать правила движения и не переходить улицу на красный свет светофора. Интернет в этом плане очень похож на город. Чтобы успешно работать с ним, нужно знать правила поведения в сети и уметь ориентироваться в множестве доступных Вам информационных сервисов. Увы, ввиду децентрализованности и молодости Интернет, не существует единой его карты или путеводителя по всем его сервисам. Эффективность Вашей работы в сети определяется Вашим знанием существующих сервисов, умением обращаться с конкретными сервисами и способностью выбрать правильный способ решения конкретной задачи. Этим определяется не только то, как скоро Вы сможете найти нужную информацию, но и то, сможете ли Вы ее найти вообще. К каждой гайке нужен свой ключ, и цель этой статьи объяснить, как подбирать подходящий ключ.
Типы сервисов Интернет
Прежде чем перейти к рассмотрению конкретных сервисов Интернет, надо описать некоторые категории, использующиеся при оценке различных сервисов и их применимости к тем или иным задачам. Конечно, для того, чтобы лучше представить себе схему передачи информации в Интернет, полезно было бы классифицировать сервисы, разделив их на группы в соответствии с каким-либо набором критериев оценки. Однако по ряду причин нельзя ввести сколько-нибудь жесткую или определенную классификацию. Основная причина — уникальность каждого сервиса и одновременная неотделимость его от остальных. Каждый сервис характеризуется свойствами, часть которых объединяет его с одной группой сервисов, а другая часть с другой группой.
Наиболее подходящим для классификации сервисов Интернет является деление на сервисы интерактивные, прямые и отложенного чтения. Эти группы объединяют сервисы по большому числу признаков. Сервисы, относящиеся к классу отложенного чтения, наиболее распространены, наиболее универсальны и наименее требовательны к ресурсам компьютеров и линиям связи. Основным признаком этой группы является та особенность, что запрос и получение информации могут быть достаточно сильно (что, вообще говоря, ограничивается только актуальностью информации на момент получения) разделены по времени. Сюда относится, например, электронная почта.
Сервисы прямого обращения характерны тем, что информация по запросу возвращается немедленно. Однако от получателя информации не требуется немедленной реакции. Сервисы, где требуется немедленная реакция на полученную информацию, т.е. получаемая информация является, по сути дела, запросом, относятся к интерактивным сервисам. Для пояснения вышесказанного можно заметить, что в обычной связи аналогами сервисов интерактивных, прямых и отложенного чтения являются, например, телефон, факс и письменная корреспонденция.
Электронная почта
Электронная почта (e-mail) — первый из сервисов Интернет, наиболее распространенный и эффективный из них.
Электронная почта — типичный сервис отложенного чтения (off-line). Вы посылаете Ваше сообщение, как правило в виде обычного текста, адресат получает его на свой компьютер через какой-то, возможно достаточно длительный промежуток времени, и читает Ваше сообщение тогда, когда ему будет удобно.
E-mail очень похож на обычную бумажную почту, обладая теми же достоинствами и недостатками. Обычное письмо состоит из конверта, на котором написан адрес получателя и стоят штампы почтовых отделений пути следования, и содержимого — собственно письма. Электронное письмо также состоит из заголовков, содержащих служебную информацию (об авторе письма, получателе, пути прохождения по сети и т.д.), играющих роль конверта, и собственно содержимого письма. Вы можете вложить в обычное письмо что-нибудь, например фотографию; аналогично, Вы можете послать файл с данными электронным письмом. Вы можете подписать обычное письмо — можно подписать и электронное письмо. Обычное письмо может не дойти до адресата или дойти слишком поздно — как и электронное письмо. Обычное письмо весьма дешево, и электронная почта — самый дешевый вид связи.
Итак, электронная почта повторяет достоинства (простота, дешевизна, возможность пересылки нетекстовой информации, возможность подписать и зашифровать письмо) и недостатки (негарантированное время пересылки, возможность доступа третьих лиц во время пересылки, неинтерактивность) обычной почты. Однако у них есть и существенные отличия. Стоимость пересылки обычной почты очень сильно зависит от того, куда, в сколь удаленную точку планеты она должна быть доставлена, и ее размера и типа. Для электронной почты такой зависимости или нет, или она довольно невелика. Электронное письмо можно шифровать и подписывать гораздо более надежно и удобно, нежели бумажное — для последнего, строго говоря, вообще нет общепринятых средств шифрования. Скорость доставки электронных писем гораздо выше, чем бумажных, и минимальное время их прохождения несравнимо меньше.
E-mail универсален — множество сетей во всем мире, построенных на совершенно разных принципах и протоколах, могут обмениваться электронными письмами с Интернет, получая тем самым доступ к прочим его ресурсам. Практически все сервисы Интернет, использующиеся обычно как сервисы прямого доступа (on-line), имеют интерфейс к электронной почте, так что даже если у Вас нет доступа к Интернет в режиме on-line, Вы можете получать большую часть информации, хранящейся в Интернет, посредством дешевой электронной почты.
Скорость доставки сообщений электронной почты сильно зависит от того, каким образом она передается. Путь электронного письма между двумя машинами, непосредственно подключенными к Интернет, занимает секунды, и при этом вероятность потери или подмены письма минимальна. С другой стороны, если Вы пользуетесь для передачи своих электронных писем технологиями FTN (последовательной передачи файлов многими компьютерами по цепочке), и посылаете письмо в какую-нибудь экзотическую сеть, то письмо, во-первых, будет идти долго — дни и даже недели, во-вторых, будет иметь большие шансы просто потеряться при обрыве связи во время передачи по цепочке, в-третьих, его могут легко подменить где-то в пути следования.
Сетевые новости Usenet
Сетевые новости Usenet, или, как их принято называть в российских сетях, телеконференции — это, пожалуй, второй по распространенности сервис Интернет. Если электронная почта передает сообщения по принципу "от одного — одному", то сетевые новости передают сообщения "от одного — многим". Механизм передачи каждого сообщения похож на передачу слухов: каждый узел сети, узнавший что-то новое (т.е. получивший новое сообщение), передает новость всем знакомым узлам, т.е. всем тем узлам, с кем он обменивается новостями. Таким образом, посланное Вами сообщение распространяется, многократно дублируясь, по сети, достигая за довольно короткие сроки всех участников телеконференций Usenet во всем мире. При этом в обсуждении интересующей Вас темы может участвовать множество людей, независимо от того, где они находятся физически, и Вы можете найти собеседников для обсуждения самых необычных тем. Число пользователей Usenet весьма велико — по оценкам UUNET technologies, количество новых сообщений, поступающих в телеконференции ежедневно, составляет около миллиона.
Новости разделены по иерархически организованным тематическим группам, и имя каждой группы состоит из имен подуровней иерархии, разделенных точками, причем более общий уровень пишется первым. Рассмотрим, например, имя группы новостей comp.sys.sun.admin. Эта группа относится к иерархии верхнего уровня comp, предназначенной для обсуждения всего, связанного с компьютерами. В иерархии comp есть подуровень sys, предназначенный для обсуждения различных компьютерных систем. Далее, sun означает компьютерные системы фирмы Sun Microsystems, а admin обозначает группу, предназначенную для обсуждения вопросов администрирования таких компьютерных систем. Итак, группа comp.sys.sun. admin предназначена для обсуждения вопросов администрирования компьютерных систем фирмы Sun Microsystems. Таким образом, обычно, обладая минимальными знаниями английского языка, можно по имени группы легко понять, что в ней обсуждается. Например, в alt.games.vgaplanets пишут любители игры Vga Planets, а jet.testing предназначена для посылки тестовых сообщений в группу, локальную для компании Jet Infosystems.
Как Вы могли заметить, существуют глобальные иерархии, как-то comp, и иерархии, локальные для какой-либо организации, страны или сети. Вообще говоря, набор групп, которые получает Ваш локальный сервер Usenet, определяется администратором этого сервера и наличием этих групп на других серверах, с которыми обменивается новостями Ваш сервер. Однако обычной является ситуация, когда сервер получает, во-первых, все глобальные иерархии, во-вторых, группы, локальные для Вашей страны и сети, и, в-третьих, группы, локальные для Вашей организации. Например, к первой группе относятся иерархии comp, news, misc, alt, rec, ко второй — иерархии relcom и fido7 в России и иерархия de в Германии, к третьей — иерархии jet для Jet Infosystems и cern в CERN.
К различным иерархиям применимы различные нормы и правила работы с ними. В первую очередь, это касается языка сообщений — в группы российской иерархии relcom лучше всего писать по-русски, в то время как в группы глобальной иерархии comp можно писать только по-английски. Не всегда в Usenet можно посылать информацию рекламного характера — например, вы можете свободно посылать рекламные сообщения в группы иерархии relcom.commerce, специально для того и созданные, а вот в группы fido7 некоммерческой сети FIDO посылать рекламу строго запрещено. Менее строгими являются ограничения на возможные объемы цитирования предыдущих авторов в Вашем письме, размер подписи Вашего письма и т.д.
Начиная работать с какой-либо группой или иерархией групп, в первую очередь нужно прочитать правила работы с ними, которые регулярно помещаются в эти группы человеком, добровольно взявшим на себя обязанности координатора группы (модератора). На самом деле, группы новостей бывают двух типов — модерируемые и обычные. Сообщения, появляющиеся в модерируемых группах, прежде чем быть разосланными по сети, просматриваются модератором. Это, конечно, является своего рода цензурой, но в таком огромном сообществе, как Usenet, невозможно поддерживать порядок без подобных строгостей.
Сегодня всякий компьютер, полноценно подключенный к Интернет, имеет доступ к новостям Usenet, но новости Usenet распространяются и по другим сетям, применяясь столь же широко, как и электронная почта. Способы и удобство работы с новостями сильно зависят от того, каким образом Вы получаете их. В Интернет Ваша программа-клиент напрямую получает новости с сервера Usenet, и между просмотром списка сообщений, содержащихся в группе, и чтением этих сообщений нет задержки. Если Вы пользуетесь новостями через электронную почту, то Вы сначала получаете список статей, а уже потом принимаете по электронной почте статьи из списка, отдельно Вами заказанные. Такой способ работы с новостями Usenet является сегодня наиболее распространенным в России, но на самом деле это весьма неудобный и устаревший метод.
Списки рассылки
Списки рассылки (maillists) — простой, но в то же время весьма полезный сервис Интернет. Это практически единственный сервис, не имеющий собственного протокола и программы-клиента и работающий исключительно через электронную почту.
Идея работы списка рассылки состоит в том, что существует некий адрес электронной почты, который на самом деле является общим адресом многих людей — подписчиков этого списка рассылки. Вы посылаете письмо на этот адрес, например на адрес u-l11n@jet.msk.su (это адрес списка рассылки, посвященного обсуждению проблем локализации операционных систем класса UNIX), и Ваше сообщение получат все люди, подписанные на этот список рассылки.
Такой сервис по задачам, которые он призван решать, похож на сетевые новости Usenet, но имеет и существенные отличия. Во-первых, сообщения, распространяемые по электронной почте, всегда будут прочитаны подписчиком, дождавшись его в почтовом ящике, в то время как статьи в сетевых новостях стираются по прошествии определенного времени и становятся недоступны. Во-вторых, списки рассылки более управляемы и конфиденциальны: администратор списка полностью контролирует набор подписчиков и может следить за содержанием сообщений. Каждый список рассылки ведется какой-либо организацией и она обладает полным контролем над списком, в отличие от новостей Usenet, не принадлежащих никому и менее управляемых. В-третьих, для работы со списком рассылки достаточно доступа к электронной почте, и подписчиками могут быть люди, не имеющие доступа к новостям Usenet или каким-либо группам этих новостей. В-четвертых, такой способ передачи сообщений может быть просто быстрее, коль скоро сообщения передаются напрямую абонентам, а не по цепочке между серверами Usenet. Однако сравнивая списки рассылки и новости Usenet, надо отметить, что часто группы Usenet могут также быть доступны и через списки рассылки, и другими способами — через WWW, например. Это значит, что Вы можете использовать тот способ работы, который более удобен для Вас.
Ситуации, когда применяются списки рассылки как адекватное средство решения стоящих задач, достаточно характерны. Во-первых, организации часто создают списки рассылки для оповещения своих клиентов, пользователей своих продуктов или просто заинтересованных лиц о выпуске новых продуктов, коммерческих предложениях, различных новостях компании и т.д. Например, издательство O'Reilly & Associates имеет список рассылки, из которого можно узнать о выходе новых книг издательства. Такие списки становятся все более популярны, и, возможно, это будет хорошим решением и для Вашей организации. Вторая ситуация, когда требуется заведение списка рассылки — когда обсуждается какой-то вопрос, слишком специфичный и интересующий слишком мало людей для того, чтобы заводить для него отдельную группу в новостях Usenet. В-третьих, списки рассылки часто заводятся виртуальными рабочими группами — людьми, работающими над одной проблемой, но живущими в различных точках планеты. Так, некоторые книги вышеупомянутого издательства были написаны группой авторов, никогда не встречавшихся в реальной жизни, но общавшихся исключительно через список рассылки.
В зависимости от числа подписчиков, список рассылки обслуживается на сервере программами различной сложности, которые могут обеспечивать или не обеспечивать полную функциональность, а именно: автоматическую подписку клиентов и прием их отказа от подписки, проверку корректности электронных адресов, ведение архива сообщений, обработку почтовых ошибок, поддержку работы в режиме дайджеста (когда подписчик получает не каждое сообщение отдельным письмом, но периодически все сообщения за какой-то срок в одном письме), проверку сообщений администратором списка перед рассылкой и т.д.
Всякая палка имеет два конца, и спискам рассылки также свойственны некоторые недостатки и сложности. Если Вы подписаны на несколько оживленных списков, то в один прекрасный день Вы можете обнаружить, что Ваш почтовый ящик забит письмами из списков рассылки, и в их множестве теряются личные письма, которые интересуют Вас в первую очередь. Чтобы не возникало такой ситуации, полезно воспользоваться программой, раскладывающей письма из списков рассылки по отдельным папкам в момент получения — ведь обычно такие письма можно распознать по их почтовым заголовкам. Вам не надо заниматься этим самому — наверняка Ваш системный администратор знает, как это сделать. Другая трудность состоит в том, что иногда бывает сложно отменить подписку, больше не представляющую для Вас интереса. Как уже говорилось, списки обслуживаются разными программами, и эти программы управляются разными командами, что и вызывает вышеописанные проблемы. К сожалению, универсальный совет здесь только один — обращайтесь к своему системному администратору. Если же Вы соберетесь завести свой список рассылки — то тут Вас тем более ждут проблемы, но их обсуждение — тема отдельная.
FTP — передача файлов
Еще один широко распространенный сервис Интернет — ftp. Русского перевода этого слова, вообще говоря, нет, и его так и называют в разговоре — эфтэпэ. Расшифровывается эта аббревиатура как протокол передачи файлов, но при рассмотрении ftp как сервиса Интернет имеется в виду не просто протокол, но именно сервис — доступ к файлам в файловых архивах. Вообще говоря, ftp — стандартная программа, работающая по протоколу TCP, всегда поставляющаяся с операционной системой. Ее исходное предназначение — передача файлов между разными компьютерами, работающими в сетях TCP/IP: на одном из компьютеров работает программа-сервер, на втором пользователь запускает программу-клиента, которая соединяется с сервером и передает или получает по протоколу ftp файлы. Тут предполагается, что пользователь зарегистрирован на обоих компьютерах и соединяется с сервером под своим именем и со своим паролем на этом компьютере. Протокол ftp, разумеется, оптимизирован для передачи файлов.
Данная черта и послужила причиной того, что программы ftp стали частью отдельного сервиса Интернет. Дело в том, что сервер ftp зачастую настраивается таким образом, что соединиться с ним можно не только под своим именем, но и под условным именем anonymous — аноним. Тогда Вам становятся доступна не вся файловая система компьютера, но некоторый набор файлов на сервере, которые составляют содержимое сервера anonymous ftp — публичного файлового архива. Итак, если кто-то хочет предоставить в публичное пользование файлы с информацией, программами и прочим, то ему достаточно организовать на своем компьютере, включенном в Интернет, сервер anonymous ftp. Сделать это достаточно просто, программы-клиенты ftp есть практически на любом компьютере — поэтому сегодня публичные файловые архивы организованы в основном как серверы anonymous ftp. На таких серверах сегодня доступно огромное количество информации и программного обеспечения. Практически все, что может быть предоставлено публике в виде файлов, доступно с серверов anonymous ftp. Это и программы — свободно распространяемые и демонстрационные версии, это и мультимедиа, это, наконец просто тексты — законы, книги, статьи, отчеты.
Таким образом, если Вы, например, хотите представить миру демо-версию Вашего программного продукта — anonymous ftp является удачным решением такой задачи. Если, с другой стороны, Вы хотите найти, скажем, последнюю версию Вашей любимой свободно распространяющейся программы, то искать ее нужно именно на серверах ftp.
Несмотря на распространенность, у ftp есть и множество недостатков. Программы-клиенты ftp могут быть не всегда удобны и просты в использовании. Не всегда можно понять, а что это за файл перед Вами — то ли это тот файл, что Вы ищете, то ли нет. Нет простого и универсального средства поиска на серверах anonymous ftp — хотя для этого и существует специальный сервис archie, но это независимая программа, неуниверсальная и не всегда применимая. Программы ftp довольно стары и некоторые их особенности, бывшие полезными при рождении, не очень понятны и нужны сегодня — так, например, для передачи файлов есть два режима — бинарный и текстовый, и если Вы вдруг неправильно выбрали режим, то передаваемый файл может быть поврежден. Описания файлов на сервере выдаются в формате операционной системы сервера, а список файлов операционной системы UNIX может привести в недоумение пользователя DOS. Проблема тут в том, что со списком файлов выдается лишняя информация, а слишком много знать всегда вредно. Серверы ftp нецентрализованы, и это несет свои проблемы.
Несмотря на все это, серверы anonymous ftp сегодня — стандартный путь организации публичных файловых архивов в Интернет. Вы можете также организовывать доступ к файлам под паролем — например, своим клиентам.
ftp — сервис прямого доступа, требующий полноценного подключения к Интернет, но возможен и доступ через электронную почту — существуют серверы, которые могут прислать Вам по электронной почте файлы с любых серверов anonymous ftp. Однако это может быть весьма неудобно, ибо такие серверы сильно загружены, и Ваш запрос может долго ждать своей очереди. Кроме того, большие файлы при отсылке делятся сервером на части ограниченного размера, посылаемые отдельными письмами — и если одна часть из сотни потеряется или повредится при передаче, то остальные 99 тоже окажутся ненужными.
Система поиска файлов Archie
Archie — это не самостоятельный сервис, но сервис, облегчающий работу с серверами anonymous ftp, обеспечивающий поиск файлов на таких серверах. Вам наверняка никогда не придется организовывать свой сервер archie, но пользоваться его услугами придется наверняка. Их всего существует с десяток, и каждый из них сильно загружен. Серверы archie "помнят" списки всех файлов на многих серверах anonymous ftp, и по Вашему запросу могут искать интересующий Вас файл по имени или части имени. Вы задаете шаблон для поиска, указываете характеристики поиска и получаете список имен серверов и мест расположения файлов на них, которые удовлетворяют Вашему запросу. Существуют специальные программы-клиенты archie, но можно воспользоваться услугами такого сервера, и соединившись с ним по протоколу telnet и войдя под именем archie.
Если Вы представляете себе, как может называться файл, который Вы ищете, то archie — адекватное средство его поиска, то средство, которое приходится часто использовать в своей работе.
К недостаткам archie относится децентрализованность, высокая загруженность серверов, необходимость уметь задавать шаблон имени для поиска файла. Каждый сервер обслуживает свой набор серверов ftp, возможно перекрывающихся — Вы можете не обнаружить необходимую информацию на одном сервере, но найти на другом, и кто знает, на каком искать прежде.
Гипертекстовая система Gopher
Одним из достаточно известных и распространенных сервисов Интернет является gopher. Хотя сейчас он уже практически не развивается, или, во всяком случае, развивается гораздо медленнее прочих сервисов похожего назначения, но тем не менее через gopher доступно довольно-таки большое количество информации — в первую очередь, по историческим причинам — был период, когда gopher был лучшим средством экспорта информации для публичного доступа и некоторые компании до сих пор продолжают использовать его. Современные средства работы с информацией в Интернет обеспечивают в том числе доступ к серверам gopher, поэтому Вам не нужно учиться работать со специальными программами-клиентами gopher. Что касается использования сервера gopher для предоставления своей информации в публичное пользование — вряд ли Вам придется это делать, поскольку gopher морально устарел.
Gopher — это распределенная система экспорта структурированной информации. При работе с gopher Вы находитесь в системе вложенных меню, из которых доступны файлы различных типов — как правило, простые тексты, но это может быть и графика, и звук и любые другие виды файлов. Таким образом, в публичный доступ экспортируются файлы с информацией, но не в виде файловой системы, как в ftp, а в виде аннотированной древовидной структуры. Gopher — сервис прямого доступа и требует, чтобы и сервер, и клиент были полноценно подключены к Интернет.
Система гипермедиа WWW
WWW (World Wide Web — всемирная паутина) — самый популярный и интересный сервис Интернет сегодня, самое популярное и удобное средство работы с информацией. Самое распространенное имя для компьютера в Интернет сегодня — www, больше половины потока данных Интернет приходится на долю WWW. Количество серверов WWW сегодня нельзя оценить сколь-нибудь точно, но по некоторым оценкам их более 30 тысяч. Скорость роста WWW даже выше, чем у самой сети Интернет. Сегодня WWW — самая передовая технология Интернет, и она уже становится массовой технологией — возможно, недалек тот день, когда каждый человек, знающий, что такое телефон, будет знать, что такое WWW.
Подробное описание WWW — тема отдельной статьи, поэтому здесь будут приведены самые общие понятия и представления, которые нужно иметь о WWW, как об одном из сервисов Интернет. WWW — информационная система, которой весьма непросто дать корректное определение. Вот некоторые из эпитетов, которыми она может быть обозначена: гипертекстовая, гипермедийная, распределенная, интегрирующая, глобальная. Ниже будет показано, что понимается под каждым из этих свойств в контексте WWW.
WWW работает по принципу клиент-сервер, точнее, клиент-серверы: существует множество серверов, которые по запросу клиента возвращают ему гипермедийный документ — документ, состоящий из частей с разнообразным представлением информации (текст, звук, графика, трехмерные объекты и т.д.), в котором каждый элемент может являться ссылкой на другой документ или его часть. Ссылки эти в документах WWW организованы таким образом, что каждый информационный ресурс в глобальной сети Интернет однозначно адресуется, и документ, который Вы читаете в данный момент, способен ссылаться как на другие документы на этом же сервере, так и на документы (и вообще на ресурсы Интернет) на других компьютерах Интернет, причем пользователь не замечает этого, и работает со всем информационным пространством Интернет как с единым целым. Ссылки WWW указывают не только на документы, специфичные для самой WWW, но и на прочие сервисы и информационные ресурсы Интернет. Более того, большинство программ-клиентов WWW (browsers, навигаторы) не просто понимают такие ссылки, но и являются программами-клиентами соответствующих сервисов: ftp, gopher, сетевых новостей Usenet, электронной почты и т.д. Таким образом, программные средства WWW являются универсальными для различных сервисов Интернет, а сама информационная система WWW играет интегрирующую роль.
Вот некоторые термины, использующиеся в WWW — конечный пользователь может их и не знать, но рано или поздно они Вам встретятся и они не должны вызвать у Вас недоумение. Первый термин — html (hypertext markup language, язык разметки гипертекста). Это формат гипермедийных документов, использующихся в WWW для предоставления информации. Формат этот не описывает то, как документ должен выглядеть, но его структуру и связи. Внешний вид документа на экране пользователя определяется навигатором — если Вы работаете за графическим или текстовым терминалом, то в каждом случае документ будет выглядеть по-своему, но структура его останется неизменной, поскольку она задана форматом html. Имена файлов в формате html обычно оканчиваются на html (или имеют расширение htm в случае, если сервер работает под MS-DOS или Windows). Второй термин — URL (uniform resource locator, универсальный указатель на ресурс). Так называются те самые ссылки на информационные ресурсы Интернет. Еще один термин — http (hypertext transfer protocol, протокол передачи гипертекста). Это название протокола, по которому взаимодействуют клиент и сервер WWW.
WWW — сервис прямого доступа, требующий полноценного подключения к Интернет, и более того, часто требующий быстрых линий связи, в случае, если документы, которые Вы читаете, содержат много графики или другой нетекстовой информации. Однако существуют мосты, позволяющие получать информацию, содержащуюся в WWW, посредством электронной почты. Возможность такая есть, но таких мостов мало, да и толку от них немного — чтобы успешно использовать возможности WWW, требуется прямой доступ в Интернет, а при его отсутствии теряются многие плюсы, создавшие WWW сегодняшнюю популярность. Кроме того, некоторые возможности, имеющиеся при обычной работе, просто недоступны через электронную почту. Это, в основном, относится к элементам интерактивности в WWW. Например, в языке html поддерживаются формы. Пользователь вводит в них некоторую информацию, которая затем может передаваться на сервер. Таким образом заполняются анкеты, регистрационные карты, проводятся социологические опросы. Например, на сервере CNN можно было передать свое отношение к делу Симпсона, а в электронном журнале SunWorld OnLine можно выразить свою удовлетворенность статьями: не слишком ли коротко, достаточно ли информативно и т.д.
Практически любая информация, которая предоставляется в публичный доступ, отображается средствами WWW. Если какая-то информация не может быть помещена в WWW, то это обусловлено некоторыми ограничениями и недостатками WWW. Во-первых, соединение между клиентом и сервером WWW одноразовое: клиент посылает запрос, сервер выдает документ, и связь прерывается. Это значит, что сервер не имеет механизма уведомления клиента об изменении или поступлении новых данных. Проблема решается сегодня несколькими способами: разрабатывается новая версия протокола http, которая будет позволять длительное соединение, передачу данных в несколько потоков, разделение каналов передачи данных и управления ими. Если она будет реализована и станет поддерживаться стандартным программным обеспечением WWW, то это снимет вышеописанные недостатки.
Другой путь предлагается с использованием навигаторов, которые смогут локально исполнять программы на интерпретируемых языках — как это сделано в проекте Java компании Sun Microsystems, о котором будет рассказано ниже. Следующая проблема WWW — недостаточность языка описания документов html для решения многих задач. Например, html не предусматривает вывод математических символов, и текста, уменьшенного по сравнению со стандартным размера. Эта задача решается тем же образом, что и предыдущая — разработкой новых версий языка html и новых типов навигаторов, расширяемых произвольным образом.
Усилия эти затруднены децентрализованностью WWW — например, сегодня стандартом становятся не те расширения языка html, которые лучше, но те, которые привносятся самыми популярными навигаторами, такими как Netscape Navigator. Децентрализованность несет и множество других проблем: отсутствие общего каталога серверов и средств тотального поиска по ним. Однако и эта проблема решается, причем более успешно, чем предыдущие — сегодня есть и каталоги, и поисковые системы, которые, если и не являются глобальными, то тем не менее охватывают достаточно большую часть документов WWW, чтобы быть полезными и успешно применяться для поиска информации.
В заключение — простой совет: если Вы еще не работаете с WWW, то начните. В подавляющем большинстве случаев это лучшее решение Ваших задач при работе с глобальными информационными сетями.
Гипертекстовая система Hyper-G
WWW не была единственной попыткой создать глобальную гипермедийную распределенную информационную систему. Другой такой системой является Hyper-G. Этот сервис Интернет менее известен, но весьма интересен. Hyper-G значительно моложе WWW (хотя темпы роста и не указывают на то, что Hyper-G сможет когда-либо сравниться по популярности с WWW) и это академическая разработка — плод стараний технологического университета в Граце (Graz), Австрия. Система эта вряд ли окажется практически полезной для Вас, но заслуживает внимания как очень интересная технология, и ее рассмотрение позволяет многое добавить в картину сервисов Интернет и их развития.
С общих позиций Hyper-G аналогична WWW, преследуя те же идеи и повторяя многие принципы. Есть клиенты и есть серверы, которые предоставляют информацию в виде коллекций документов. По принципам организации информации в пределах одного сервера Hyper-G является чем-то средним между WWW и gopher. Документы доступны из иерархического меню, но сами документы являются гипермедийными. Клиент Hyper-G общается не со множеством серверов, как в случае WWW, но исключительно со "своим" сервером, регистрируясь на нем при подключении. Получение документов с других серверов Hyper-G происходит через "свой" сервер, что позволяет создать более интегрированную систему серверов, чем в случае с WWW.
Регистрация же клиента позволяет определить уникальным образом не только ресурсы и сервисы Интернет, но и клиентов, что значительно облегчает обеспечение авторизованного доступа и удаленного управления документами.
К чертам, препятствующим распространению Hyper-G, следует отнести недостаточно хорошую реализацию программ-клиентов, не полностью свободный доступ к серверной части программного обеспечения, централизованность проекта и отсутствие альтернативных реализаций программного обеспечения, слишком твердую структуру организации документов на сервере, сложность системы. Серверы Hyper-G весьма немногочисленны, следовательно, информации в Hyper-G хранится немного. Отсутствует доступ посредством электронной почты, хотя серверы Hyper-G могут также выполнять роль серверов gopher и WWW.
Поисковая система WAIS
Если Вы интересуетесь Интернет, Вы могли слышать название WAIS, но до сих пор не знать, что это такое. WAIS (произносится как вэйс) — еще один сервис Интернет, сегодня почти не использующийся, или, по крайней мере, практически не развивающийся. WAIS расшифровывается как информационная система широкого профиля, но на самом деле это комплекс программ, предназначенных для индексирования больших объемов неструктурированной, как правило просто текстовой, информации, поиска по таким документам и их извлечения. Существуют программы для индексирования, для локального поиска по полученным индексам, а также серверная и клиентская программа, общающиеся между собой по специальному протоколу Z39.50.
Задача поиска по большим объемам неструктурированной информации весьма нетривиальна и сегодня еще не существует общепринятого ее решения. WAIS во многих случаях является приемлемым вариантом поисковой системы, и коль скоро она имеет свободно распространяемую программную реализацию, то получила достаточную известность как один из сервисов Интернет. На самом деле, она почти не используется сегодня самостоятельно, но во многих случаях применяется как вспомогательное средство, например, для индексирования документов, хранящихся на WWW-сервере. В некоторых случаях она также используется как средство работы со словарями, или для поиска по архивам сетевых новостей Usenet. Если перед Вами стоит задача по индексированию больших объемов неструктурированной информации, то, возможно, WAIS окажется адекватным ее решением. Однако нужно иметь в виду, что свободно распространяемая реализация системы далека от совершенства, что система достаточна сложна для понимания и изучения, и, что хуже всего, практически не развивается. Поддержкой и развитием свободной версии занимались последовательно несколько организаций, но ни одна из них не довела продукт до приемлемого для реальной работы состояния.
Сервисы IRC, MUD, MOO
К интерактивным сервисам, служащим общению людей через Интернет, относится IRC — Internet Relay Chat, разговоры через Интернет. В Интернет существует сеть серверов IRC. Пользователи присоединяются к одному из каналов — тематических групп и участвуют в разговоре, который ведется не голосом, но текстом. Узлы IRC синхронизованы между собой, так что, подключившись к ближайшему серверу, Вы подключаетесь ко всей сети IRC.
Практическая ценность IRC невелика, автору неизвестны примеры коммерческого его применения — используется IRC в основном для развлечения. В IRC обычно пишут латиницей, даже при общении по-русски, что весьма неприятно. Сервис этот существует, может быть интересен на досуге, но вряд ли имеет какую-либо практическую ценность, потому и не будет описываться более подробно.
Подобную функциональность несут еще два сервиса — MUD и MOO. Расшифровываются эти аббревиатуры как Multi User Dungeon (многопользовательская игра) и Object-Oriented MUD (объектно-ориентированный многопользовательский мир).
MUD — многопользовательские игры в Интернет, обычно ролевого или сказочного характера. Практической ценности не представляют, но также используются в часы досуга. К сожалению, подавляющее большинство таких игр текстового рода, что мешает их широкому распространению. Примеры реализации графических вариантов MUD существуют, но редки и недостаточно хороши. Основное их достоинство — возможность общения людей в игре, подобно IRC. Соответственно, и применимость их аналогична.
MOO — по средствам доступа похож на MUD (то же текстовое общение: "посмотреть на стол" — "Это стол. У него семь с половиной ножек."), но принципы, положенные в основу MOO, другие. В виртуальном мире MOO отсутствует игра, но зато создаются объекты и определяются их свойства и связи, что может иметь применение в образовательных целях. Например, в виртуальных учебных аудиториях MOO проходят занятия курсов по C++ Глобальной Сетевой Академии (Global Network Academy) и проходят весьма успешно. Однако неудобный терминальный интерфейс MOO и малая распространенность не позволяют порекомендовать этот сервис для практического использования — слишком узок круг задач, решением которых он может послужить.
Инфраструктурные сервисы
Описанный выше ftp является примером инфраструктурного сервиса Интернет, то есть сервиса, основанного на программных средствах, обычно поставляемых как часть операционной системы. Такие сервисы, изначально предназначенные для обеспечения связи между компьютерами, часто используются и для передачи информации, становясь, таким образом, сервисом Интернет. Так, ftp — программный комплекс, изначально предназначенный для передачи пользовательских файлов между компьютерами в сетях TCP/IP, стал популярным сервисом Интернет, когда стал использоваться для организации файловых архивов публичного доступа. Существует ряд других инфраструктурных сервисов, о которых полезно знать и иметь их в виду при планировании организации информационного взаимодействия между Вашей организацией и Интернет. Инфраструктурные сервисы удобны тем, что для работы с ними обычно не требуется установки специального программного обеспечения ни на стороне клиента, ни на стороне сервера.
Инфрасервисом является finger. Это программа, предназначенная для получения информации о пользователях локального и удаленных компьютеров: полного имени и телефонов, времени последнего входа в систему, текущей активности и т.п. Finger становится сервисом Интернет, когда на сервере заводится псевдопользователь, и, при обращении за информацией о нем, Вы получите не вышеописанную техническую информацию, но что-то другое. Так, например, через finger можно получить из первых рук информацию о статусе последних версий игры Doom и других игр фирмы ID Software.
Инфрасервисом является и telnet — программа, обеспечивающая терминальный доступ к удаленным компьютерам. Она также используется как средство доступа к удаленным информационным сервисам, работа с которыми происходит в режиме текстового терминала — это, например, описанные в этой статье MUD и MOO. Telnet используется как часть информационного сервиса Интернет, когда при соединении пользователь попадает не в командный интерпретатор, но сразу в специализированную программу, обеспечивающую доступ к информационным ресурсам. Так можно работать с каталогами некоторых библиотек, с сервером, обслуживающим игроков в шахматы и го, можно получить доступ к терминальному навигатору WWW, если у Вас нет локального. Серверов таких достаточно много, и они обслуживают самые разнообразные информационные сервисы. Многие инфраструктурные сервисы TCP/IP могут использоваться для передачи информации в Интернет, и нет смысла пытаться описать здесь все. Но вот, например, как можно использовать информацию из базы данных имен компьютеров Интернет DNS. Для прямого обращения к этой базе данных используется утилита nslookup, которая предназначена для отладки и проверки информации в DNS сетевыми администраторами TCP/IP-сетей. Однако, пользуясь ей, можно получить информацию о том, какого типа компьютер используется как удаленный информационный сервер, какое реальное имя имеет компьютер, известный Вам под логическим псевдонимом, и т.д.
Все, что предназначено для передачи технической информации, может быть тем или иным способом использовано для передачи информации как сервиса Интернет. Это надо иметь в виду, если Вы собираетесь применять возможности Интернет в своей работе или на досуге.
Современные разработки, использующие Интернет, как среду передачи информации
Особую группу сервисов Интернет являют собой сервисы, слишком молодые, чтобы быть широко известными, но достаточно интересные, чтобы быть упомянутыми. Главное, что объединяет их — использование Интернет как среды передачи информации. Вообще говоря, к этой группе можно отнести любое программное обеспечение, применяющее протоколы TCP/IP для передачи данных, и направленное на работу с информацией в глобальных сетях. Это, в первую очередь, программные пакеты для проведения видео и аудиоконференций. Вот некоторые из них.
На сегодняшний день нет еще стандартного и общепринятого средства организации мультимедиа телеконференций. Только в последнее время глобальные сети стали иметь достаточную пропускную способность для того, чтобы передавать столь большие потоки данных.
Весьма интересной технологией аудиоконференций Интернет является пакет Iphone компании VocalTec. Это компьютерный телефон, работающий через Интернет. Для работы с ним требуется компьютер, оснащенный MS Windows, аудиокартой и микрофоном. Вы обращаетесь к удаленному серверу, на котором регистрируетесь в одной из тематических групп. После этого Вы можете вызвать для разговора других людей, зарегистрировавшихся в этой же группе, а они могут вызвать Вас. Если Вам ответили, то после установления соединения Вы сможете разговаривать с качеством, почти равным телефонному, даже при относительно медленной связи с Интернет. Качество звука в этом случае впечатляет, но у iphone есть и недостатки: пакет работает только на одной платформе, требует подсоединения к серверу, и нахождения собеседника не нем, а не прямого обращения к абоненту. Однако предполагается, что Iphone только начал свое развитие, и все эти недостатки со временем исчезнут.
Другой аудиотехнологией является RealAudio компании Progressive Network. Это технология передачи звука с сервера клиенту. В отличие от передачи аудио как файла, в этом случае поток данных управляем, и можно слушать текущий аудиофрагмент с любой позиции, что весьма удобно. Анонсировалось включение технологии RealAudio в состав Windows 95, что может стать стимулом для повсеместного распространения этой технологии. Опять же, первый недостаток технологии — привязанность клиента к единственной платформе.
Известной программой передачи видеоизображения через Интернет является пакет CU-SeeMe. С его помощью можно получать видеоизображение с других компьютеров и передавать со своего, если к Вашему компьютеру присоединена видеокамера. Работа происходит также через специальные серверы. Качество видео не столь впечатляет, как звука в вышеописанных программах, но это объясняется более высокими требованиями к пропускной способности каналов связи.
Совершенно особой сущностью является multicast — система, в которой проведена оптимизация на уровне протоколов для широковещательной передачи мультимедийной информации в глобальной сети. Грубо говоря, идея заключается в том, что мультимедийная информация передается не десяти абонентам десятью идентичными потоками пакетов с разными адресами, а одним потоком на один условный адрес, объединяющий группу получателей, каждый из которых понимает, что он входит в эту группу, и читает данные из этого единого потока. Таким образом, сильно понижается загруженность сети. Multicasting не является, строго говоря, сервисом Интернет. Это технология, расширяющая возможности Интернет, на основе которой могут строиться новые перспективные сервисы. Не весь Интернет позволяет работать с пакетами multicast, но лишь его часть — Mbone (multicast backbone), поскольку передача пакетов multicast требует специфической маршрутизации, которая поддерживается не во всех сетях, входящих в Интернет. Однако уже сегодня компанией Sun Microsystems ведутся телепередачи Sunergy о проблемах компьютерного бизнеса, которые распространяются как через телевизионные спутники, так и через Mbone.
Практическое использование сервисов Интернет на примерах
Самой интересной чертой Интернет является ее полезность. В отличие от других перспективных технологий, использовать глобальную сеть можно уже сейчас. Условно говоря, объем информации, доступной Вам таким образом, гораздо больше доступного традиционными путями. Представление и удобство ее восприятия пока не могут сравниться с книгами или телевидением, но количество и доступность информации в сети несравненно выше.
Далее в этой главе практически рассматриваются ситуации, для которых приводятся примеры использования Интернет. Они призваны показать, что уже сегодня можно пользоваться информацией, доступной из сети, столь же легко и обыденно, как, скажем, телефоном. Дело здесь только в отношении к инструментам, находящимся в Вашем распоряжении. К сервисам Интернет (в первую очередь это касается World Wide Web) нужно просто привыкнуть и чувствовать, что они есть под рукой. Если Вам требуется некоторая информация, то, прежде, чем искать справочник или звонить коллеге, оцените, нельзя ли получить ту же информацию в Интернет. Это может оказаться самым скорым способом, да и вероятность найти нужную информацию больше. С другой стороны, сегодняшний мир стремительно изменяется, знания и данные накапливаются так быстро, что книги просто не могут успеть за ними.
Интернет — источник наиболее свежей информации. Готовить и публиковать ее в электронном виде несравненно быстрее и дешевле, чем традиционными путями. Дальнейшие выводы сделать нетрудно. Если уже сегодня Ваше умение и привычка работать с информацией on-line влияют на скорость и эффективность Вашей работы, то завтра они могут стать определяющими факторами.
Некорректным было бы умолчать о слабых сторонах Интернет как источника информации. В первую очередь, надо иметь в виду, что Интернет — международная сеть. Это значит, что 99 процентов ее документов написаны на английском языке. Это не значит, что в Интернет нечего делать, не зная его. Эта статья, например, будет доступна в Интернет. Но хотя и существует некоторое количество русскоязычных серверов, их все же недостаточно, чтобы создать русскоязычную информационную среду. Конечно, знание английского языка сегодня становится критерием общей грамотности, но мы ведем разговор об информации, ее получении и усвоении. Документ на родном языке читается и воспринимается гораздо быстрее. Так или иначе, тотальная англоязычность Интернет имеет не только плюсы, но и минусы.
Во-вторых, Интернет — компьютерная сеть, и информация в ней чаще компьютерного плана. Если Вас интересуют компьютеры, Вы наверняка найдете то, что ищете. Если Вы ищете кулинарные рецепты, то вероятность их обнаружения в сети гораздо ниже. Другими словами, насыщенность Интернет информацией неравномерна для различных областей человеческой деятельности. Хотя реально не проводилось никаких исследований такого рода, но можно предположить, что примерно две трети Интернет относятся к компьютерам, около трети — к развлечениям (включая новости, спорт, магазины и т.д.), и лишь малая доля ко всему прочему. Такая направленность ограничивает сегодняшнюю применимость сети, и это надо иметь в виду.
Примеры обращения за информацией в Интернет
Итак, если Вы занимаетесь компьютерами и читаете по-английски, Интернет может служить удобным и эффективным источником информации в Вашей повседневной деятельности. Если Вы начнете пользоваться его ресурсами, то наверняка скоро выработает свои привычки и методы работы в электронном мире. Для того, чтобы продемонстрировать некоторые из таких способов, рассмотрим несколько характерных ситуаций. В большинстве нижеописанных примеров будут использоваться ссылки и документы WWW. Это объясняется тем, что World Wide Web — интегрирующая система, позволяющая обращаться через себя к большинству сервисов Интернет.
Составление ссылки из имени организации
Предположим, Вы хотите узнать что-то о некоторой американской компании, известной Вам только по имени, например Applix. Неважно, что именно Вас интересует — телефоны, новости, продукты компании — первое, что нужно сделать в такой ситуации — попробовать обратиться по ссылке http://www.applix.com. Вы заметили соответствие? Обратившись по ссылке http://www.имя_компании.com, Вы с большой вероятностью попадете на WWW-сервер искомой компании. Это относится не только к компьютерным компаниям. Так, адрес WWW-сервера компании Walt Disney — http://www.disney.com, а сервера химической компании Dow — www.dow.com. В таком имени окончание com значит, что это сервер коммерческой компании, расположенной в США. Серверы правительственных организаций США имеют окончание gov (например, www.whitehouse.gov), а серверы некоммерческих организаций — org, например www.greenpeace.org. Если Вас интересует неамериканская организация, попробуйте добавить в качестве окончания аббревиатуру страны — at для Австрии, de для Германии, ru для России. Этот очень простой метод поиска организаций может оказаться весьма полезным.
Нахождение информации с применением серверов глобального поиска
Пожалуй, самой полезной чертой Интернет является наличие в нем поисковых серверов. Это выделенные компьютеры, которые автоматически просматривают все ресурсы Интернет, которые могут найти, и индексируют их содержание. Затем Вы можете передать такому серверу фразу или набор ключевых слов, описывающих интересующую Вас тему, и сервер возвратит Вам список ресурсов, соответствующих Вашему запросу. Сегодняшние поисковые системы поддерживают индексы, включающие весьма значительную часть ресурсов Интернет. Таких серверов существует довольно-таки много, более десятка, и вкупе они охватывают практически все доступные ресурсы. К самым популярным я отнес бы InfoSeek (www.infoseek.com), Lycos (www.lycos.com), WebCrawler (www.webcrawler.com). Если в Интернет есть информация, которая Вас интересует, то ее наверняка можно найти при помощи поисковых серверов. Это самое мощное средство нахождения ресурсов в сети.
Возможно, Вы смотрели художественный фильм "Скользящие" (Sliders). Фильм этот состоит из независимых эпизодов. Когда автору статьи понадобилось узнать, сколько всего их существует, и в каком порядке они следуют, поисковый сервер сразу же нашел ссылку на всю информацию, касающуюся фильма — и в том числе об эпизодах. А теперь представьте себе, сколько времени понадобилось бы для того, чтобы получить ту же информацию каким-либо другим путем.
Нахождение информационных ресурсов в каталогах
В каталогах Интернет хранятся тематически систематизированные коллекции ссылок на различные сетевые ресурсы, в первую очередь на документы World Wide Web. Ссылки в такие каталоги заносятся не автоматически, но их администраторами. Более того, занимающиеся этим люди стараются сделать свои коллекции наиболее полными, включающими все доступные ресурсы на каждую тему. В результате пользователю не нужно самому собирать все ссылки по интересующему его вопросу, но достаточно найти этот вопрос в каталоге — работа по поиску и систематизации ссылок уже сделана за него.
Каталоги обычно имеют древовидную структуру и похожи на очень большой список закладок, которые наверняка есть в Вашем WWW-навигаторе; вообще говоря, они и произошли от последних. Когда World Wide Web только начинала развиваться, и ее серверы еще можно было пересчитать, некоторые пользователи вели их списки. Со временем WWW-серверов становилось все больше, каждый день появлялись новые, и механизма закладок стало недостаточно для того, чтобы хранить эту информацию. Некоторые пользователи WWW стали создавать специальные программы для поддержания базы данных по ссылкам на ресурсы Интернет, ее автоматической синхронизации и управления ею. Именно так и родились глобальные каталоги сети, как, например, наиболее известный и крупный — YAHOO.
Например, когда автору понадобилось узнать, существуют ли ассоциации системных администраторов UNIX, он зашел на вышеупомянутый сервер YAHOO, и прошел по дереву каталога "Компьютеры" — "Операционные системы" — "UNIX" — "Организации", и получил искомый список.
Как правило, хорошие каталоги Интернет обеспечивают разнообразный дополнительный сервис: поиск по ключевым словам в своей базе данных, списки последних поступлений, списки наиболее интересных из них, выдачу случайной ссылки, автоматическое оповещение по электронной почте о свежих поступлениях. Все это делает использование таких коллекций весьма удобным.
Совсем недавно был объявлен каталог русскоязычных ресурсов Интернет, где собраны ссылки на самые разные вещи, начиная с "Вредных советов" Остера, и кончая курсами обмена валют. Его URL — http://iaiwww.uni-muenster.de/simplex/russian/lit.html.
Сопоставление поисковых серверов и каталогов
Поисковые системы индексируют документы автоматически, не оценивая завершенности или полезности, поэтому они могут находить информацию в самых "глухих" углах Интернет. С другой стороны, если Вы неудачно сформулируете Ваш запрос, сервер может и не возвратить ссылки на нужный документ. В этом случае, если Вы определенно знаете, что из себя представляет искомый ресурс, и он наверняка хорошо известен, разумно обратиться к каталогам Интернет. Это решение также является адекватным в случае, когда Вам требуется наиболее полный список ресурсов по некоторому вопросу. Если же Вам нужна хотя бы одна ссылка, то использовать поисковый сервер гораздо быстрее. Последний разумно также применять в случае, когда Вы не знаете точно, что из себя представляет искомый предмет. Это звучит несколько дико, поэтому я приведу пример. Допустим, Вы прочитали в газете, что акции компании XYZ выросли за день в три раза. Но что из себя представляет компания XYZ? Сервера www.xyz.com не оказалось, а искать компанию в каталоге, не зная, чем она занимается, неразумно. Тут как раз и приходит на помощь поисковый сервис, который если и не найдет сервера самой компании (которого может и не существовать), то найдет места, где она упоминается в других документах.
Довольно-таки часто возникают ситуации, когда Вас интересует не информация о самом объекте, а ссылки на него в других, не связанных c ним непосредственно, документах. Тогда Вам тоже нужно воспользоваться поисковым сервером. Например, Вы забыли, где в сети видели статью с оценками производительности процессора UltraSPARC II. Такую статью весьма проблематично отыскать в каталогах, а вот найти по ключевым словам вполне вероятно.
Когда же Вас заинтересует, какие изданы книги по языку постскрипт, то ничего не надо искать — достаточно обратиться к одному из каталогов. То есть условно можно сказать, что они — средство сфокусированного поиска информации, а поисковые серверы — рассеянного.
Поработав немного с различными каталогами, Вы наверняка выберите из них один, наиболее удобный и симпатичный Вам. Вы научитесь быстро искать в нем информацию, и другие коллекции ссылок Вам уже будут казаться ненужными. С другой стороны, никогда не бывает достаточно одного поискового сервера. Во-первых, разные серверы охватывают различные области информации в Интернет, частично перекрывающиеся. Они используют различающиеся методы индексирования документов и способы оценки значимости слов в них. Если Вы не нашли искомую информацию при помощи одного из серверов, то достаточно велики шансы найти при помощи другого. Во-вторых, существуют специализированные серверы поиска по отдельным типам ресурсов Интернет (как, например, система поиска в сетевых новостях DejaNews), а существуют универсальные, охватывающие все виды сервисов.
Каталоги и поисковые серверы — две стороны поиска информации в Интернет. Они разные по методам, но едины в целях. Научившись быстро использовать один, наиболее подходящий для Вас, каталог и несколько хороших поисковых серверов, Вы получите средство быстрого и эффективного нахождения информации в глобальной сети.
Ежедневные ссылки
Когда я спросил одного своего коллегу, что он успевает сделать, уходя утром из дома, он ответил примерно следующее: "Умыться, пролистать газеты, прочитать свежую почту, попить кофе, просмотреть новости CNN". В этом списке казалось бы нет ничего необычного. Однако под почтой здесь имеется в виду электронная почта, а новости CNN мой коллега смотрит не по телевизору, а на WWW-сервере компании. Это пример одного из серверов, на котором информация обновляется ежедневно, пример ежедневно просматриваемой ссылки. Это может быть не только WWW-страница, предоставляемая информационным агентством, но и другой ресурс. Я, например, приходя на работу утром, всегда просматриваю сегодняшний компьютерный комикс, страницу новостей BrowserWatch (сервера, посвященного WWW-навигаторам) и страницы новостей некоторых компьютерных журналов. Один мой знакомый каждый день смотрит страничку новостей сервера, посвященного спорту. Интернет, его сервисы и информация входят в повседневную жизнь незаметно, заменяя телефон, телевизор, радио и почту. Если Вы начнете работать с Интернет, то наверняка у Вас тоже скоро появятся странички, регулярно Вами навещаемые.
Еще некоторые примеры
В завершение этого раздела приведем еще несколько примеров использования сервисов Интернет.
Когда мне интересно узнать, на какие еще платформы была перенесена суперигра Doom, я получаю эту информацию из первых рук, обратившись в рамках сервиса finger на help@idsoftware.com
Когда мне было интересно узнать, правда ли, что в Австралии женщины живут гораздо меньше мужчин, я обратился за информацией в справочник ЦРУ (CIA 1995 World Factbook), который содержит полезную справочную информацию о странах мира. Этот электронный справочник заменяет собой увесистый том на книжной полке. Он — неоценимый источник информации также, например, для школьников при написании рефератов.
Когда один из моих коллег собрался купить к своему компьютеру специфическую звуковую карту, он поинтересовался в соответствующей группе сетевых новостей, где ее лучше купить, и получил исчерпывающую информацию, которую, вероятно, просто нельзя было бы получить иным способом.
FAQ'и — ответы на часто задаваемые в сетевых новостях вопросы — самые полезные документы в компьютерном мире. Отношение сигнал/шум у них близко к максимальному. FAQ'и регулярно публикуются в соответствующих группах сетевых новостей. Если у Вас возник какой-то вопрос — смотрите FAQ. Если он существует, то в половине случаев там уже есть ответ на Ваш вопрос. Когда-то я хотел купить себе плейер компакт-дисков. Ответ на вопрос, какую модель лучше всего купить, я нашел в FAQ'е группы rec.audio.
Служба поставок компании Jet Infosystems пользуется для передачи срочных посылок почтовым экспрессом United Parsel Service. На WWW-сервере UPS по номеру посылки можно определить, где она находится в данный момент и в какое время была в том или ином аэропорту.
Новые технологии и тенденции развития
Интернет — очень быстро развивающаяся сеть. Причина этого заключена не в свойствах самой Интернет, но в общих тенденциях развития компьютерной индустрии. Поэтому не будет лишним рассказать о том, что может ожидать завтра глобальные компьютерные сети, какие технологии сегодня еще не стали общеупотребительными сервисами, но уже подают большие надежды. Первой и, пожалуй, самой перспективной из них является Java.
Java
Сегодня самым многообещающим направлением развития Интернет и сетевых технологий в целом является проект Java компании Sun Microsystems. Именно с ним связаны сегодня самые интересные новости и проекты, именно Java у всех на устах.
Java — интерпретируемый язык с синтаксисом C++, специально рассчитанный на работу в открытой сетевой среде. Текст программы на Java может компилироваться в бинарный псевдокод и передаваться по сети для исполнения на виртуальной машине в удаленном интерпретаторе. При этом доступ к ресурсам машины, на которой он работает, для Java-программы может быть ограничен с целью обеспечения безопасности. Такие передаваемые по сети маленькие программы на языке Java называются аплетами. С серверов Интернет могут вызываться не только программы, но и описания объектов или форматов данных.
Чтобы пользоваться возможностями, предоставляемыми языком Java, Ваш WWW-навигатор должен уметь вызвать для исполнения аплетов Java-интерпретатор. Первый такой навигатор был выпущен компанией Sun для операционной системы Solaris и назывался HotJava. Для первой тестовой версии он работал очень хорошо и позволял, например, смотреть страницы с анимацией и звуком. Первая страница WWW-сервера Sun, рассчитанная на использование HotJava, и сегодня является лучшей демонстрацией возможностей мультимедиа и глобальных сетей. Вскоре и Netscape Navigator, занимающий около трех четвертей рынка WWW-навигаторов, стал поддерживать Java на ряде платформ и, в частности, в Windows 95 и NT. Это обеспечило еще больший успех Java. Сегодня появляются новые навигаторы с поддержкой Java — как, например, PowerBrowser компании Oracle. Такое внимание со стороны крупнейшего производителя СУБД ясно показывает, что проект Java имеет очень хорошие перспективы. Вполне вероятно, что скоро поддержку этого сетевого языка будут обеспечивать все WWW-навигаторы, а значит и многие серверы. А если Java сможет приобрести достаточную популярность и стать стандартом де-факто, то весь Интернет и вся компьютерная технология вообще выйдут на качественно новый уровень развития, когда ресурсы компьютеров всего мира будут объединены в один компьютер под названием Сеть.
Проект Java вырос из проекта под названием Oak. Когда использование WWW еще не было столь распространенным, в лабораториях Sun велись работы над созданием языка, предназначенного для управления бытовой электроникой. Язык должен был быть удобным, компактным, эффективным и переносимым. Тогда получить искомое решение не удалось, вероятно потому, что рынок еще не был готов использовать технологии, которые и сегодня похожи на фантастику. Но работы были начаты, и дело не погибло — с появлением WWW и развитием компьютерных сетей вообще проект получил второе дыхание. Технология Java оказалась ровно тем, чего не хватало World Wide Web. У истоков Java стояли такие легендарные личности, как Билл Джой (Bill Joy), один из крестных отцов BSD UNIX, и Джеймс Гослинг (James Gosling), создатель сетевой оконной технологии NeWS (которая, вероятно, была лучше всех, существующих сегодня, но не получила распространения по коммерческим причинам).
Java позволяет решить самые глубокие проблемы WWW: отсутствие интерактивности, ограниченный контроль вида документа, ограниченный набор форматов встроенной графики и других объектов мультимедиа. Если Вы создаете документ в Интернет и используете Java, то, включив в документ картинку в придуманном Вами формате, Вы можете также указать ссылку на программу, которая умеет читать Ваш формат и рисовать картинку. Если Вас не устраивают существующие протоколы передачи данных в Интернет, то Вы можете определить свой протокол и передавать данные по нему, предварительно указав ссылку, откуда брать программу для его поддержки. WWW-навигатор, поддерживающий Java, неограниченно расширяем и позволяет реализовать все, что угодно. При этом замечательна та особенность, что с точки зрения пользователя все предельно просто — он пользуется стандартным интерфейсом, не замечая никаких сложностей с форматами, протоколами и т.д.
Сегодня Java применяется для передачи через Интернет аплетов, маленьких программ, обычно реализующих простые вещи для украшения WWW-страниц. Однако возможности и перспективы проекта Java уходят далеко за горизонты WWW. Принципиально новой идеей является передача через Интернет не просто данных, но приложений. Новая технология сделала документы объектами, вместе с которыми стали передаваться и методы их обработки. Это предоставляет возможность построения средствами Java больших программных продуктов, полностью использующих возможности современных корпоративных информационных сред, построенных на базе высокоскоростных сетей и мощных серверов баз данных в архитектуре клиент-сервер. Компания Sun Microsystems собирается наладить выпуск Java-терминалов, компактных и дешевых устройств, состоящих из дисплея, устройств ввода (клавиатуры, мыши и т.п.), простого процессора со встроенным оптимизированным интерпретатором Java и сетевой карты. Давайте попробуем заглянуть в завтра. Используя такие устройства, можно построить практически идеальную корпоративную информационную систему, где данные хранятся на одном сервере, обрабатываются на другом, а отображаются на Java-терминалах. Такая схема наиболее экономична и практична: пользовательские рабочие места дешевы, поскольку их ресурсы и архитектура специализированы и адекватны возлагаемым на них задачам; сеть минимально загружена, поскольку по ней не передается информация о том, как рисовать изображение практически по точкам (как это делается сегодня в X Window System), но передаются методы отображения объектов и данные, а значит трафик гораздо ниже; вычислительные ресурсы централизованы, а значит более эффективно используются, данные также централизованы и проще управляются, резервируются и надежней защищены. Не секрет, что в последнее время продажи мейнфреймов стали вновь увеличиваться — а вышеописанная архитектура позволила бы соединить лучшее из технологий мейнфрейм и клиент-сервер.
Все больше и больше пользователей и разработчиков Интернет начинают использовать Java, каждый день появляются новые аплеты. Примеров больших решений на момент написания статьи еще не было, но скорость движения дает повод для положительных прогнозов. Проект взял хороший старт и имеет все, что нужно для успеха: поддержку компьютерного гиганта, открытость, доступность исходных текстов программ, легкую переносимость (один из добровольцев, адаптировавших Java под ОС Linux, писал, что исходные коды Java написаны очень добротно и специально подготовлены для переноса на другие платформы), поддержку самой популярной платформы персональных компьютеров — Windows 95, совместимость с C++ (а значит и большое число программистов, способных писать на нем программы), поддержку независимых производителей программного обеспечения (например, Borland обещает выпустить среду разработки программ на Java), поддержку самого популярного WWW-навигатора — Netscape, а главное — энтузиазм и поддержку миллионов пользователей Интернет.
Компания Sun Microsystems рассчитывает с помощью Java шагнуть в следующее тысячелетие первой, создав новый рынок с новой парадигмой: "Сеть — это компьютер". Как прошли времена мейнфреймов, так пройдут времена неоправданно мощных персональных компьютеров, и что же придет тогда? Sun предлагает Java и имеет хорошие шансы на успех.
Было бы нечестно не рассказать и о недостатках этой технологии. Так, сложной проблемой является недоработанность либо недостаточная стабильность WWW-навигаторов, поддерживающих Java. Но ведь когда маленький ребенок начинает говорить, не выговаривая букву "р" — это вполне нормально. Наличие недостатков никому еще не помешало быть лучшим. У проекта Java есть все шансы быть успешным и семь футов ему под килем.
VRML
Аббревиатура VRML расшифровывается как "язык описания виртуальной реальности". Это язык описания трехмерных сцен и объектов. Через World Wide Web пользователь может получить файл в формате VRML, и, если программа-клиент обладает такой возможностью, просматривать сцену с разных точек зрения. При этом картинка на экране остается плоской, но, перемещая точку обзора, пользователь может наблюдать вид трехмерного объекта с разных сторон.
Основная проблема этой технологии заключается в том, что обработка VRML-файлов происходит на компьютере пользователя и требует значительных вычислительных и графических ресурсов. Поэтому, с одной стороны, программ-клиентов, поддерживающих VRML, не так уж много, и до сих пор нет стандартной программы для этого, доступной на различных платформах. С другой стороны, использование значительных ресурсов компьютера пользователя противоречит идеологии развития технологии по пути дешевых и легких Интернет-терминалов, способных только отображать информацию, полученную по сети. С третьей стороны, индустрия движется по законам рынка — существует огромное количество персональных компьютеров, в которые вложены большие деньги, и они, вероятно, будут развиваться в этом направлении и дальше. А коль это так, VRML — хорошее средство утилизации ресурсов ПК, по мощности переросших понятие "персональный". Долгосрочные прогнозы здесь делать нельзя, поживем — увидим.
Стереоизображения
Упоминая в этой статье о возможностях передачи стереоизображений в Интернет, я, пожалуй, даю волю фантазии. Примеров регулярного использования стерео для визуального отображения информации еще нет, но искры, из которых может разгореться пламя, уже летят.
Стереоизображения — это, как и VRML, попытка добавить к различным формам мультимедиа еще одну — трехмерное изображение, но с несколько другой стороны. Если VRML передает информацию о трехмерных объектах, отображая ее двумерно, то есть определяет способ передачи информации, то стереографика пытается решить задачу объемной визуализации объектов, то есть представления информации. Возможно, и даже наверняка, эти две технологии сольются каким-либо образом, привнеся новое измерение в информационный мир.
Уже сегодня Вы без труда можете найти в Интернет коллекции стерео-картинок, смотреть которые можно без дополнительного оборудования путем перефокусировки зрения. Вы фокусируете взгляд на воображаемой точке за поверхностью изображения так, что картинка, раздваиваясь, совмещается особым образом сама с собой, что дает визуальный эффект трехмерного изображения. В таком виде технологию, конечно, применять нельзя, поскольку это просто вредно для глаз, но человеческая мысль не стоит на месте, и завтра, возможно этот метод выльется во что-нибудь новое и более жизнеспособное.
Разумеется, для получения объемного изображения применяется и дополнительное оборудование. В простейшем варианте это просто очки, разделяющие каким-либо образом изображение между глазами, например при помощи цвета. Двухцветные очки — простейший случай, поскольку очень просты сами по себе и не требуют аппаратных изменений компьютера. Такой вариант сегодня уже практикуется в компьютерных играх. Он весьма прост, дешев и результативен. Другим методом, реализованным в играх, является присоединение к компьютеру специального шлема. Такой метод хорош тем, что не требует никакого дополнительного оборудования, кроме самого шлема, и аппаратных изменений компьютера. С другой стороны, он обеспечивает полный контроль над информацией, воспринимаемой зрительно, что имеет свои плюсы и минусы. Третья, наименее развитая, технология — использование поляризационных очков. Она, возможно, наиболее перспективна, но наименее развита, поскольку требует изменений аппаратной части компьютера.
Это технологии, которые еще не используются в Интернет, более того, они только начали развиваться в компьютерах вообще. Но как только будут разработаны жизнеспособные методы использования стереоизображений, они тут же начнут широко применяться в Интернет, поскольку компьютерная технология вступила в эру коммуникаций. Значительным препятствием тому могут послужить понятные ограничения со стороны правительств и военных на публичное развитие и распространение этой технологии.
Проблемы Интернет
У Интернет есть, конечно же, свои трудности. Вот описание некоторых из них.
На известной юмористической картинке изображена собака, сидящая за компьютером, и говорящая другой: "В Интернет никто не знает, что ты — собака." Действительно, сегодня нет адекватных средств идентификации удаленных пользователей. Это, например, приводит к возникновению проблем с доступом к информации, открытой публично, но к которой "детям до 16 вход воспрещен". Проблема так называемого киберпорно сегодня бурно обсуждается и пока далека от решения.
Другой ряд проблем — сложность реализации законов об экспорте и авторских правах. Весьма проблематично ограничить доступ через Интернет к криптографическому программному обеспечению, запрещенному к вывозу из США и приравненному в этом плане к стратегическим вооружениям.
Непонятно, что в Интернет защищается авторским правом, а что нет. Распространение электронной книги гораздо сложнее контролировать, нежели печатной, а значит, ее труднее продавать.
Интернет росла как свободная и малоуправляемая сеть. Соответственно, с ее ростом все сильнее встает проблема управляемости. Сеть коммерциализуется, уже полностью прекращено ее государственное финансирование. Интернет все меньше и меньше несет исследовательскую информацию, но больше и больше рекламную. Сеть постепенно становится индустрией, и в первую очередь развлекательной. Еще год назад подавляющее большинство документов WWW содержало сухую информацию, и даже электронные журналы отличались всего лишь парой-тройкой больших картинок. Сегодня же такие журналы уже сравнялись и обгоняют по уровню оформления и рекламы своих бумажных собратьев — на их страницах уже есть реклама, сноски, врезки, и появляются анимация и интерактивность, недоступные традиционным средствам массовой информации.
А это означает появление огромного нового рынка и коммерциализацию сети, что требует введения жестких правил игры. Все это противоречит сегодняшней коммунистической идеологии и свободе Интернет, а, значит, вызовет кардинальные изменения, которые вряд ли смогут пройти безболезненно.
Сегодня в Интернет используется протокол IP, отводящий для адреса компьютера 32 бита. Однако, учитывая все ускоряющийся рост сети, адресное пространство может просто закончиться, причем это событие прогнозируется в пределах ближайших десяти лет. Для решения этой проблемы разрабатывается протокол IP нового поколения — IPng, в котором для адреса будет использоваться 128 бит, что позволяет адресовать астрономическое количество объектов. Переход на новый протокол предполагается планомерно осуществить в оставшиеся до коллапса годы, но кто знает, сколь болезненным он окажется — ведь такие изменения требуют практически полной смены существующего программного обеспечения и активного сетевого оборудования.
Критическим вопросом для полноценного использования коммуникационных возможностей Интернет является вопрос безопасности данных. С одной стороны, компьютеры, подключенные к глобальной сети, становятся гораздо более уязвимыми. Но эта проблема в достаточной степени решаема, если точка взаимодействия корпоративной и глобальной сетей контролируема. С другой стороны, данные при прохождении от отправителя адресату могут быть прочитаны и даже изменены. Защита от опасностей такого рода весьма сложна, а средства ее обеспечения изощрены. Стопроцентных методов защиты сегодня просто не существует, но, как правило, принцип "стоимость вскрытия защиты должна быть выше ценности защищаемых данных" удается удовлетворить гораздо чаще.
Заключение
На этих страницах я описал многое из того, что, по моему мнению, полезно или интересно знать о Интернет и его сервисах читателям Jet Info. Статья писалась довольно долго (мое основное занятие — системное администрирование UNIX), и поэтому за время, прошедшее от написания первой строки до последней, многое успело измениться. Так, начиная статью, я никак не мог предполагать, что буду писать в ее конце о технологии Java. Даже если какие-либо утверждения в начале и конце статьи будут несколько различаться, не судите меня строго — эти изменения внесло Время, и в них Вы можете почувствовать скорость и направление развития технологии глобальных сетей.
Надеюсь, что теперь Вы узнали что-то новое и Интернет не оставил Вас равнодушным. Хочу еще раз напомнить, что лучший способ осваивать возможности глобальной сети — начать работать с ней. Удачных Вам путешествий в информационном пространстве!