Реферат: Характеристика системы WWW в сети Internet

<m:mathPr> <m:mathFont m:val=«Cambria Math»/> <m:brkBin m:val=«before»/> <m:brkBinSub m:val="--"/> <m:smallFrac m:val=«off»/> <m:dispDef/> <m:lMargin m:val=«0»/> <m:rMargin m:val=«0»/> <m:defJc m:val=«centerGroup»/> <m:wrapIndent m:val=«1440»/> <m:intLim m:val=«subSup»/> <m:naryLim m:val=«undOvr»/> </m:mathPr><span Times New Roman"">СОДЕРЖАНИЕ

ВВЕДЕНИЕ… 3

1.WEB-ТЕХНОЛОГИЯ… 5

1.1Историявозникновения WWW… 5

1.2 Понятиегипертекста… 11

1.3 Архитектурапостроения WWW… 13

2. WEB-ТЕХНОЛОГИИ В ИНТЕРНЕТЕ        …………………………………..17

2.1Типы ресурсов Internet… 17

2.2 Интерфейс Web-приложений при работе в сети Internet… 22

ЗАКЛЮЧЕНИЕ… 27

ГЛОССАРИЙ ………………………………………………………………..28

БИБЛИОГРАФИЧЕСКИЙ СПИСОК … 31

Приложение … 32

ВВЕДЕНИЕ

Сеть Internet(Интернет) можно описать как огромную цифровую магистраль — систему,связывающую миллионы компьютеров, подключенных к тысячам сетей по всему миру.Ее яркое прошлое уходит своими корнями в эпоху холодной войны, конец 60-хначало 70-х годов. Первоначально данные разработки финансировалисьправительством США, и сеть, ставшая предшественницей Internet, была специальноспроектирована таким образом, чтобы обеспечить коммуникации междуправительственными узлами в том случае, если часть ее выйдет из строя врезультате ядерной атаки. Применяемый в ней протокол TCP/IP (TransmissionControl Protocol/Internetwork Protocol — протокол управленияпередачей/межсетевой протокол) разработан с учетом того, чтобы компьютеры всехвидов могли совместно использовать сетевые средства и непосредственновзаимодействовать друг с другом как одна эффективно интегрированная компьютернаясеть.

СегодняInternet сильно разрослась и связывает уже десятки миллионов пользователейкомпьютеров во всем мире. Эта глобальная «сеть сетей» охватываеттысячи университетских, правительственных и корпоративных сетевых систем,связанных высокоскоростными частными и общедоступными сетями, а также включаетв себя такие популярные онлайновые службы как America Online, CompuServe иProdigy.

Идея созданияуниверсальной базы данных прорабатывалась в течение длительного периода, итолько недавно были получены средства создания подобных баз данных. Многиерассматривают Internet и Всемирную паутину (WorldWideWeb, WWW) какэкспериментальный образец такой базы данных. Технология, разработанная для WWW,воплощает идею глобальной информационной базы данных, реализованную в пределахсовременных возможностей.

Как правило,эти сведения воспринимаются скорее как признак эрудиции, чем как практическиполезная вещь. Действительно, информационный объем Web-пространстваудовлетворяет многих пользователей. Однако, как только поиск ставится напрофессиональную основу и заставляет нести ответственность за выполненнуюработу контроль за полнотой охвата ресурсов выдвигается на передний план.

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

<span Arial CYR",«sans-serif»; color:black;mso-bidi-font-weight:bold">

1. WEB-ТЕХНОЛОГИЯ

1.1<span Times New Roman"">          

Историявозникновения WWW

Что же предлагалТим Бернерс-Ли в 1989 году и что из этого получилось? В «World Wide Web:Proposal for HyperText Project», направленных руководству CERN, он считал,что информационная система, построенная на принципах гипертекста, должнаобъединить все множество информационных ресурсов CERN, которое состояло из базыданных отчетов, компьютерной документации, списков почтовых адресов,информационной реферативной системы, наборов данных результатов экспериментов ит.п. Гипертекстовая технология должна была позволить легко«перепрыгивать» из одного документа в другой.

Проектделился на две фазы, или, как у нас принято говорить, очереди. Первая очередь(продолжительностью в три месяца) должна была показать жизнеспособность идеипроекта. В течение этого этапа работ предполагалось разработатьпрограммы-интерфейсы для работы в алфавитно-цифровом режиме ипрограмму-интерфейс для Macintosh и NeXT, работающую в графическом режиме,сервер для доступа к ресурсам Usenet, сервер для доступа кинформационно-поисковой системе CERN, гипертекстовый сервер и программу-шлюзмежду Internet и DECnet.

В последующиетри месяца (вторая очередь) предполагалось разработать средства подготовкигипертекстовых документов, полноэкранную программу просмотра для VM/XA,X-Window-интерфейс и систему автоматической нотификации просматриваемыхматериалов.

Кромепрограммного обеспечения предполагалось разработать общий протокол обменаинформацией в сети, метод отображения текста на экране компьютера, создатьнабор базовых документов, иллюстрирующих работу системы, который мог быпополняться за счет документов пользователей, обеспечить поиск по ключевымсловам в этом наборе документов.

Любопытно,что из проекта в обязательном порядке исключались всякие исследования,связанные с конвертированием информации из форматов каких-либо редакторов вформаты данных системы, возможностью работы с видео — и аудиоинформацией, всеработы, связанные с защитой информации от несанкционированного доступа.

На всю этуполугодовую работу автор просил 4-х разработчиков (software designers) и одногопрограммиста, и для каждого из них отдельное рабочее место (компьютер тоготипа, для которого разработчик будет писать программное обеспечение). Кромеэтого требовалось приобрести коммерческое программное обеспечение, которое былобы полезно при разработке системы (Guide, KMS, FrameMaker).

Как видно,запросы были невелики, и в октябре 1990 года проект стартовал. Уже в ноябре былреализован прототип системы для NeXT, к рождеству «задышал» line modebrowser, разработке которого придавалось особое значение, т.к. он открывалдоступ к системе через telnet, а в марте его можно было уже демонстрировать.Через год в Internet был установлен анонимный telnet для доступа в систему.Первое сообщение об WWW было послано в телеконференции: alt.hypertext,com.sys.next, comp.text.sgml и comp.mail. multimedia, в августе 1991 года.

Посовременным меркам результаты, которых достигли разработчики к 1991 годувыглядят довольно скромно, если не вдаваться в суть работы и ограничитьсятолько внешним ее проявлением. Сообщество Internet получило еще одну программу,работающую в режиме командной строки. Прошло еще целых полтора года до тогомомента, когда программа Mosaic, разработанная Марком Андресеном (MarkAndressen) из Национального Центра Суперкомпьютерных Приложений (NCSA), ипостроенная на принципах WWW, обеспечили бурный рост популярности«паутины» в Internet.

NCSA началапроект по разработке интерфейса в World Wide Web месяц спустя после объявленияCERN. Одна из задач NCSA — это разработка доступных некоммерческих программ, сдругой стороны NCSA изучает новые технологии на предмет их коммерческогоприменения в будущем. World Wide Web, безусловно, подходила под эти двапараметра. Кроме того, спецификации WWW производили впечатление добротновыполненной академической работы с обзором литературы по данному вопросу,обилием ссылок и обоснованностью принятых решений. Мультипротокольныйпереносимый интерфейс в WWW, создание которого начала Группа РазработкиПрограммного Обеспечения NCSA, был назван Mosaic. Пробная версия программы былазакончена в первой половине 1993 года, а в августе 1993 была анонсированаальфа-версия для Internet.

Следуетотметить, что сам проект Mosaic внес огромный вклад в развитие спецификацийWorld Wide Web, существенно обогатив различные компоненты системы. РазработчикиMosaic ввели в стандарты WWW большое количество новшеств. Агрессивная политикакоманды NCSA привела к тому, что многие программы-интерфейсы, разработанные врамках ранних стандартов, постепенно стали отмирать, не выдержав конкуренции.Для самого NCSA это закончилось тем, что лидер команды, Марк Андресен, покинулв марте 1994 года NCSA и организовал коммерческую корпорацию Netscape. C этогомомента начался новый этап борьбы, но теперь между старыми коллегами. Netscapeактивно навязывает свои стандарты, что приводит к тому, что документы,подготовленные с расширениями Netscape неправильно отображаются Mosaic, адокументы с расширенными возможностями NCSA могут вообще не отображатьсяNetscape.

Следуетотметить, что проект NCSA преследовал большие цели, нежели простопрограмму-интерфейс в WWW. С самого начала Mosaic разрабатывалась как программас возможностями доступа к ресурсам Internet посредством различных протоколов, вчисло которых входили FTP, telnet, NNTP, SMTP. Однако вначале предполагалось,что делаться это будет за счет вызова внешних, относительно Mosaic, программ. Внастоящее время Netscape сам поддерживает, кроме перечисленных, протоколыдоступа в Gopher и Wais. Последнее позволяет использовать Netscape, впрочем, каки Mosaic, для работы вне рамок World Wide Web.

Mosaic нанекоторое время затмила разработки CERN. Однако эта группа имела хорошопродуманную стратегию развития системы, которая включала в себя следующиеосновные моменты: разработка и поддержка стандартов спецификаций системы,разработка библиотеки свободно распространяемых мобильных кодов системы,полного комплекта средств, обеспечивающих разработку и реализацию компонентовсистемы на любом типе компьютера в сети, подготовка набора справочных и демонстрационныхдокументов о состоянии сети и направлениях ее развития. Данная стратегияпозволила распространять программное обеспечение, разработанное в рамкахпроекта в Internet, а наличие line mode broser'а позволила открыть возможностиWWW для огромной аудитории пользователей алфавитно-цифровых устройств,подключенных в сеть. Некоторое время NCSA лидировала и по числу установоксерверов, однако в настоящее время CERN обеспечил себе паритет и в этойобласти. Правда, и здесь не обошлось без «накладок». Так, форматыфайлов конфигурации программы imagemap, обеспечивающей работу с графическимигипертекстовыми ссылками, у этих двух серверов различны.

Другимпоказателем успешного развития работ является образование W3-консорциума.Консорциум образован после подписания соглашения между МассачусетскимТехнологическим Институтом (MIT, USA) и Национальным Институтом Информатики иАвтоматики (INRA, France) с согласия CERN. Если не вдаваться в подробности, тосмысл этого соглашения заключается в том, что все программное обеспечениеаккумулируется в MIT, участники имеют право copyright на все разработанноепрограммное обеспечение и спецификации. Программное обеспечениераспространяется свободно. За представителем MIT закрепляется должностьдиректора, а за представителем INRA — должность зам. директора. Взносыполноправных участников W3C составляют $50.000 в год, а ассоциированных членов- $5.000 в год, соглашение заключено на три года начиная с 1 октября 1994 года.Любопытно, что организации с годовым оборотом, превышающим $50 миллионов,обязаны регистрироваться как полноправные члены, и что консорциум надеетсяполучать прибыль, превышающую $1,5 миллиона, т.к. предусмотрен порядокиспользования средств сверх этой суммы. Средства до этого предела используютсяна развитие системы и исследования.

ОбразованиеNetscape Corporation и W3C легко объяснимы с точки зрения роста популярностиWWW. В марте 1993 года трафик World Wide Web составлял 0,1% от общего трафикасети NSF, сентябре 1993 года он уже составил 1,0% от общего трафика сети NSF. Воктябре 1993 года количество зарегистрированных серверов WWW равнялось 500, а киюню 1994 года оно достигло 1500 и продолжает стремительно расти.

Следуетотметить, что появление технологии WWW и ее бурный прогресс не одинок.Приблизительно в это же время появились и другие распределенные информационныетехнологии в Internet. Это, в первую очередь, Gopher и Wais. Столь бурный ростэтого сектора компьютерных технологий привел к появлению на свет оченьинтересного документа, подготовленного по заказу Комиссии Европейского Союза кежегодной встрече руководителей Союза 24-25 июня 1994 года на Корфу. Документпрямо обращает внимание руководителей стран Союза на тот факт, что происходитбурный рост рынка информационных технологий, и если Союз не хочет в очереднойраз оказаться на вторых ролях, то должен предпринять энергичные усилия поподдержке работ в этой области. Авторы доклада утверждают, что происходиточередная техническая революция, вызванная возможностями современныхтелекоммуникационных систем и компьютерных сетей.

Авторывыделяют основные сферы применения новых технологий:

·<span Times New Roman"">  

работапосредством сети, т.е. создание новых рабочих мест;

·<span Times New Roman"">  

обучениепо сети;

·<span Times New Roman"">  

научныекоммуникации;

·<span Times New Roman"">  

обычныеуслуги по сети;

·<span Times New Roman"">  

управлениедорожным движением;

·<span Times New Roman"">  

управлениевоздушным движением;

·<span Times New Roman"">  

быстроемедицинское обслуживание;

·<span Times New Roman"">  

созданиеединой системы защиты прав потребителей и производителей информационных услуг;

·<span Times New Roman"">  

созданиеединой европейской административной сети;

·<span Times New Roman"">  

созданиеинформационной сети общего пользования для всех граждан Союза.

 В каком-то смысле учреждение W3C являетсяответом профессионалов на медлительность бюрократов из Комиссии Евросоюза.Среди учредителей W3C один из авторов документа — Мартин Банжеманн (MartinBangemann).

Следующим важным этапомразвития технологии World Wide Web стало появление весной 1995 года языкапрограммирования Java, анонсированного компанией Sun Microsystems. Если бытьболее точным, то прямое отношение к World Wide Web имеет не сам язык, амобильные коды и возможность их интерпретации программами просмотра Web. Создавсвой браузер (программу просмотра) HotJava, Sun смогла продемонстрировать, чтоидеология интерпретации языка разметки документов может быть расширена. Встраницы теперь можно стало встраивать фрагменты программ, которые послепередачи по сети активировались на компьютере пользователя, расширяя тем самымконцепцию распределенных вычислений.

К этомувремени кроме Java появились еще и языки управления сценариями просмотрадокументов, самым известным из которых стал JavaScript. Тем самым, к середине1996 года технология World Wide Web превратилась в полноценную гипертекстовуютехнологию, которая стала позволять решать большинство из тех задач, до которыхдоросли локальные гипертекстовые системы.

Учитывая всесказанное выше, попытаемся подробно остановиться на особенностях World Wide Webи отдельных ее компонентах, спецификациях и способах наращивания системы засчет внешнего программного обеспечения, существующем программном обеспечении иособенностях его функционирования на различных компьютерных платформах. Этимвопросам и будут посвящены следующие несколько разделов.

1.2 Понятиегипертекста

В предыдущемразделе речь шла об истории и основных вехах развития World Wide Web. Впоследнее время часто приходится слышать, что WWW — это очень просто. Однако заэтой кажущейся простотой скрывается хорошо продуманная сложная система. Приэтом следует заметить, что система бурно развивается. Для того, чтобы болееточно описать это развитие, наши англоязычные коллеги используют эпитет «dramatic».Познакомимся более подробно с WWW.

В 1989 году,когда Т. Бернерс-Ли предложил свою систему, в мире информационных технологийнаблюдался повышенный интерес к новому и модному в то время направлению — гипертекстовым системам. Сама идея, но не термин, была введена В.Бушем(Vannevar Bush) в 1945 году в предложениях по созданию электромеханическойинформационной системы Memex. Несмотря на то, что Буш был советником по наукепрезидента Рузвельта, идея не была реализована. В 1965 году Т.Нельсон (Ted Nelson)ввел в обращение сам термин «гипертекст», развил и даже реализовалнекоторые идеи, связанные с работой с «нелинейными» текстами. В 1968году изобретатель манипулятора «мышь» Д. Енжильбард (Doug Engelbart)продемонстрировал работу с системой, имеющей типичный гипертекстовый интерфейс,и, что интересно, проведена эта демонстрация была с использованием системытелекоммуникаций. Однако внятно описать свою систему он не смог. В 1975 годуидея гипертекста нашла воплощение в информационной системе внутреннего распорядкаатомного авианосца «Карл Винстон», которая получила название ZOG. Вкоммерческом варианте система известна как KMS. Работы в этом направлениипродолжались и, время от времени, появлялись реализации типа HyperCard фирмыApple или HyperNode фирмы Xerox. В 1987 была проведена перваяспециализированная конференция Hypertext'87, материалам которой был посвященспециальный выпуск журнала «Communication ACM».

Идеягипертекстовой информационной системы состоит в том, что пользователь имеетвозможность просматривать документы (страницы текста) в том порядке, в которомему это больше нравится, а не последовательно, как это принято при чтении книг.Поэтому Т.Нельсон и определил гипертекст как нелинейный текст. Достигается этопутем создания специального механизма связи различных страниц текста при помощигипертекстовых ссылок, т.е. у обычного текста есть ссылки типа«следующий-предыдущий», а у гипертекста можно построить еще скольугодно много других ссылок. Любимыми примерами специалистов по гипертексту являютсяэнциклопедии, Библия, системы типа «help».

Простой, напервый взгляд, механизм построения ссылок оказывается довольно сложной задачей,т.к. можно построить статические ссылки, динамические ссылки, ассоциированные сдокументом в целом или только с отдельными его частями, т.е. контекстныессылки. дальнейшее развитие этого подхода приводит к расширению понятиягипертекста за счет других информационных ресурсов, включая графику, аудио- ивидео-информацию, до понятия гипермедиа.

1.3 Архитектурапостроения WWW

От описанияосновных компонентов перейдем к архитектуре взаимодействия программногообеспечения в системе World Wide Web. WWW построена по хорошо известной схеме«клиент-сервер». На рисунке 1 (см. приложение) показано, какразделены функции в этой схеме.

Программа-клиентвыполняет функции интерфейса пользователя и обеспечивает доступ практически ковсем информационным ресурсам Internet. В этом смысле она выходит за обычныерамки работы клиента только с сервером определенного протокола, как это происходитв telnet, например. Отчасти, довольно широко распространенное мнение, чтоMosaic или Netscape, которые, безусловно, являются WWW-клиентами, это простографический интерфейс в Internet, является верным. Однако, как уже былоотмечено, базовые компоненты WWW-технологии (HTML и URL) играют при доступе кдругим ресурсам Mosaic не последнюю роль, и поэтому мультипротокольные клиентыдолжны быть отнесены именно к World Wide Web, а не к другим информационнымтехнологиям Internet. Фактически, клиент — это интерпретатор HTML. И кактипичный интерпретатор, клиент в зависимости от команд (разметки) выполняетразличные функции. В круг этих функций входит не только размещение текста наэкране, но и обмен информацией с сервером по мере анализа полученного HTML-текста,что наиболее наглядно происходит при отображении встроенных в тексте графическихобразов. При анализе URL-спецификации или по командам сервера клиент запускаетдополнительные внешние программы для работы с документами в форматах, отличныхот HTML, например GIF, JPEG, MPEG, Postscript и т.п. Вообще говоря, для запускаклиентом программ независимо от типа документа была разработана программаLuncher, но в последнее время гораздо большее распространение получил механизмсогласования запускаемых программ через MIME-типы.

Другую частьпрограммного комплекса WWW составляет сервер протокола HTTP, базы данныхдокументов в формате HTML, управляемые сервером, и программное обеспечение,разработанное в стандарте спецификации CGI.

До самогопоследнего времени (до образования Netscape) реально использовалось дваHTTP-сервера: сервер CERN и сервер NCSA. Но в настоящее время число базовыхсерверов расширилось. Появился очень неплохой сервер для MS-Windows и Apachie-сервердля Unix- платформ.

Существуют идругие, но два последних можно выделить из соображений доступностииспользования. Сервер для Windows — это shareware, но без встроенногосамоликвидатора, как в Netscape. Учитывая распространенность персоналок в нашейстране, такое программное обеспечение дает возможность попробовать, что такоеWWW. Второй сервер — это ответ на угрозу коммерциализации. Netscape уже нераспространяет свой сервер Netsite свободно и прошел слух, что NCSA-сервертакже будет распространяться на коммерческой основе. В результате был разработанApachie, который, по словам его авторов, будет freeware, и реализует новыедополнения к протоколу HTTP, связанные с защитой от несанкционированногодоступа, которые предложены группой по разработке этого протокола и реализуютсяпрактически во всех коммерческих серверах.

База данныхHTML-документов — это часть файловой системы, которая содержит текстовые файлыв формате HTML и связанные с ними графику и другие ресурсы. Особое вниманиехотелось бы обратить на документы, содержащие элементы экранных форм. Этидокументы реально обеспечивают доступ к внешнему программному обеспечению.

Прикладноепрограммное обеспечение, работающее с сервером, можно разделить напрограммы-шлюзы и прочие. Шлюзы — это программы, обеспечивающие взаимодействиесервера с серверами других протоколов, например FTP, или с распределенными насети серверами Oracle. Прочие программы — это программы, принимающие данные отсервера и выполняющие какие-либо действия: получение текущей даты, реализациюграфических ссылок, доступ к локальным базам данных или просто расчеты.

Все, что былосказано до этого момента, можно отнести к классической схеме World Wide Web. Внастоящее время следует говорить об изменении общей архитектуры.

Как видно изрисунка 2 (см. приложение), к середине 1996 года произошли некоторые измененияв архитектуре сервиса World Wide Web.

Произошелвозврат к модульной структуре сервера World Wide Web. Этот возврат былреализован в виде спецификации API. API — это спецификация разработкиприкладных модулей, которые встраиваются в сервер, точнее редактируютсясовместно с модулями сервера. Применение во всех серверах многопотоковойтехнологии выполнения подзадач делает такой способ расширения возможностейсервера более экономичным с точки зрения ресурсов вычислительной установки, чемразработка CGI-скриптов.

В дополнениек HTML активно стал применяться еще один язык разметки — VRML (Virtual RealityModeling Language). В данном случае речь идет об описании трехмерных сцен ивозможности «бродить» по этим мирам. При этом в VRML также, как и вHTML предусмотрены гипертекстовые ссылки, что позволяет создавать смешанныебазы данных, где информационный архив, например, можно представить в виде книгв библиотеке, среди которых может путешествовать автор, выбирая нужную емутематику и источник, которые затем представляются в формате документа HTML.

Java-апплеты- это мобильные коды Java, ссылки на которые вмонтированы в тело документа. Придоступе к такому документу программа просмотра пользователя предварительноанализирует документ на предмет наличия в нем такого типа ссылок, и, если онисуществуют, то подкачивает мобильные коды в свою память. Коды могут сразувыполняться по мере размещения их на компьютере пользователя, но могутактивироваться и при помощи специальных команд.

Как видно изрисунка, изменения коснулись и клиентской части технологии. В настоящее времяпроисходит постепенный переход от простой классической архитектурыклиент-сервер к архитектуре с сервером приложений, в роли которого выступаетпрограмма-клиент. В частности, NCSA опубликовала спецификацию CCI (CommonClient Interface) для разработки приложений для работы с сервисами World WideWeb через программу Mosaic.

Завершаяобсуждение архитектуры World Wide Web хотелось бы еще раз подчеркнуть, что еекомпоненты существуют практически для всех типов компьютерных платформ исвободно доступны в сети. Любой, кто имеет доступ в Internet, может создатьсвой WWW-сервер, или, по крайней мере, посмотреть информацию с других серверов.

2. WEB-ТЕХНОЛОГИЙ В ИНТЕРНЕТЕ

2.1Типы ресурсов Internet

Сегодняинформация в Интернете оказывается доступной из источников разного типа.Планировать поиск без полного представления об их спектре и особенностяхфункционирования невозможно. Перечень основных типов ресурсов, который можноиспользовать как карту при планировании поисковой процедуры. Фактически вопросставится более широко — об основных способах представления, передачи иобработки информации в Сети.

Электронная почта и почтовые роботы. Адрес электронной почты отдельного лица или организациитрадиционно используются для идентификации владельца. В коммуникационныхресурсах Сети — онлайновых средствах коммуникации пользователей и системетелеконференций нередко он оказывается необходимым атрибутом каждого участника.Специальная URL-схема mailtoпозволяет вставлять в Web-страницу гиперссылку на e-mail, автоматически открывающуюпочтового клиента. В этом виде она широко применяется в WWW. Сами адреса при этом свободноиндексируются поисковыми системами и доступны для поиска через поисковые машиныобщего назначения. AltaVista, например, показывает, что адреса электроннойпочты встречаются почти на 100 миллионах Web-страниц из 150 миллионовзаиндексированных ей документов.

Адреса e-mail активно накапливаются и в специальныхсистемах поиска людей и организаций, о которых пойдет речь ниже. Серьезноенеудобство для поиска по e-mail составляет то, что при получении адреса допускаетсярегистрации пользователя под псевдонимом. Эта практика особенно широкораспространена на серверах, предоставляющих бесплатные почтовые ящики.

Почтовыероботы — это специальные программы, способные отвечать определенными действиямина команды, поступающие им по электронной почте. Их основное назначение — пересылкаданных по запросу в случае, когда те не доступны иным способом, а также какальтернатива работы в режиме on-line с каким-либо из известных ресурсов,например, FTP-архивами. Адрес почтового робота имеет обычный формат, например,mailserv@turbo.nsk.su (файловый сервер Новосибирского узла TURBO). Справка оперечне допустимых команд обычно высылается роботами на адрес пользователя вответ на сообщение с пустым полем subject и единственным словом help, набранномв теле сообщения с первой позиции. При поиске почтовые роботы обычно используютсялишь как посредники при получении информации. Иногда приходится сталкиваться стем, что они оказываются единственным средством получения нужных сведений.

Глобальная система телеконференций Usenet, региональные испециализированные телеконференции. Система построена по принципу электронных досок объявлений,когда пользователь может разместить свою информацию в одной из тематическихгрупп новостей. Затем эта информация передается пользователям, которыеподписаны на данную группу. Полное число групп новостей Usenet превышает 20тысяч и сведения о них можно найти, например, на Yahoo. Все они одновременно неподдерживаются ни одним сервером, так что тр уднее бывает отыскать не названиесоответствующей группы, а сервер телеконференций, с которого ее можно загрузить.Usenet — ключевое слово именно для глобальной системы телеконференций.Региональные и специализированные системы также имеют распространение. Ресурснаиболее значим для быстрого накопления информации по узкому вопросу, а припоиске — чаще для получения частной, неофициальной информации. Списки рассылки подразумевают болееили менее систематическую рассылку сообщений информации по электронной почте.Если пользователь сам может поместить информацию в список рассылки, то этоначинает напоминать систему телеконференции, однако не требует специальногоклиента. Небольших по охвату адресов узкоспециальных или рекламных списковрассылки в Сети насчитывается огромное количество. Здесь стоит обратитьвнимание на те, авторитет которых получил международное признание. Если неговорить о каких-то специальных интересах, то они необходимы поисковику,главным образом, для того, чтобы быть в курсе последних событий, происходящих вжизни Интернета. Владение сетевой лексикой по широкому спектру тем иосведомленность о крупнейших проектах, реализуемых в Сети, которые можнопочерпнуть из списков рассылки, позволяют более результативно строить поисковыезапросы.

Онлайновые средства коммуникации пользователей(chat, ICQ и другие) предполагаютвозможность обмена информацией между двумя или большим количествомпользователей Сети в режиме реального времени через посредство специальногочат-сервера. Частью такого обмена может становиться текстовый диалог, передачаграфики прямо в процессе ее создания, голосовая и видео связь, обмен файлами.Долгое время ресурсы этого типа крайне редко использовались в решении поисковыхзадач, однако ситуацию изменило появление в 1996 году нового сервиса этоготипа, а именно службы ICQ, известной среди российских пользователей как«Аська» (http://www.icq.com).

В отличие отсуществовавших ранее чатов, где регистрация участников, как правило, носилаанонимный характер и действовала лишь на протяжении сеанса связи, разработчикиICQ предложили каждому пользователю регистрационный номер-идентификатор, которыйсохранялся бы за ним постоянно. Это решение имело грандиозные последствия вобласти компьютерного общения людей. Уникальный ICQ номер грозит появиться навизитных карточках рядом с телефоном, адресом электронной почты и домашнейстраницей. При поиске людей и организаций можно с успехом использоватьпоисковую службу ICQ, которая становится доступной сразу после установкиICQ-клиента на компьютер.

Врегистрационных списках чатов обычно присутствуют сведения о месте проживанияучастников, и они редко указываются неверно.

Системы поиска людей и организацийв современной Сети характеризуются двумя важными моментами:большинство этих ресурсов уже перенесено на Web-сервера и все более широкоеприсутствие получает в них информация о людях и организациях, которые не имеютпрямого или вообще никакого отношения к Интернету. С последним утверждениемсвязаны известные факты появления в Сети телефонных, адресных и других баз данных,как отдельных организаций, так и целых регионов. Тем не менее, такой чистосетевой идентификатор пользователя как адрес e-mail остается доминирующим поисковыматрибутом для многих сервисов этого типа. Источником пополнения их баз данныхстановятся материалы телеконференций, Web-сервера, а также самостоятельнаярегистрация пользователей.

Наряду cпереориентированием сервисов под WWW в Сети продолжает работать одна из самыхстарых поисковых служб подобного типа — Whois, доступная по протоколу telnet ссервера whois.internic.net после входа по login: whois.

Базы данных Hytelnet, с доступные по протоколу telnet в ряде случаев представляют собойсовершенно уникальную информацию, прежде всего по библиотечным каталогамевропейских и американских университетов, а также государственных учреждений.Наиболее внушительный перечень баз данных этого типа, превышающий 1600 единицможно найти на Web-сервере по адресу www.lights.com/hytelnet/. Каждая изних обладает оригинальной системой навигации и поиска, реализуемой черезкоманды, которые вводятся с клавиатуры в алфавитно-цифровом режиме.

Система файловых архивов FTP, системы поиска в FTP-архивахглобального и регионального охвата. Ресурсы этого типа неотступили так безоговорочно под натиском Web-технологий, как большинствоостальных. Одна из причин в огромном количестве информации, накопленной в FTP-архивахза десятилетия эксплуатации компьютерных систем, которая по-прежнему ценна дляспециалистов. Социального заказа на ее перенос в Web-пространство в полномобъеме не существует. Другая причина кроется в простоте доступа, навигации ипередачи файлов по FTP. Так или иначе, сегодня FTP-ресурсы востребованы и дажехарактеризуются развитием не только своей единственной глобальной поисковойсистемы Archie (адрес одного из стабильно доступных Web-шлюзов к ней — ftpsearch.ntnu.no), но и региональных систем, в частности российской — ftpsearch.city.ru, охватывающей более 2000 серверов.

FTP-архивы — это в первую очередь источники программного обеспечения, успешно конкурирующиес Web-узлами, которые специализируются на продаже и представлении коллекцийпрограмм. В отличие от Web-узлов на них гораздо чаще можно столкнуться снарушением авторских прав в виде пиратских копий программ и отдельныхматериалов, продаваемых на других узлах за деньги. Как следствие теневых сторонFTP-сервиса — опасность заражения вирусом из непроверенного источника. Поиски,какой же информации стоит начинать с поисковой

еще рефераты
Еще работы по компьютерным сетям