Реферат: Что такое интернет?

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">МИНИСТЕРСТВО  ОБЩЕГО И  ПРОФЕССИОНАЛЬНОГО

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">ОБРАЗОВАНИЯРОССИЙСКОЙ ФЕДЕРАЦИИ

ДАЛЬНЕВОСТОЧНЫЙГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-bidi-font-weight:bold;mso-bidi-font-style:italic">Кафедра информатики

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">

Что такое интернет

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-bidi-font-style:italic">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-bidi-font-style:italic">Аспиранта второго

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-bidi-font-style:italic">года обучения

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;mso-bidi-font-style:italic">

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;mso-bidi-font-style:italic">Незнановой

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»;mso-bidi-font-style: italic"> С. Ю.<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;mso-ansi-language:EN-US;mso-bidi-font-style:italic">

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;mso-ansi-language:EN-US;mso-bidi-font-style:italic">03.00.10.(

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»;mso-bidi-font-style: italic">ихтиология)

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

                                                                            Научныйруководитель

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-bidi-font-style:italic">профессор, д.б.н.

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;mso-bidi-font-style:italic">Иванков

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»;mso-bidi-font-style: italic"> В. Н.

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-bidi-font-style:italic">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-bidi-font-style:italic">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-bidi-font-style:italic">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-bidi-font-style:italic">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Владивосток

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">2002

СодержаниеВведение

1.<span Times New Roman"">                            

Основныепротоколы в Internetи поиск вних

2.<span Times New Roman"">                            

Инструментыпоиска

2.1.<span Times New Roman"">                                

Тематическиекаталоги

2.2.<span Times New Roman"">                                

Автоматическиеиндексы

2.3.<span Times New Roman"">                                

Российскиесистемы поиска

Список литературы

Введение.

Одно изглавных отличий Интернета от всего остального, чтосвязано с компьютерами, — это то, что для успешной работы с ним, вообще говоря,не нужно никаких книг. Сам Интернет может служить исправочником, и учебником, и энциклопе­дией самого себя. Однако на начальномэтапе, как мне кажется, польза от книги, внятно и доступно излагающей основы,может быть весьма значительной. Именно такую книгу я и постарался написать. Но преждечем вы познакомитесь с ней поближе, да­вайте попробуем ответить на самыйглавный вопрос, который, вероятно, вы себе уже задавали:

Интернет: что же это, наконец, такое

Более илименее научные (или просто наукообразные) опреде­ления Интернета,которыми заполнены книги и статьи на эту тему, конечно, имеют свою ценность. Нодля наших целей пока достаточно самого простого объяснения: Интернет— это мно­жество компьютеров, соединенных друг с другом каналамисвязи, плюс набор стандартных правил, по которым они обме­ниваютсяинформацией. При этом сами каналы связи, по­жалуй, даже менее важны, чемправила передачи данных по ним, называемые в Интернетепротоколами. Если хотя бы два компьютера взаимодействуют по одному изтаких протоко­лов — это уже настоящий Интернет.

Изобретениеи совершенствование модемов — специальных устройств, по­зволяющихкомпьютеру посылать информацию по телефону, — открыло двери в Интернет огромному количеству людей, у ко­торых нет.никакого специального сетевого оборудования, а есть лишь персональный компьютери телефонная розетка побли­зости.

Каксам Интернет, так и модемы для персональных компью­теровсуществуют уже довольно долго. Однако лишь совсем не­давно — около 1990 года — Интернет набрал, наконец крити­ческую массу пользователей иресурсов, необходимую для про­исходящей на наших глазах сетевой революции.Скоростные модемы, позволяющие обычным пользователям персональных компьютеровбез ограничений наслаждаться всеми благами Ин­тернета,появились еще позднее. А система WorldWideWeb(WWW, или«Всемирная паутина»), изобретенная в 1993 г. и бывшая поначалу лишь одной измногих составных частей сети, заняла доминирующее положение и стала определятьлицо Ин­тернета буквально в последние год-два. Такили иначе, все­мирный интернетовский бум сейчас всамом разгаре — и вам очень повезло, что вы почти не опоздали к началу представ­ления.

Интернет— это, прежде всего огромноемножество компьютеров и программ. Среди последних вы найдете не только такие,ко­торые умеют хорошо решать ваши конкретные задачи, но и го­раздо большетаких, чьи способности вам, вероятно, поначалу будет сложно даже представить.Выход в Интернет дает вам уникальную возможность,каким бы несовершенным ни был ваш компьютер, заглянуть в двадцать первыйвек и самостоя­тельно освоиться с такими понятиями, как «всемирный кибер-социум», «виртуальные деньги», «информационная средаоби­тания» и т. п., — словом, со всем тем, о чем так любят писать сейчасжурналисты.

Однакоэто лишь часть ответа на вопрос «что такое Интернет».Интернет сегодня — это не только огромное количествокомпьютеров, но еще и невероятное количество людей, для ко­торых сетьявляется принципиально новым способом общения, почти не имеющим аналогов вматериальном мире. Человек — существо социальное, и общение с себе подобными —одна из первейших его потребностей. Пожалуй, до сих пор еще ни одно техническоеизобретение (если не считать телефона) не произ­водило такого переворота в этомдревнем как мир занятии — об­щении человека с человеком.

Конечно,что именно заинтересует вас в Интернете в первуюочередь — люди или компьютеры, — зависит только от вас. Древняя метафора книгикак модели мироздания, пожалуй, за­служивает пересмотра — теперь на роль такоймодели гораздо лучше подходит компьютер. Когда же речь идет о миллионахкомпьютеров и их пользователей во всем мире, связанных в единую сеть, метафораэта уже перестает быть просто мета­форой. Вот почему не будет преувеличениемсказать, что, вы­ходя в Интернет, вы делаете для себядоступным целый мир.

1. Основныепротоколы в Internet и поиск в них.

Internetсодержит громадное количествоинформации, по этому в нем трудно найти то что нужно, если не знать где искать.Место нахождения (или адреса) каждого ресурса определяет его URL. В URL содержитсятип протокола, указывающий на какой сервер осуществляется доступ: на WWW( накоторый указывает запись: http), Gopher,ftp, telnet, или WAIS, этозависит от того какой тип информации вы будете передавать. Сетевой протокол — совокупность четко определенныхправил: как запрашивать, оформлять и высылать по сети данную разновидностьинформации (Кент, 1996).

telnet

Ксети Internet присоединены миллионы компьютеров имногие из них обладают интересными возможностями.

Оказывается,вполне осуществимо добраться до этих компьютеров чтобы посмотреть имеющиеся вних базы данных и программы. Специальная программа telnetпозволяет превратить ваш компьютер в клиента telnetдля доступа к данным и программам в многочисленных серверах telnet.Например исследователь регулярно может работать на нескольких компьютерах,администраторы которых назначают ему специальное имя и пароль.

Сампо себе telnet — просто средство связи; ни какого-тособственного интерфейса, ни возможностей поиска он не предоставляет.

Связавшисьс помощью telnet с удаленной машиной и введя в полезапроса свое входное имя (login) и пароль (password) вы дальше общаетесь именно с этой машиной ипрограммами на ней, а telnet заботится лишь оподдержании связи между вами (Левин, 1996).

Разумеется,многие хранилища информации, которые первоначально обслуживались специальнымипрограммами с доступом по telnet теперь можноперевести на WWW, что не редко и делается. Однако остались и такие которые попрежнему предоставляют свои услуги только по telnet(особенно среди каталогов и информационных служб библиотек ).

Стандартизированнаяссылка на telnet соединение с некоторым узлом Internet    ( т.е.URL- адрес  этого соединения) выглядиттак:

telnet://<адрес сервера >

FTP

Практическився информация в компьютерном мире хранится в виде файлов. По этому еще насамой заре Internet появилось специальное средстводля обмена файлами по сети — сетевой протокол FTP (FileTransfer Protocol).

Количествофайлов, доступных на узлах всего мира по анонимному FTP измеряется астрономическимицифрами и постоянно растет. К тому же Word Wide Web позволяет без какой-либопеределки существующих FTP архивов, снабжать их описаниями любой степенидетальности и удобным гипертекстовым интерфейсом.

Нокак узнать куда обращаться в поисках нужного файла?

Archie.

Поискпо имени файла на всех анонимных FTP-узлах мира можно осуществить с помощьюсистемы Archie. Она разработана несколькимипрограммистами из университета МакГила в Канаде иосуществляет индексирование станций FTP, показывая доступные в каждой станциифайлы. Archie сообщает о нескольких миллионах файловнаходящихся в более тысячи станций FTP, и предоставляет удивительно быстрыйспособ поиска того места, куда нужно направиться для получения интересующеговас файла. Поиск в базе данных сервера Archieпроизводится с помощью ключевых слов, которые в данном случае представляютсобой просто имена файлов или фрагменты имен.

СейчасArchie доступен через WWW. Это WWW страница с бланкомв котором указываются ключевые слова и опции поиска.

Хотяимя файла почти всегда имеет некое отношение к его содержимому, пользоваться Archie для тематического поиска программ не стоит. Этасистема будет полезна, если вы действительно знаете имя нужного файла или частьимени. С другой стороны если вы ищете программу, которая имеет общепринятоесокращенное название, то есть некоторая вероятность что это сокращение будетприсутствовать и в имени файла, так что можно попробовать найти такой файл спомощью Archie. Результаты поиска представляют собойсписок FTP-узлов и полных имен файлов на этих узлах. Имя файла служит ссылкойна этот файл, так что щелчок по имени позволит сразу же получить файл с данногоузла. А доменый адрес FTP-архива  выделенный крупным жирным шрифтом, перенесетвас в исходный каталог файловой системы на этом архиве.

Archieне делит свой список на страницы и его удобнее всегопросматривать прямо по мере получения (Хоникарт,1996).

URL-адрес,указывающий на FTP-соединение, должен, как минимум, включать в себя слово “ ftp” в качестве левой части и адрес узла в правой:

ftp://<адрес сервера >.

WAIS

 Почти все информационные ресурсы Internet предоставляют возможность автоматического поиска,но лишь в одной из них — в системе WAIS ( Wide Area Information Server, глобальный информационный сервер) — поиск поключевым словам, является основным методом доступа к информации.

СистемаWAIS представляет собой огромную распределенную базу данных, т.е. отдельныечасти этой базы данных расположены на разных узлах сети по всему миру.Программа-клиент для работы с серверами WAIS не только умеет общаться с ними поспециальному протоколу, но и хранит список всех баз данных WAIS с их адресами иназваниями, а иногда и с краткими описаниями. Там можно найти архивытелеконференций, всевозможные каталоги, справочники, сборники научных статей ирефератов, индексы и словоуказатели и многое другое.Практически любая информация, для которой база данных является удобной формойпредставлениями которая достаточно интересна для широкой аудитории, может бытьпредставлена в WAIS.

Базаданных WAIS настолько велика, что простое “листание” записей — крайнебесперспективный способ доступа к информации. Поэтому в WAIS применяетсядовольно сложный метод поиска по ключевым словам и фразам. Документы,полученные в результате поиска, сортируются WAIS-сервером по количествувхождения в них ключевых слов и по тому, насколько полно в каждом из нихпредставлен весь набор заказанных ключевых слов. Такая система способна даватьхорошие результаты, особенно если разбить процесс поиска на несколько этапов.

Первымэтапом поиска  обычно является запросспециальной в базе данных под названием “directory-of-servers”, которая содержит небольшие по объему описания (рефераты) всех остальных базWAIS. При этом лучше указывать не те ключевые слова, которые вас в конечномсчете интересуют, а те общие понятия, относящиеся к вашей области знаний.

Выбравна первом этапе одну или несколько баз, можно приступить к поиску собственнодокументов — что также можно делать в несколько заходов, знакомясь послекаждого поиска с результатами и изменяя список ключевых слов, пока не будетнайден нужный документ. Кроме того WAIS обладает одним полезным свойством: еслина очередном этапе поиска вы нашли документ, содержимое которого особенноблизко к тому, что вы ищите, то его можно добавить к списку релевантныхдокументов. В результате на следующем этапе WAIS найдет документы, не толькосодержащие набор ваших ключевых слов, но и похожие по своему словарному составуна те тексты, которые вы указали как наиболее подходящие.

ХотяNetscape способен работать с серверами WAIS, для этого он должен знать адресособого прокси-сервера для протокола WAIS, котороговашего провайдера может не оказаться. СпециальныеWAIS-клиенты, работающие в том числе и под Windows,не только удобные для интерактивного поиска в базах данных, но и позволяетобходиться без услуг какого-либо сервера-посредника(Левин, 1996).

URL-адресдля WAIS выглядит как:

wais://< адрес сервера>/<название базы>

Gopher

Каждыйиз рассмотренных до сих пор интернетовских протоколоввполне мог бы существовать сам по себе: telnetпредоставляет доступ к программам, FTP — к файлам, WAIS — к базам данных. Всеэти системы создавались и развивались почти независимо друг от друга и ставилиперед собой конкретную цель — построить механизм доступа к одному определенномувиду ресурсов.

Однакопо мере того как Internet рос и усложнялся, он самподталкивал людей к мысли, что информация по природе своей едина и что неслишком разумно делить ее на разные “виды ресурсов” с непохожими методамидоступа. К концу 80-ых годов идея нового универсального средства работы сразнородной информацией носилась в воздухе.

Первойсистемой, призванной воплотить в жизнь эти мечты стал Gopher,появившийся на свет 1991 году в американском университете штата Меннесота. Фундаментальным понятием, заложенным в ееоснование была структура вложенных друг в друга меню (Кирсанов,1996).

СвязавшисьGopher- клиентом с одним из Gopher-серверов, вы в первую очередь попадаете вкорневое, главное меню этого сервера. Сориентировавшись в его содержимом ипереходя далее из одного подменю в другое, можно заняться собственно поискоминформации. Информация в системе Gopher организованастрого иерархически, “от общего к частному”. На каждом шаге сервер посылаетвашему Gopher — клиенту не только содержимоеочередного меню, но и служебную информацию о том, где находятся объекты,соответствующие пунктам этого меню. Клиент выводит на экран только самоперечисление пунктов, но когда вы выберите один из них, он, сверившись симеющейся у него информацией, либо пошлет на какой-то из Gopher — серверов запрос на выдачу следующего меню, либо попытается установитьFTP-  или telnet-  соединение с некоторым узлом Internet.

Очевидноиз всех информационных инструментов Internet Gopherбольше всего похож на WWW — обе эти системы призваны служить оболочкой сразнородными ресурсами. Однако Gopher лишен тех богатых  изобразительных средств, которые делают WWWне только информационным каталогом, но и новым средством массовой информации идаже новым жанром искусства. Можно сказать, что Gopher является “подмножеством”WWW — что очень упрощает интегрирование самого Gopher как одного из видов  ресурсов в WWW. Практически все что сказано оработе с Gopher — клиентом справедливо и для путешествия по системе Gopher спомощью броузера WWW (Хоникарт,1996).

URLодного из пунктов Gopher — меню состоит из адресаGopher- сервера и перечисленных тех пунктов меню, которые приведут вас кисходному пункту:

gopher://<адрес сервера>/< пункт меню> 

WWW

Несмотряна то, что в первые годы своего существования Gopherзавоевал большую популярность, назревала нужда в какой-то более простой и втоже время максимально универсальной системе, в которой связи между ресурсамибыли бы более свободными и ассоциативными. Такая система была разработана в 1993году и названа World Wide Web (WWW). Система WWW строиться на понятии гипертекста,или, точнее гипермедиа. Гипертекст — это текст составные части которого связаныдруг с другом и с другими текстами с помощью ссылок. Гипермедиа — это то чтополучится из гипертекста, если заменить в его определении слово “текст” на“любые виды информации”: графические изображения, видео, звук и т.д.

WorldWide Webозначает буквально “всемирная паутина”. Почему она так называется. Как ясно изназвания, она глобальна. Вы не всегда знаете в какой части света находитсякомпьютер, к которому вы подключаетесь. Вы можете начинать читать страницу Web в Далласе, затем перейти в Австралию, и все это поодному нажатию кнопки мыши. WWW похожа на паутину. Это сложная информационнаясеть, соединенная гипермедиа связями. WWW позволяет не отказываться отинформационных ресурсов уже накопленных в Internet,доступных с помощью других средств — FTP, telnet и Gopher. Больше того, работа с этими ресурсами через WWWнастолько удобна, что, скажем, FTP-клиенты, бывшие когда-то отдельным классомпрограмм, теперь используются лишь немногими.

Ивсе-таки главное в World WideWeb — это не удобства доступа к FTP- архива иGopher-меню. Большинство серверов системы WWW предлагают информацию, котораябез WWW вряд ли вообще когда- либо попала бы в сеть. Быстрота создания иобновления, богатые изобразительные возможности в сочетании с легкостью доступаи огромной аудиторией сделали WWW новым средством массовой информации. ЗапускWWW-серрверов и создание WWW-страниц уже превратилось из повальной моды в новыйбизнес — со всем что свойственно современному бизнесу: платой за квадратныесантиметры рекламной площади.

Сдругой стороны, быстрому распространению системы, столь естественнообъединяющей разнородные ресурсы, способствовало не в последнюю очередь еезарождение не в недрах коммерческой фирмы, а в научном учреждении — Европейскойлаборатории физики частиц, сотрудники которой не стали делать секретов из своейразработки и даже не попытались на ней разбогатеть.

Ксчастью, сама природа WWW как прежде всего средства поиска и организацииинформации позволяет надеяться, что это замечательное изобретение непревратиться в инструмент одной лишь коммерции и рекламы (Кирсанов, 1996).

Серверыи клиенты WWW связываются между собой по специальному протоколу HTTP (Hyper Transfer Protocol, протокол передачи гипертекста). URL для WWWвыглядит как :

http://<адрес сервера>

Переходить от одной странице Webк другой — интересный способ исследования World Wide Web, однако вам рано илипоздно понадобится найти что-то конкретное. Но таким образом это сделать неудастся. В Internet имеются специальные инструментыWeb-поиска.

Инструменты поиска в WWW.

 Инструментов поиска информации в Internet, построенных на разных принципах и преследующихразные цели, существует немало. Но все их объединяет то, что они располагаютсяна специально выделенных сетевых компьютерах с мощными каналами связи,обслуживают ежеминутно огромное количество посетителей и требуют от своихвладельцев значительных затрат на поддержку и обновление. Тем не менее, почтивсе они отвечают на запросы пользователей совершенно бескорыстно, а платят заэто удовольствие спонсоры и рекламодатели. По масштабам влияния на сетевоесообщество поисковые системы, без сомнения, являются одним из краеугольныхкамней Internet.

Классификациюпоисковых систем удобнее всего строить на основании того, на сколькоавтоматизирован в них сбор и обработка информации, предоставляемойпользователям, — иначе говоря, кто набирает базу данных, в которой производитсяпоиск: люди или сами компьютеры.

2.Инструменты поиска

Условноинструменты поиска подразделяются на поисковые средства справочного типа (directories) и поисковые системы в чистом виде(searchengines).

2.1Тематические каталоги

Поисковыеинструменты первого типа чаще всего называют предметными, или тематическимикаталогами. Компания, владеющая таким каталогом, непрерывно ведет огромнуюработу, исследуя, описывая, каталогизируя и раскладывая по полочкам содержимоеWWW-серверов и других сетевых ресурсов, разбросанных по всему миру. Результатомее титанических усилий является постоянно обновляющийся иерархический каталог,на верхнем уровне собраны самые общие категории, такие как “бизнес ”, ”наука”,”искусство” и т.п., а элементы самого нижнего уровня представляют собой ссылкина отдельные WWW-страницы и сервера вместе с кратким описанием их содержимого.

Гарантийтого, что такой каталог действительно охватывает все содержимое WWW, никто недаст, однако возможная не полнота и даже однобокость подбора материалов слихвой искупается там, что пока еще не под силу никакому компьютеру —осмысленность отбора.

Предметныекаталоги предоставляют и возможность поиска по ключевым словам. Однако поискэтот происходит не в содержимом самих WWW-серверов, а в их кратких описаниях,хранящихся в каталоге.

Предметныекаталоги Internet можно пересчитать буквально напальцах, так как их создание и поддержка требуют огромных затрат. К наиболееизвестным относятся Yahoo, WWW VirtualLibrary, Galaxy и некоторыедругие.

Yahoo.

Наиболеепопулярен у населения Internet каталог Yahoo. На первой же странице Yahoo,расположенной по адресу www.yahoo.com, вы получаете доступ к двумосновным методом работы с каталогом — поиску по ключевым словам ииерархическому древу разделов.

Начавспуск по разделам каталога, вы увидите, что каждый раздел содержит точно такоеже поле для ввода ключевых слов и кнопку Search,запускающую поиск.

Каждыйраздел может включать в себя как перечисление входящих в него подразделов, таки собственно ссылки на страницы, относящиеся сразу ко всему разделу, с ихкраткими описаниями.

Вместопутешествия по дереву подраздела вы можете сразу попасть в нужное местокаталога Yahoo с помощью поиска. Введя одно илинесколько ключевых слов, разделенных пробелами, в строку поиска и нажав кнопку Search, вы получите список всего в Yahoo,что содержит в себе указанные ключевые слова. Этот список будет разделен на двечасти — “categories” и “sites”.

Еслиобщее количество ссылок, возвращенных в результате поиска, превышает 25, списокссылок будет разбит на несколько частей.

Автоматическимпоиском можно воспользоваться не только с главной страницы Yahoo,но и из любого подраздела; при этом специальный переключатель, расположенныйпод полем ввода ключевых слов, позволяет либо ограничить поиск текущим разделоми его подразделами, либо искать во всем каталоге (Черил,1998).

Magellan.

Ноне редко случается так, что выдаваемый машиной список очень велик и просмотретьего просто не реально. Выходом из этой ситуации может стать более строгий отборинформации, заносимой в каталог. Одна из самых известных систем такого рода —каталог Magellan по адресу: www.mckinley.com

Этабаза данных содержит сведения о 80 тысячах WWW-страниц — что очень не много всравнении с теми миллионами, которые существуют в сети. Однако если Yahoo в качестве описания ресурса использует одну-двестрочки текста, то сотрудники системы Magellan нанекоторые из страниц, заносимые в их базу данных, сами пишут небольшиерецензии, а также оценивают качество этих информационных ресурсов попятибалльной шкале. По мимо базы рецензий, Magellanвладеет так же собственным автоматическим индексом, для поиска в котором нужноперебросить переключатель под полем ввода в положение entiredatabase.

Какправило запрос представляет собой одно или несколько ключевых слов, разделенныхпробелами (Кирсанов, 1996).  

Point.

Схожаяпо своим принципам служба фирмы Point(http://www.pointcom.com) вообще основной упор делает не на поиск, а на работус тематическим каталогом.

СлужбаPoint известна в сети тем, что ее сотрудникипостоянно заняты оцениванием сетевых ресурсов и ведут списки тех узлов, которыеони считают принадлежат к “лучшим пяти процентам WWW”.

Самафирма Point Ведет общедоступную базу данных всех“пятипроцентных WWW-страниц, где о каждой можно прочитать подробную лицензию (Хоникарт, 1996).

Virtual Library.

Самымстарым предметным каталогом WWW является каталог VirtualLibrary:

www.w3.org/hypertext/DataSources/bySubject/Overview.html

Этасистема достаточно полно охватывает научную прослойку WWW — серверыуниверситетов, лабораторий и учебных заведений.

Russia-On-Line Subject Guide.

Дляпользователей в нашей стране определенный интерес может представлятьтематический каталог Russia-On-Line Subject Guide, расположенный поадресу www.online.ru/rmain. Этот каталог содержит довольно пестроесобрание ссылок на зарубежные источники плюс тематический обзор российских ирусскоязычных ресурсов WWW.

2.2.Автоматическиеиндексы.

Кпроблеме поиска информации в Internet можно подойти ис другой стороны. Существуют программы в которые загрузили несколько тысячобщеизвестных URL-адресов. Будучи запущена на компьютере с доступом к WWW, этапрограмма начинает автоматически скачивать из сети документы по этим URL,причем из каждого нового документа она извлекает все содержащиеся в нем ссылкии добавляет их в свою базу адресов. Поскольку в конечном счете все WWWдокументы связаны между собой, рано или поздно такая программа обойдет весь Internet.

Разумеется,программа не может ни понять ни как либо классифицировать то, что она видит всети. Программы такого типа называются роботами. Они ограничиваются сборомстатистической информации и построением словоуказателей(индексов) по текстам документов. Собираемая роботом база данных — индекс —хранит в себе, попросту говоря, сведения о том в каких WWW-документахсодержаться те или иные слова.

Именнотакой  автоматически собираемый индекс илежит в основе поисковых систем второго рода, которые часто так и называют —автоматические индексы.

Автоматическийиндекс состоит из трех частей: программы-робота, собираемой этим роботом базыданных и интерфейса для поиска в этой базе, с которым работает пользователь.Все эти компоненты вполне могут функционировать без вмешательства человека.

Посколькукакая-либо классификация или оценивание материалов в системах такого родаотсутствуют, к ним следует прибегать только тогда, когда вы точно знаетеключевые слова, относящиеся к тому, что вам нужно, — скажем, фамилию человекаили несколько достаточно редких терминов из соответствующей области. если жезадать поиск по сколько-нибудь распространенным словам, то вам не хватит жизни,чтобы обойти все полученные в результате поиска URL-адреса, — к примеру, индекссистемы Alta Vista содержит11 миллиардов слов, извлеченных из 30 миллионов WWW-страниц.

Автоматическихиндексов WWW-страниц существует немало: WebCrawler, Lycos, Excite, Inktomi, Open Textи другие.  Некоторые из них (например, Lycos) представляют собой более или менее удачный синтезпредметного каталога и автоматического индекса.

AltaVista.

Ееадрес altavista.digital.com. Эта система появилась в декабре 1995 года.Она один из самых больших по объему индексов из всех поисковых систем такогорода и самые мощные и гибкие правила построения запросов. AltaVista понимает два разных языка запросов, довольносильно отличающихся друг от друга. На первой странице AltaVista вы видите бланк для простого запроса (Simple Search), а панельзаголовка вверху страницы содержит кнопку Advanced Search, нажав которую, вы получите бланк для усложнениязапроса.

КромеWWW-страниц, Alta Vistaведет отдельный индекс для статей из более чем 14000 конференций Usenet (включая иерархию групп relcom.*).

ПоискAlta Vista: чтобы Alta Vista срабатывала на группеслов, только когда они стоят рядом, нужно заключить эту группу в кавычки. Еслинеобходимо исключить из результата все документы, содержащие определенноеслово, необходимо приписать это слово со знаком “минус”.

Словобез всякого знака действует в запросе точно так же, как и оно же со знаком“плюс”.

Вотличие от Yahoo, по умолчанию AltaVista ищет вхождения целых слов, т. е. заказанныетермины должны стоять в документе обособленно, а не быть частью других цепочексимволов. Если же вам нужно найти все вхождения слова, даже когда оно входит всостав других слов, пользуйтесь символом *. звездочка может стоять только вконце слова, а чтобы предотвратить обвальный поиск, дающий слишком многорезультатов, Alta Vistaтребует, чтобы слово, заканчивающееся на *, состояло не менее чем из 3 букв.Более того, символ * позволяет найти не любое окончание слова, а только непревышающее длину  пяти символов и несодержащее заглавных букв или цифр.

Результатыпоиска Alta Vista, как и Yahoo, выдает в виде списка ссылок на документы, но вместоописания каждого документа рядом с его заголовком вы увидите просто первыенесколько строк его текста. Если найдено будет больше 10 документов, Alta Vista разобьет их список настраницы по 10 ссылок на каждой. Alta Vista сортирует ссылки так, чтобы на первом месте стояли“самые важные” документы с вашими ключевыми словами при определении степениважности учитывая следующие факторы:

*<span Times New Roman"">                   

 входят лиключевые слова в заголовок документов;

*<span Times New Roman"">                   

 содержатся лиэти слова в первых нескольких строках документов;

*<span Times New Roman"">                   

 насколькоблизки друг к другу в тексте обнаружены ключевые слова (Кирсанов, 1996).InfoseekInfoseek, вступившийв эксплуатацию в конце 19996 года, несколько напоминает AltaVista, однакообъем обследуемых им полных текстов документов еще не превышает 30 млн. Web-страниц.Адрес: www.infoseek.com. Это довольно мощная система, обладающая высокойскоростью и простой в обращении. Возможности составления запроса почти такиеже, как и в AltaVista, но не стольбогатые. При почти полном сохранении значений знаков «плюс»,  «минус» и «кавычек», чувствительности кразнице заглавных и строчных букв и возможности ограничивать поиск фрагментами Web — страниц, Infoseekпока необладает способностью определять рядом стоящие термины (нет оператора NEAR),ограничивать поиск по дате обновления источника и, главное, усекать окончанияключевых терминов.

Ноданная поисковая система содержит массу факультативных функций. К таковымотносится, например, возможность определять количество ссылок в WWWна конкретную страницу, то есть судить, насколько онапопулярна или же, наоборот, выяснить, сколько ссылок на внешние страницысодержится на данном узле, вернее, сколько из них отражены в индексных файлах Ultraseek. Использование специальнойфункции  Imageseekпозволяет находить в Internetизображения (рисунки, фотографии) на определенную тему. Infoseekимеет также один из лучшихсправочников ресурсов Сети.

HotBot

Однимиз мощных поисковых средств в WorldWideWebможно отнести HotBot, содержащий сведения о полных текстах 110 млн. страниц.Адрес: http:// www.hotbot.com. HotBotпринадлежит к новейшим системам, поэтому егоуглубленный поиск дает поразительно широкие возможности для детализациизапроса. Это достигается за счет использования многоступенчатого меню,предлагающег

еще рефераты
Еще работы по компьютерным сетям