Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Концепция_интернет_проекта.doc
Скачиваний:
3
Добавлен:
10.09.2019
Размер:
1.78 Mб
Скачать

4.4 Понятие тИц, вИц, pr

Первоначально, по запросу пользователя в поисковых машинах выдавалось всего несколько найденных страниц, соответствующих параметрам поиска. Но с каждым днем, по мере добавления информации в сети, росли и результаты поиска, начиная занимать от нескольких десятков, до нескольких сотен страниц со ссылками на искомую информацию. И естественно, достаточно быстро возникла проблема сортировки и ранжирования результатов поиска для обеспечения качественных результатов поиска, т.е. соответствия результатов поиска конкретному запросу пользователя. Соответственно, с течением времени определился, в том числе, и терминологически, ряд параметров, влияющих на очередь выдачи ссылки на ту или иную страницу с информацией в результатах поиска. У каждой поисковой машины существует свой алгоритм поиска, включающий набор параметров, непосредственно влияющих на положение сайта в выдаче результатов поиска. Мы рассмотрим только часть из них, и тому есть несколько причин. Причина 1. Ни одна поисковая машина не раскрывает полностью состав тех параметров (алгоритм поиска), которые влияют на результаты выдачи в этом "поисковике". Происходит это для того, чтобы максимально подстраховать систему от так называемых "накруток" - искусственного завышения места сайта в результатах выдачи. Причина 2. Поисковых машин существует множество, и рассматривать нюансы организации работы каждой из них в данном учебном пособии бессмысленно. Достаточно рассмотреть только некоторые, наиболее популярные в пользовательской и, соответственно, профессиональной среде (ориентирующейся на пользовательские предпочтения) поисковые машины. Итак, рассмотрим те общие параметры, которые влияют на ранг сайта в выдаче результатов поиска. В первую очередь, это популярность сайта, причем, как среди пользователей (измеряющаяся по количеству физических заходов на сайт и просмотров его страниц), так и среди других сайтов, ссылающихся на этот конкретный ресурс с помощью гиперссылок. Ссылки, которые будут проставлены на этот сайт другими сайтами, подтвердят в глазах поисковой системы значимость и важность информации, размещенной на данном сайте. А, следовательно, и ее востребованность и полезность для пользователя. Второй параметр - это количество проиндексированных данной поисковой системой страниц сайта. Чем больше таких страниц будет проиндексировано, тем больше вероятность попадания конкретной информации с этого сайта в виде ссылки в общий список выдачи результатов поиска. Пример: если на сайте содержится 200 000 страниц с разнообразной информацией, а поисковой машиной проиндексировано только 5 страниц с этого сайта, то, соответственно, она сможет отыскивать по запросу пользователя только ту информацию, которая содержится на 5 проиндексированных ею страницей. Следовательно, в выдаче результатов поиска ссылка на страницы данного сайта будет появляться неизмеримо реже, чем ссылка на страницы сайта, у которого из 200 000 страниц будет проиндексировано, например, 150 000 страниц. Два этих параметра легли в основу таких понятий, как тИЦ, вИЦ и PR (все это, так или иначе, является индексами цитирования). тИЦ - это тематический индекс цитирования (подразумевается цитирование адреса сайта, т.е. гиперссылки), рассчитываемый одной из самых крупных и популярных российских поисковых систем (на конец 2006 г.) - Яндекс. "Яндекс. Каталог (им.в виду каталог сайтов, описанных в данной поисковой системе - прим. составителя) является рейтингом описанных в нем ресурсов. Сайты в рубриках расположены по убыванию их тематического индекса цитирования (тИЦ) . Идея индекса цитирования проста - как правило, люди, создающие свой сайт в Интернете, со вниманием и ответственностью относятся к его содержанию, а также к содержанию того, на что они ссылаются и что таким образом рекомендуют своим посетителям. Наш тематический индекс учитывает количество ссылок на сайт с других сайтов, придавая этим ссылкам разный "вес" (то есть значимость) в зависимости от авторитетности ссылающегося сайта". PR (Page Rank, т.е. ранг страницы) - сходный параметр, рассчитываемый системой Google, одной из наиболее крупных и популярных в мире поисковых машин на данный момент. Это числовые значения, при подсчете которых есть ряд нюансов и различий. Допустим, значение тИЦ подсчитывается с кратностью 10 - стартуя, естественно, со значения 0. Далее, по мере роста ссылок на сайт на других ресурсах, оно растет - 10, 20, 30 и так далее - двигаясь до бесконечности, и составляя у наиболее популярных в российском сегменте интернета значения порядка нескольких десятков тысяч. Но при этом, кроме того, что ссылкам с других сайтов "поисковиком" придается разный вес, им (во всяком случае, явно) не учитываются множественные ссылки на какой-либо ресурс, расположенные на одном сайте. Допустим, если сайт, публикующий новости, будет ежедневно ссылаться на сайт, выступающий источником информации, то тИЦ сайта-источника информации не будет расти в соответствие с количеством размещенных на него новостным сайтом гиперссылок. Достаточно неплохим для большинства веб-проектов на данный момент считается тИЦ, начинающийся от значений 300-500. Стоит отметить также тот факт, что данный параметр подсчитывается для всего сайта в совокупности. тИЦ влияет, в первую очередь, на место сайта непосредственно в Яндекс.Каталоге, на выдачу в результатах поиска он если и влияет, то неявно, во всяком случае, сама компания-владелец и создатель "поисковика" отрицает факт этого влияния. С другой стороны, достаточно многие специалисты по оптимизации сайтов упоминают тот факт, что сайты, зарегистрированные в Яндекс.Каталоге, а следовательно, имеющие некий тИЦ, в выдаче стоят выше, чем сайты, незарегистрированные в нем. PR - показатель ограниченный, и исчисляется он в процентах к некоему идеалу, равному числу 10. Большинство сайтов на данный момент обладают PR от 1 до 4-5. При этом, компанией Google указывается, что именно PR является определяющим значением при формировании выдачи результатов поиска. Принцип расчета PR приблизительно следующий. Во-первых, он рассчитывается для КАЖДОЙ страницы сайта. Во-вторых, ссылаясь на странице вашего сайта на страницу другого сайта, чей PR равен или меньше вашего, вы как бы "отдаете" часть своего PR другому сайту. При этом если вы ссылаетесь на страницу с большим, чем у вас PR, то вы забираете у нее часть PR, а часть своего PR отдаете ей. И с учетом того, что ваш PR ниже, чем у той страницы, на которую вы сослались, вы, получается, повышаете свой Page Rank. Кроме того, Google определяет, входит ли ваш проект в какое-либо "сообщество" ресурсов, объединенных одной тематикой, в общесетевом и/или локальном масштабе. Крэиг Силверстейн из Google еще в 2002 г. на "Конференции по Стратегиям Поисковых Машин" говорил: "Если Вы облегчаете нашу работу, Вы нам (поисковой машине Google) больше нравитесь. Обменивайтесь ссылками с "уважаемыми" сайтами. Убедитесь, что ваши партнеры используют в ссылках ключевые слова, связанные с тематикой вашего проекта; будьте последовательны в использовании ключевых слов и фраз на всех страницах сайта и очень внимательны при подготовке текста описаний вокруг ваших ключевых слов и ссылок". вИЦ - взвешенный индекс цитирования - аналог PageRank, используемый поисковой машиной Яндекс. Алгоритм подсчета вИЦ является закрытыми. Но по некоторым показателям, это именно та величина, которая используется в алгоритмах ранжирования результатов поиска на Яндексе. Также взвешенный индекс цитирования называют пересчитанным индексом цитирования, учитывающим популярность ссылающихся сайтов. В качестве инструмента проверки ИЦ сайта можно использовать Yandex.Bar, где присутствует индикатор взвешенного индекса цитирования. Но данные, которые он показывает, касаются только главной страницы сайта. Кроме того, из общего числа доменов, ссылающихся на сайт, как правило, исключаются ссылки с сайтов, расположенных на бесплатных хостингах, ссылки из гостевых книг, форумов и ряда каталогов.