четверг, 23 апреля 2009 г.

SEO Guide. Глава 2: Аналогия

Если вы не программист, работающий в сфере нечеткого выбора, то первым делом необходимо образно описать ситуацию. Допустим, нам нужно найти лучших водопроводчиков в городе. Для выполнения этой задачи вы можите поговорить с каждым из обитателей города. Первое что приходит в голову - это спросить у каждого: «ты хороший водопроводчик или нет?». По ответам можно построить рейтинг водопроводчиков города. Рейтинг будет точным? Я думаю, что нет. Плохой водопроводчик в надежде, что вы его примете на работу скажет, что он хороший. Хороший водопроводчик может постесняться и назвать себя нормальным водопроводчиком.

Как вы уже догадались, в этом примере вы - это поисковик, а люди, которых вы спрашивали - это сайты. А вариант ранжирования, который мы рассмотрели это ранжирование по частоте упоминания ключевого слова в контенте.

Мы можем несколько улучшить качество рейтинга, если тех, кто себя перехваливает (сильно большая концентрация ключевых слов) - понизим или вовсе исключим из рейтинга. На сленге поисковых оптимизаторов эффект понижения сайта в выдаче при слишком высокой концентрации ключевого слова на странице называется “тошнота”.
Можно ввести параметр возраста – очевидно, что в человек в 35 лет, как правило, лучше владеет своим ремеслом, чем в 20 (возраст сайта). Можно посмотреть визитку человека (мета теги).

Второе, может прийти в голову - это учитывать упоминания этого человека другими людьми. Т.е. посчитать некую меру известности человека. Если человек известен, то можно предположить, что он известен благодаря своим профессиональным способностям. Еще логично предположить, что если про человека говорят 5 известных людей, то он более известен, если про него говорят 5 неизвестных людей. И так дале… В SEO аналогичная мера называется весом страницы.

Строим второй рейтинг известности, что получаем полную белиберду: политики, актеры и певцы сверху рейтинга, а нам нужно найти водопроводчика. Убираем всех, кто сказал, что он не водопроводчик. Но тоже получаем меньшую, но все равно белиберду кто-то из актеров работал водопроводчиком и вскользь об этом упомянул и появился вверху рейтинга. Используем гипотезу, чем больше человек популярен, тем больше ему можно верить. Умножаем первый рейтинг (частота) на второй (известность). И получаем относительно нормальный рейтинг.

Дальше-больше. Если мы учитываем мнение человека о себе, то почему не учитывать мнение других о нем. Расспросим весь город, кто самый лучший водопроводчик. И построим рейтинг, следуя правилу: «чем больше человек известен - тем больше ему верим». Он получился довольно точным, но все же прошлым рейтингом пренебрегать не стоит умножим его, скажем, на 0.1 приплюсуем его к прошлому. Получиться довольно хорошая модель, если бы не одно «но». Это «но» оптимизаторы. Можно заплатить деньги известным людям, что бы они в очередном опросе сказали, что Вася Пупкин лучший водопроводчик планеты. Поэтому помножим каждое упоминание, на какой то коэффициент вероятности правдивости (естественности) этого упоминания. Это полностью не убьет эффект «продажности», но его немного сократит. Если мы знаем, что человек соврал о другом человеке, то его словам лучше не верить и в дальнейшем игнорировать его мнение. (Поставить «непот фильтр»). Если человек соврал о себе, то его необходимо полностью удалить из рейтинга. (Забанить).

Есть еще один момент: 100 человек, могут говорить, что Петров «отличный водопроводчик» и при этом чесать нос, отводить глаза (по их поведению станет ясно, что они врут). Первое что может прийти нам в голову удалить из рейтинга господина Петрова «забанить» или понизить его положение в рейтинге (пессемизировать, наложить фильтр), но это не правильно! Ведь Петров сам лично ничего плохого не сделал! Вдруг это Вася Пупкин таким хитрым методом решил оклеветать комсомольца и передовика производства товарища Петрова? Другими словами: «не пойман не вор!». Никакие внешние факторы не могут ухудшить положения сайта. Это «заповедь» поисковиков.




Печь Helo RONDO;Отель Regal Hongkong Hotel