О сайте Регистрация Помощь Реклама Все о поиске Правовая инф.








    1. Детальное описание
    поисковой программы
    и примеры поиска
    2. Поиск в интернете, правила
    индексирования страниц

Распределение страниц в поисковом индексе

- 1 -

В большинстве случаев использование поиска не требует специальных знаний. Вам нужно лишь набрать слово или фразу, затем кнопку "Найти". Если вы набираете несколько слов через пробел, таким образом, вы сужаете поиск, уменьшая количество найденных результатов. В этом случае программа ищет страницы, которые содержат все слова из поискового запроса.

Стоп-слова
    Неинформативные слова автоматически исключаются из поиска, например, предлоги "для", "по" и др. Игнорируются слова, состоящие из одной буквы или цифры, исключаются символы, которые не являются служебными, например, знаки препинания. Если внутри слова есть точка, дефис, наклонная черта, знаки препинания или другие значки и символы, такое слово разбивается на две или несколько частей (например, адрес электронной почты или номер телефона). При этом все получившиеся части слова объединяются с помощью логического оператора "И". Например, оба запроса "info@product.ru" или "info product ru" возвращают одинаковый результат.

Логические операторы
    Логическое "И" - наиболее используемый оператор в поисковых запросах. Достаточно набрать два слова через пробел, и программа будет искать страницы, в которых обязательно должны присутствовать оба этих слова.

    Другой полезный логический оператор "ИЛИ". К примеру, "сгущенка" означает то же самое, что и "сгущенное молоко". Мы называем такие слова и словосочетания синонимами. Чтобы не делать два поисковых запроса, в данном случае оба синонима можно объединить в одном запросе с помощью логического "ИЛИ": "сгущенка | сгущенное молоко". Вертикальная черта означает логическое "ИЛИ". (Многие синонимы Product.ru ищет автоматически, в том числе для слова "сгущенка". Об этом более подробно смотрите дальше Поиск, включая синонимы). Другой пример: найти страницы о продаже масла и в Москве, и в Петербурге: "продам масло (Москва | Петербург)".

    Сводная таблица операторов языка запросов


    ОператорДействиеПример
    ПробелЛогический оператор "И".
    Страница должна
    содержать каждое
    слово. Аналогично
    "искать в найденном"
    Сухое молоко
         |Логический оператор "ИЛИ".
    Страница должна
    содержать любое из слов
    мясо | говядина | свинина
         ~Логический оператор "НЕ".
    Страница должна
    содержать первое слово,
    но исключать второе
    мука ~ рыбная
        ( )Скобки группируют слова,
    устанавливая приоритет
    для поиска в первую очередь
    (мясо | говядина | свинина) Москва


    Очередность исполнения операторов

    Слова внутри круглых скобок ищутся в первую очередь. Запрос "продам масло (Москва | Петербург)" указывает программе найти страницы, где встречаются слова "Москва" или "Петербург", затем найти страницы со словами "продам", затем страницы со словами "масло", в итоге, оставляя только совпадающие страницы из результатов трех подзапросов. В данном примере скобки можно раскрыть: "продам масло Москва | продам масло Петербург". Скобки зачастую сокращают длину поискового запроса.

    Следующим по приоритету исполнения следует логическое "И". Например, на запрос "рыбная мука | комбикорм", вы ищете рыбную муку или комбикорм. Для проверки можете сделать запрос со скобками "(рыбная мука) | комбикорм". По сравнению с предыдущим запросом ничего не изменится, т.к. логический оператор "И" уже имеет приоритет перед "ИЛИ", поэтому в данном случае скобки не обязательны.
Морфология
    Product.ru находит все формы слова и множественного, и единственного числа по правилам русского языка (поиск с учетом морфологии). Например, на запрос "рыба", результатом будут слова: "рыбы", "рыб", "рыбой" и т.д. Результат поиска не зависит от того, какую форму слова задавать. Словарь поисковой программы содержит формы некоторых собственных имен: названия больших городов, распространенные фамилии.
Словообразование
    Словарь поисковой программы, несмотря на значительную величину - около 90 тысяч слов и более миллиона словоформ, не может содержать все слова русского языка. Когда поисковое слово в словаре не найдено, включается функция, которая подбирает формы по аналогиям с другими словами. Наилучшим образом функция работает для длинных слов, более семи букв, имеющих в своем составе окончания и суффиксы. Короткие слова кроме нераспространенных собственных имен почти всегда уже присутствуют в словаре.
Регистр букв
    Не имеет значения, какие буквы используются, строчные или прописные. Например: Москва, МОСКВА, мосКВА, мОсКвА.
Производительность поиска
    Длина запроса в поисковом окне ограничена 300 символами. Запрос может состоять из многих слов с различными комбинациями логических операторов. За счет подключения словаря синонимов количество слов в запросе может достигать многих десятков (например, к слову "рыба" присоединяются 104 синонима). Максимальное количество слов в поисковом запросе не может превышать 250.
Поиск, включая синонимы
    С помощью этой функции программа подбирает синонимы к словам в поисковом запросе, обеспечивая больше найденных результатов. Например, слова "зерно", "зерновые" оцениваются как равнозначные синонимы. Если использовать при поиске любое из этих слов, другое подставляется в поисковый запрос автоматически через логическое "ИЛИ".

    Пример: "куплю сухое молоко", строка запроса после автоматического добавления синонимов: "(куплю | покупка | приобретать | заинтересован приобретение | заинтересован поставка | покупать | закупать | закуп | закупка | ищем поставщиков | ищем продавцов) (сухое молоко | СОМ | СЦМ | ЦСМ)".

    Функция автоматического поиска синонимов может быть отключена
- 2 -

Поиск в интернете
    Product.ru ищет информацию не только внутри собственных страниц, но и на всех страницах других сайтов, которые зарегистрированы в каталоге компаний.
Представление результатов поиска, найденных в интернете


Представление результатов поиска, найденных в интернете

1.
Область вывода результатов поиска страниц сайта, зарегистрированного в каталоге компаний. Выводится часть текста страницы с найденными на ней поисковыми словами, которые выделены жирным шрифтом. Страница может содержать больше слов, чем показано в результатах поиска. При выводе захватываются первые два предложения с найденными словами. Если найдено две или больше страниц на одном и том же сайте, в результатах поиска выводится страница, содержащая наибольшее количество поисковых слов.

2.
Гипер-ссылка на найденную страницу.

3.
Количество найденных страниц на сайте по текущему поисковому запросу.

4.
Просмотр всех найденных страниц по текущему поисковому запросу на этом сайте.

5.
Название зарегистрированной в каталоге компаний фирмы и переход на страницу с анкетными данными.


Правила индексирования интернет-страниц (информация для владельцев сайтов или веб-мастеров)
    Поисковый робот обходит все сайты, зарегистрированные в каталоге компаний, обновляя, таким образом, уже проиндексированные страницы или добавляя новые страницы. Обход осуществляется примерно один раз в две недели. Если фирма только зарегистрирована в каталоге компаний, ее сайт добавляется в поисковый индекс в течение 2 дней.

    Правила индексирования страниц

  • Индексируются только сайты, зарегистрированные в каталоге компаний.


  • Поисковый робот сканирует сайты всех доменов, но игнорирует страницы на языках, отличных от русского.


  • Product.ru не умеет извлекать тексты из объектов Macromedia Flash.


  • Содержание мета-тегов и тега <title> в поиске не участвует.


  • Не сканируются комментарии в текстах (тег <!--).


  • Поисковый робот понимает фреймы как отдельные страницы.


  • За главную принимается страница, указанная в регистрации. Поисковый робот обходит все ссылки в указанном диапазоне, не опускаясь ниже заданного уровня. Например, www.domain.ru/katalog/ - будут проиндексированы все страницы, включая default, и все подкаталоги, следующие после katalog/


    © 1999-2010 ООО "ИнтернетБизнесМедиа" +7 (495) 234-46-53 (тел./факс) Фокина Марина - info1@product.ru